minimax-vision-captcha

使用MiniMax视觉模型识别图片中的验证码、滑块位置、文字内容等。适用于需要AI视觉分析的场景，如微信验证码识别、网页截图分析、图片文字提取。当需要识别图片内容、分析验证码、提取截图信息时使用此技能。

View Source SKILL.md

Stars

Installs

Status

ACTIVE

Visibility

PUBLIC

安装方式

直接复制以下提示词，发送给你的 AI 助手即可完成安装。

请先检查是否已安装 SkillHub 商店，若未安装，请根据 https://skillhub-1388575217.cos.ap-guangzhou.myqcloud.com/install/skillhub.md 安装 SkillHub 商店，然后安装 minimax-vision-captcha 技能。若已安装，则直接安装 minimax-vision-captcha 技能。

Overview

Skill Key: financier-nuri/minimax-vision-captcha
Author: financier-nuri
Source Repo: openclaw/skills
Version: -
Source Path: skills/financier-nuri/minimax-vision-captcha
Latest Commit SHA: 5b3252159a282252b02d289580fe723f791c876b

Extracted Content

SKILL.md excerpt

# MiniMax Vision Captcha Skill

使用MiniMax MCP的视觉理解能力识别图片中的内容，解决验证码、滑块分析等问题。

## 快速开始

### 1. 截图

使用OpenClaw浏览器截图：

```bash
browser action=screenshot targetId=<页面ID>
```

或使用OpenClaw的snapshot获取页面结构后分析。

### 2. 调用MiniMax视觉识别

```bash
mcporter call minimax-coding-plan.understand_image prompt="描述图片内容" image_source="/path/to/screenshot.png"
```

### 3. 分析结果

根据返回结果进行下一步操作。

## 典型使用场景

### 场景1：微信滑块验证码

1. 访问微信页面，触发验证码
2. 截图：`browser action=screenshot`
3. 发送给视觉模型分析
4. 获取滑块位置描述

### 场景2：图片文字识别

1. 截图或获取图片路径
2. 调用视觉模型识别文字
3. 返回文字内容

### 场景3：网页元素分析

1. 使用snapshot获取页面结构
2. 分析特定元素的可见内容和属性

## 注意事项

- 确保MiniMax MCP已配置
- 图片路径需要是服务器可访问的绝对路径
- 滑块验证码需要描述缺口位置（左侧/右侧/距离）

## 依赖

- minimax-coding-plan MCP
- OpenClaw浏览器工具

Related Claw Skills

capt-marbles

Task Router Skill

★ 0

Task Router

capncoconut

x402hub

★ 0

Register, communicate, and earn on the x402hub AI agent marketplace. Use when an agent needs to register on x402hub, browse or claim bounties, submit deliverables, send messages to other agents via x402 Relay, check marketplace stats, or manage agent credentials. Triggers on x402hub, agent marketplace, bounty, relay messaging, agent-to-agent communication, or USDC earning.

capevace

claw

★ 0

Real-time event bus for AI agents. Publish, subscribe, and share live signals across a network of agents with Unix-style simplicity.

captchasco

captchas-openclaw

★ 0

OpenClaw integration guidance for CAPTCHAS Agent API, including OpenResponses tool schemas and plugin tool registration.

carol-gutianle

Modelready

★ 0

name: modelready description: Start using a local or Hugging Face model instantly, directly from chat. metadata: {"openclaw":{"requires":{"bins": "bash", "curl" }, "env": "URL" }}

canbirlik

wiz-light-control

★ 0

Controls Wiz smart bulbs (turn on/off, RGB colors, disco mode) via local WiFi.