Overview
- Skill Key
- annoyingc/captcha-auto
- Author
- annoyingc
- Source Repo
- openclaw/skills
- Version
- -
- Source Path
- skills/annoyingc/captcha-auto
- Latest Commit SHA
- 82610a1688a617d6b6d6c17f5beb4186802520c5
智能验证码自动识别 Skill - 混合模式(本地 Tesseract OCR + 阿里云千问 3 VL Plus)。支持两阶段输入框查找、安全隐私警告。用于网页自动化中的验证码识别、填写和提交。
Stars
0
Installs
0
Status
ACTIVE
Visibility
PUBLIC
直接复制以下提示词,发送给你的 AI 助手即可完成安装。
请先检查是否已安装 SkillHub 商店,若未安装,请根据 https://skillhub-1388575217.cos.ap-guangzhou.myqcloud.com/install/skillhub.md 安装 SkillHub 商店,然后安装 captcha-auto 技能。 若已安装,则直接安装 captcha-auto 技能。
# Captcha Auto Skill - 混合模式 v1.0.7 利用 **本地 OCR + 视觉大模型降级** 智能识别网页验证码,平衡成本与准确率。 **实测成功率:6/6 (100%)** - 已在多个真实网站验证(国家统计局、Telerik、Digivarsity 等) --- ## ⚠️ 重要:安装路径说明 ** Clawhub 默认安装到当前工作目录的 `./skills` 子目录!** ### ✅ 正确的安装方式 ```bash # 方式 1:进入 workspace 目录安装(推荐) cd ~/.openclaw/workspace clawhub install captcha-auto # 方式 2:使用 --workdir 参数(任何目录都可以) clawhub install captcha-auto --workdir ~/.openclaw/workspace # 方式 3:设置环境变量(永久生效) export CLAWHUB_WORKDIR=~/.openclaw/workspace clawhub install captcha-auto ``` ### ❌ 错误的安装方式 ```bash # 不要在 home 目录直接运行! cd ~ clawhub install captcha-auto # 会安装到 ~/skills/captcha-auto ❌ ``` ### 验证安装位置 ```bash # 正确位置 ls -la ~/.openclaw/workspace/skills/captcha-auto/ # 如果装错了(在 ~/skills/),删除并重新安装 rm -rf ~/skills/captcha-auto cd ~/.openclaw/workspace clawhub install captcha-auto ``` --- --- ## ⚠️ 安全与隐私警告 **安装前请仔细阅读:** ### 🔒 1. 截图会发送到第三方 API - 本技能会截取**网页全屏截图**并发送到阿里云 DashScope API - ❌ **不要**在包含密码、银行卡、个人信息的页面使用 - ✅ **仅**在验证码页面使用 - 📸 截图仅用于 API 识别,不会存储或上传到其他服务 ### 🔑 2. 必需配置 API Key - 环境变量:`VISION_API_KEY` - 或配置文件:`~/.openclaw/openclaw.json` - 或命令行参数:`--api-key` - ✅ **无硬编码凭证** - API Key 完全由用户控制 ### 🌐 3. 需要 Chrome 浏览器 - 系统必须安装 Google Chrome 或 Chromium - 支持 macOS、Linux、Windows --- ## ⚠️ 必需配置 ### 视觉模型 API(降级方案必需) **本 Skill 需要阿里云千问 3 VL Plus API Key**,用于当本地 OCR 失败时的降级识别。 **推荐配置(阿里云千问 3 VL Plus):** ```bash export VISION_API_KEY="sk-your-api-key" export VISION_BASE_URL="https://dashscope.aliyuncs.com/compatible-mode/v1" export VISION_MODEL="qwen3-vl-plus" ``` **说明**: - `qwen3-vl-plus` 是阿里云千问 3 视觉模型,国产性价比最高的视觉模型 - Base URL 使用阿里云...
openbotx
An open-source platform for orchestrating AI agents — secure, simple, and built for everyone. Multi-agent, real-time task board, web control panel, skills system, browser automation, multi-provider, scheduler, and more. One command to start. Everything from the browser. No coding required.
sealiu1997
OpenClaw skill for 知识星球 / ZSXQ digests with token-first auth and browser recovery.
abczsl520
🌐 OpenClaw skill for Browser-Use — AI-powered browser automation for complex multi-step workflows (login, form filling, scraping, posting)
chizhongwang
Teach AI agents to discover hidden APIs, data functions & browser automation recipes for any website. Works with Claude Code, ClawHub, Cursor & any AgentSkills-compatible agent.
ashemag
OpenClaw skill to crosspost X/Twitter posts to Reddit via browser automation
canbirlik
A visual, human-like web browser for OpenClaw agents.Supports reading,screenshots, and visible mode.