TopRank Skills

Home / Claw Skills / Git / GitHub / pdf-parser
Official OpenClaw rules 36%

pdf-parser

使用 MinerU API 解析 PDF 文件(会将你指定的文件上传到 https://mineru.net 进行解析)。

Stars

0

Installs

0

Status

ACTIVE

Visibility

PUBLIC

安装方式

直接复制以下提示词,发送给你的 AI 助手即可完成安装。

请先检查是否已安装 SkillHub 商店,若未安装,请根据 https://skillhub-1388575217.cos.ap-guangzhou.myqcloud.com/install/skillhub.md 安装 SkillHub 商店,然后安装 pdf-parser 技能。 若已安装,则直接安装 pdf-parser 技能。

Overview

Skill Key
alex-zxyz/mineru-pdf-parser
Author
alex-zxyz
Source Repo
openclaw/skills
Version
-
Source Path
skills/alex-zxyz/mineru-pdf-parser
Latest Commit SHA
8253e7b4aa7d776d99d2447742c1fbaab9022a44

Extracted Content

SKILL.md excerpt

# PDF Parser Skill

基于 [MinerU](https://github.com/opendatalab/MinerU) 提供 PDF 解析能力。

## 功能

- **PDF 解析**: 将 PDF 转换为 Markdown 格式
- **公式识别**: 支持 LaTeX 公式提取
- **表格识别**: 自动识别并转换表格结构
- **OCR**: 支持图片型 PDF 文字识别
- **多语言**: 支持中文、英文,日文、韩文等

## ⚠️ 安装前必读

**使用本技能即表示:**
1. 你愿意提供你的 MinerU API Token (`MINERU_TOKEN`)
2. Token 会被发送给 https://mineru.net/
3. 确认 MinerU 服务可信,接受其隐私政策
4. 已在本地源码中确认无额外意外行为

## 前提条件

### 1. 安装依赖

```bash
pip install requests
```

### 2. 获取 MinerU Token

访问 <https://mineru.net/> 注册并获取 API Token。

### 3. 设置环境变量

**Windows (PowerShell):**
```powershell
$env:MINERU_TOKEN = "your-token-here"
```

**macOS / Linux:**
```bash
export MINERU_TOKEN=your-token-here
```

## 支持的引擎

| 引擎 | 说明 |
|------|------|
| vlm | VLM 引擎(默认) |
| pipeline | 管道引擎 |
| MinerU-HTML | HTML 输出 |

## 快速开始

```bash
# 解析 PDF (默认 vlm 引擎)
python scripts/mineru_api.py -f <pdf路径> --wait

# 指定引擎
python scripts/mineru_api.py -f <pdf路径> --engine pipeline --wait
```

## 选项

| 参数 | 说明 | 默认值 |
|------|------|--------|
| -f, --files | 本地 PDF 文件 | - |
| --engine | 解析引擎 | vlm |
| --lang | 语言 (ch/en/ja/ko) | ch |
| --wait | 等待解析完成 | 否 |

## 环境变量

| 变量 | 必填 | 说明 |
|------|------|------|
| MINERU_TOKEN | 是 | MinerU API Token |

## 输出

解析结果保存在 `~/.openclaw/MinerU_Results/` 目录下。

## 工作流

1. 设置 `MINERU_TOKEN` 环境变量
2. 执行解析命令
3. 等待解析完成
4. 读取 full.md 分析内容
5. 根据内容重命名目录

Related Claw Skills

heyixuan2

bambu-studio-ai

★ 41

Bambu Lab 3D printer control and automation. Activate when user mentions: printer status, 3D printing, slice, analyze model, generate 3D, AMS filament, print monitor, Bambu Lab, or any 3D printing task. Full pipeline: search → generate → analyze → colorize → preview → open BS → user slice → print → monitor. Supports all 9 Bambu Lab printers (A1 Mini, A1, P1S, P2S, X1C, X1E, H2C, H2S, H2D).

edholofy

dojo.md

★ 4

University for AI agents. 92 courses, 4400+ scenarios, any model via OpenRouter. Auto-training loops generate per-model SKILL.md documents. Works with Claude Code, OpenClaw, Cursor, Windsurf. No fine-tuning required.

openstockdata

stock-data-skill

★ 4

OpenClaw Skill for stock data analysis

lethehades

wps-macos-helper

★ 1

macOS WPS Office workflow helper skill for safer document preparation, conversion, export, and compatibility guidance

capt-marbles

geo-optimization

★ 1

Generative Engine Optimization (GEO) for AI search visibility. Optimize content to appear in ChatGPT, Perplexity, Claude, and Google AI Overviews. Use when optimizing websites, pages, or content for LLM discoverability and citation.

cclank

news-aggregator-skill

★ 0

Comprehensive news aggregator that fetches, filters, and deeply analyzes real-time content from 8 major sources: Hacker News, GitHub Trending, Product Hunt, 36Kr, Tencent News, WallStreetCN, V2EX, and Weibo. Best for 'daily scans', 'tech news briefings', 'finance updates', and 'deep interpretations' of hot topics.