TopRank Skills

Home / Claw Skills / Git / GitHub / pdf-parser
Official OpenClaw rules 36%

pdf-parser

使用 MinerU API 解析 PDF 文件(会将你指定的文件上传到 https://mineru.net 进行解析)。

Stars

0

Installs

0

Status

ACTIVE

Visibility

PUBLIC

安装方式

直接复制以下提示词,发送给你的 AI 助手即可完成安装。

请先检查是否已安装 SkillHub 商店,若未安装,请根据 https://skillhub-1388575217.cos.ap-guangzhou.myqcloud.com/install/skillhub.md 安装 SkillHub 商店,然后安装 pdf-parser 技能。 若已安装,则直接安装 pdf-parser 技能。

Overview

Skill Key
alex-zxyz/mineru-pdf-parser
Author
alex-zxyz
Source Repo
openclaw/skills
Version
-
Source Path
skills/alex-zxyz/mineru-pdf-parser
Latest Commit SHA
8253e7b4aa7d776d99d2447742c1fbaab9022a44

Extracted Content

SKILL.md excerpt

# PDF Parser Skill

基于 [MinerU](https://github.com/opendatalab/MinerU) 提供 PDF 解析能力。

## 功能

- **PDF 解析**: 将 PDF 转换为 Markdown 格式
- **公式识别**: 支持 LaTeX 公式提取
- **表格识别**: 自动识别并转换表格结构
- **OCR**: 支持图片型 PDF 文字识别
- **多语言**: 支持中文、英文,日文、韩文等

## ⚠️ 安装前必读

**使用本技能即表示:**
1. 你愿意提供你的 MinerU API Token (`MINERU_TOKEN`)
2. Token 会被发送给 https://mineru.net/
3. 确认 MinerU 服务可信,接受其隐私政策
4. 已在本地源码中确认无额外意外行为

## 前提条件

### 1. 安装依赖

```bash
pip install requests
```

### 2. 获取 MinerU Token

访问 <https://mineru.net/> 注册并获取 API Token。

### 3. 设置环境变量

**Windows (PowerShell):**
```powershell
$env:MINERU_TOKEN = "your-token-here"
```

**macOS / Linux:**
```bash
export MINERU_TOKEN=your-token-here
```

## 支持的引擎

| 引擎 | 说明 |
|------|------|
| vlm | VLM 引擎(默认) |
| pipeline | 管道引擎 |
| MinerU-HTML | HTML 输出 |

## 快速开始

```bash
# 解析 PDF (默认 vlm 引擎)
python scripts/mineru_api.py -f <pdf路径> --wait

# 指定引擎
python scripts/mineru_api.py -f <pdf路径> --engine pipeline --wait
```

## 选项

| 参数 | 说明 | 默认值 |
|------|------|--------|
| -f, --files | 本地 PDF 文件 | - |
| --engine | 解析引擎 | vlm |
| --lang | 语言 (ch/en/ja/ko) | ch |
| --wait | 等待解析完成 | 否 |

## 环境变量

| 变量 | 必填 | 说明 |
|------|------|------|
| MINERU_TOKEN | 是 | MinerU API Token |

## 输出

解析结果保存在 `~/.openclaw/MinerU_Results/` 目录下。

## 工作流

1. 设置 `MINERU_TOKEN` 环境变量
2. 执行解析命令
3. 等待解析完成
4. 读取 full.md 分析内容
5. 根据内容重命名目录

Related Claw Skills