Overview
- Skill Key
- hexiaochun/omnihuman-video
- Author
- hexiaochun
- Source Repo
- openclaw/skills
- Version
- -
- Source Path
- skills/hexiaochun/omnihuman-video
- Latest Commit SHA
- f2cd4b0deddb27c1b1e722289364f89cd45a15d1
使用 OmniHuman v1.5 生成音频驱动的口型同步视频。当用户想要让图片中的人物说话、配音、口型同步,或提到 omnihuman 时使用此 skill。
Stars
0
Installs
0
Status
ACTIVE
Visibility
PUBLIC
直接复制以下提示词,发送给你的 AI 助手即可完成安装。
请先检查是否已安装 SkillHub 商店,若未安装,请根据 https://skillhub-1388575217.cos.ap-guangzhou.myqcloud.com/install/skillhub.md 安装 SkillHub 商店,然后安装 omnihuman-video 技能。 若已安装,则直接安装 omnihuman-video 技能。
# OmniHuman v1.5 音频驱动视频
字节跳动 OmniHuman v1.5 是一款音频驱动的视频生成模型。输入一张人物图片和一段音频,即可生成口型同步、表情生动的高质量视频。角色的情感和动作与音频高度关联。
## 可用模型
| 模型 ID | 功能 | 说明 |
|--------|------|------|
| `fal-ai/bytedance/omnihuman/v1.5` | 图片+音频→视频 | 口型同步、表情驱动,$0.16/秒 |
## 工作流
### 1. 调用 submit_task
使用 MCP 工具 `submit_task` 提交任务:
```json
{
"model_id": "fal-ai/bytedance/omnihuman/v1.5",
"parameters": {
"image_url": "人物图片URL",
"audio_url": "音频文件URL"
}
}
```
### 参数说明
| 参数 | 类型 | 必填 | 默认值 | 说明 |
|-----|------|-----|-------|------|
| image_url | string | **是** | - | 人物图片 URL,需要清晰的人物形象 |
| audio_url | string | **是** | - | 音频文件 URL(mp3/wav/m4a/ogg/aac) |
| prompt | string | 否 | - | 文本提示词,引导视频生成风格 |
| resolution | string | 否 | "1080p" | 视频分辨率:720p 或 1080p |
| turbo_mode | boolean | 否 | false | 加速模式,更快但画质略降 |
### 分辨率限制
| 分辨率 | 最大音频时长 | 说明 |
|-------|------------|------|
| 1080p | 30 秒 | 高清画质,时长受限 |
| 720p | 60 秒 | 画质高且生成更快,支持更长音频 |
## 查询任务状态
提交任务后会返回 `task_id`,使用 `get_task` 查询结果:
```json
{
"task_id": "返回的任务ID"
}
```
任务状态:
- `pending` - 排队中
- `processing` - 处理中
- `completed` - 完成,结果在 `result` 中
- `failed` - 失败,查看 `error` 字段
## 完整示例
### 示例 1:基础用法(人物说话)
**用户请求**:让这张图片里的人说这段话
**执行步骤**:
1. 先用 TTS 生成音频(可选,如果用户没有提供音频)
2. 调用 `submit_task`:
```json
{
"model_id": "fal-ai/bytedance/omnihuman/v1.5",
"parameters": {
"image_url": "https://storage.googleapis.com/falserverless/example_inputs/omnihuman_v15_input_image.png",
"audio_url": "https://storage.googleapis.com/falserverless/example_inputs/omnihuman_v15_input_audio.mp3",
"resolution": "1080p"
}
}
```
3. 获取 `task_id` 后调用 `get_task` 查询结果
### 示例 2:使用加速模式
`...
capt-marbles
Task Router
capncoconut
Register, communicate, and earn on the x402hub AI agent marketplace. Use when an agent needs to register on x402hub, browse or claim bounties, submit deliverables, send messages to other agents via x402 Relay, check marketplace stats, or manage agent credentials. Triggers on x402hub, agent marketplace, bounty, relay messaging, agent-to-agent communication, or USDC earning.
capevace
Real-time event bus for AI agents. Publish, subscribe, and share live signals across a network of agents with Unix-style simplicity.
captchasco
OpenClaw integration guidance for CAPTCHAS Agent API, including OpenResponses tool schemas and plugin tool registration.
carol-gutianle
name: modelready description: Start using a local or Hugging Face model instantly, directly from chat. metadata: {"openclaw":{"requires":{"bins": "bash", "curl" }, "env": "URL" }}
canbirlik
Controls Wiz smart bulbs (turn on/off, RGB colors, disco mode) via local WiFi.