如何使用 OpenClaw 制作免费的对口型视频:分步指南
你是否正在寻找无需高昂成本即可创建逼真数字人和对口型视频的方法?开源自治 AI 智能体框架 OpenClaw 通过其强大的生态系统让这一切成为现实。借助 ClawHub 上提供的 Flyworks Avatar Video 技能,你可以将静态照片转化为会说话的视频,甚至可以完全免费克隆你的声音!
在本教程中,我们将引导你完成设置并利用 OpenClaw 创建精美对口型视频的整个过程。
理解工作原理
创建一个对口型(Lip-Sync)视频主要需要三个关键组件:一个 AI 智能体(OpenClaw)、一个数字人/视频生成技能,以及你的创意。

Flyworks Avatar Video 技能直接为你的智能体带来了强大的自动化能力:
- 让照片说话 (Talking Photos):瞬间将任何一张静态图像变成视频。
- 公共数字人 (Public Avatars):利用高度逼真的预制数字人和先进的文本转语音 (TTS) 技术。
- 声音克隆 (Voice Cloning):通过一段简短的音频样本克隆任何特定的声音。
让我们开始设置吧!
第一步:安装技能
首先,你需要将 Flyworks Avatar Video 技能安装到你的智能体环境中。ClawHub 提供的 skills CLI 让这一切变得异常简单。

打开终端并运行以下命令来添加技能:
# 全局安装
npx skills add Flyworks-AI/skills -g
注意:你可以将此技能与 Claude Code, Cursor, Codex 及其他支持的 AI 智能体结合使用。
接下来,安装与视频生成 API 交互所需的 Python 依赖:
pip install -r requirements.txt
使用测试令牌体验
默认情况下,该技能附带一个免费层的测试令牌 (Demo Token)。请注意,测试令牌生成的视频会有水印,且最大时长限制为 30 秒。想移除这些限制?你可以在 flyworks.ai/setting 注册获取专属的 API 密钥,并通过环境变量 export HIFLY_API_TOKEN="your_token_here" 进行配置。
第二步:创建会说话的照片
“让照片说话”的功能是魔法发生的地方!你可以拍一张自己或某个角色的静态照片,并提供一段录音或一段文字。AI 会分析这张图像,并精准生成口型动画以完美匹配音频。

你可以直接使用自然语言提示词让 OpenClaw 执行:
"用我的照片生成一个会说话的视频,说出 '欢迎使用我们的服务'"
或者如果你想直接使用提供的客户端脚本:
# 准备视频用的基础 Avatar
python scripts/hifly_client.py create_talking_photo \
--image assets/my_photo.png \
--title "My Avatar"
这个命令会返回给你一个自定义的 Avatar ID,你可以将它保存并在未来的视频中重复使用!
第三步:为数字人赋予声音
口型视频的灵魂在于背后的声音!虽然技能开箱即用提供了大量优秀的公共 TTS 声音(可以用 list_public_voices 查看),但你可能想要一些真正独一无二的东西——比如你自己的声音。
克隆专属声音

你只需提供一段音频样本即可克隆声音。再次向你的智能体发出指令:
"从这个音频文件中克隆我的声音,并使用我自定义的数字人生成一段问候视频。"
在底层,这执行了以下克隆流程:
python scripts/hifly_client.py clone_voice \
--audio assets/my_voice_sample.MP3 \
--title "My Cloned Voice"
第四步:生成最终的对口型视频
既然你现在拥有了数字人(即你的“照片”)和定制声音,只需把它们组合起来即可!
运行最终的生成命令,传入你的文本、自定义 Avatar ID 以及你的声音 ID:
python scripts/hifly_client.py create_video \
--type tts \
--text "大家好!这整个对口型视频都是使用 OpenClaw 和 Flyworks Avatar Video 技能免费生成的。很酷吧?" \
--avatar my_custom_avatar_id \
--voice my_cloned_voice_id
脚本将在后台自动编排和管理视频生成的各个任务环节。稍等片刻,完美的唇形同步动画 MP4 视频就生成成功了!
结语
创作令人惊艳的高质量拟真数字人从未如此简单。通过将 OpenClaw AI 智能体框架与出色的免费技能(Flyworks Avatar Video skill)相连,开发者和创作者们现在可以轻松实现自动化视频内容生产。
去 ClawHub 技能中心 探索更多,看看你还能解锁怎样不可思议的能力!
