📖 VideoRetalk 使用指南

📋 快速导航

快速开始
安装和启动
基本操作
功能详解
常见问题
故障排除

⚡ 快速开始

只需三步，快速上手 VideoRetalk：

1 启动应用 — 双击 VideoRetalk.exe

2 上传视频 — 选择要编辑的视频文件

3 输入台词 — 输入文案并选择音色，点击生成

💻 安装和启动

系统要求

操作系统：win7 或更高版本
处理器：Intel
内存：2GB 或以上
磁盘空间：至少 5GB 可用空间
网络：需要网络连接（用于 API 调用）

启动应用

找到 VideoRetalk.exe
双击启动

💡 提示：首次启动可能需要 30-60 秒，请耐心等待。

🎯 基本操作

1. 设置 OSS存储和 API 密钥

打开应用 → 进入 设置页面
找到 OSS 配置 部分
输入你的 OSS信息
点击保存

🔑 获取 oss信息

访问阿里云AccessKey
注册账号并创建 AccessKey ID 和 AccessKey Secret
复制 KeyID和Key Secret 到应用设置中
访问阿里云OSS控制台
创建 bucket （名称自定义，地域选择北京，公共读写权限：公共读）
输入名称和 oss-cn-beijing（如不是北京，填写对应地域）到配置中

打开应用 → 进入 设置页面
找到 API 配置 部分
输入你的 百炼 API Key
点击保存

🔑 获取 API Key

访问阿里云百炼
注册账号并创建 API Key
复制 Key 到应用设置中

2. 上传视频

点击 上传视频 按钮
选择要编辑的视频文件
支持格式：MP4、MOV、AVI、MKV 等
文件大小：建议不超过 500MB

3. 输入台词

在文本框中输入你想让视频人物说的话
支持中文、英文等多种语言
可以输入多段台词（用换行符分隔）

4. 选择音色

点击 音色选择 下拉菜单，选择合适的音色：

🎤 标准男声
🎤 标准女声
🎤 温柔女声
🎤 磁性男声
🎤 自定义音色

5. 生成视频

点击 生成视频 按钮
应用开始处理（进度条显示进度）
处理时间取决于视频长度和系统性能
完成后，点击下载保存视频

✨ 功能详解

🎤 AI 语音合成

使用阿里云百炼 TTS 技术，支持多种音色和语言，生成自然流畅的语音。

支持多种音色
支持多种语言
自然流畅的语音质量

👄 对口型生成

自动分析视频中人物的嘴型，匹配语音内容，生成自然同步的对口型视频。

自动识别人脸
提取嘴型特征
根据语音调整嘴型

🎨 音色克隆

支持音色克隆功能，用特定人物的声音进行语音合成，保留原有的音色特征。

上传参考音频（3-10 秒）
输入要合成的文案
系统自动克隆音色
生成带有克隆音色的语音

🔒 本地隐私

所有用户数据存储在本地，不上传到第三方服务器，完全保护用户隐私。

❓ 常见问题

Q1: 应用启动很慢怎么办？

A: 首次启动需要初始化，可能需要 30-60 秒。如果持续缓慢：

检查网络连接
重启应用
检查系统资源（CPU、内存）

Q2: 生成视频失败怎么办？

A: 可能的原因：

❌ API Key 配置错误 → 检查设置中的 API Key
❌ 网络连接问题 → 检查网络
❌ 视频格式不支持 → 转换为 MP4 格式
❌ 视频文件损坏 → 尝试其他视频

Q3: 如何关闭应用？

A: 三种方式：

Dock：右键 VideoRetalk → 退出
Activity Monitor：搜索 VideoRetalk → 强制退出
命令行：killall -9 VideoRetalk

Q4: 生成的视频在哪里？

A: 生成的视频保存在：

~/VideoRetalk/downloads/

Q5: 支持哪些视频格式？

A: 支持的格式：

✅ MP4（推荐）
✅ MOV
✅ AVI
✅ MKV
✅ WebM

🔧 故障排除

问题 1: "API Key 无效"

解决方案：

检查 API Key 是否正确复制
确认 API Key 未过期
检查网络连接
重新输入 API Key

问题 2: "无法识别人脸"

解决方案：

确保视频中有清晰的人脸
人脸应该面向摄像头
光线要充足
尝试其他视频

问题 3: "对口型不同步"

解决方案：

检查音频质量
确保文案与音频匹配
尝试调整音色
重新生成视频

问题 4: "应用崩溃"

解决方案：

重启应用
检查系统资源
更新 macOS
重新安装应用

问题 5: "生成速度很慢"

解决方案：

检查网络连接
关闭其他应用释放资源
使用更小的视频文件
检查 CPU 和内存使用情况

💡 需要帮助？扫描官网的微信二维码联系客服。

📖 VideoRetalk 使用指南

📋 快速导航

⚡ 快速开始

💻 安装和启动

系统要求

启动应用

🎯 基本操作

1. 设置 OSS存储 和 API 密钥

🔑 获取 oss信息

🔑 获取 API Key

2. 上传视频

3. 输入台词

4. 选择音色

5. 生成视频

✨ 功能详解

🎤 AI 语音合成

👄 对口型生成

🎨 音色克隆

🔒 本地隐私

❓ 常见问题

Q1: 应用启动很慢怎么办？

Q2: 生成视频失败怎么办？

Q3: 如何关闭应用？

Q4: 生成的视频在哪里？

Q5: 支持哪些视频格式？

🔧 故障排除

问题 1: "API Key 无效"

问题 2: "无法识别人脸"

问题 3: "对口型不同步"

问题 4: "应用崩溃"

问题 5: "生成速度很慢"

1. 设置 OSS存储和 API 密钥