← 返回首页

📖 VideoRetalk 使用指南

⚡ 快速开始

只需三步,快速上手 VideoRetalk:

1 启动应用 — 双击 VideoRetalk.exe
2 上传视频 — 选择要编辑的视频文件
3 输入台词 — 输入文案并选择音色,点击生成

💻 安装和启动

系统要求

启动应用

  1. 找到 VideoRetalk.exe
  2. 双击启动
💡 提示:首次启动可能需要 30-60 秒,请耐心等待。

🎯 基本操作

1. 设置 OSS存储 和 API 密钥

  1. 打开应用 → 进入 设置页面
  2. 找到 OSS 配置 部分
  3. 输入你的 OSS信息
  4. 点击 保存

🔑 获取 oss信息

  • 访问 阿里云AccessKey
  • 注册账号并创建 AccessKey ID 和 AccessKey Secret
  • 复制 KeyID和Key Secret 到应用设置中
  • 访问 阿里云OSS控制台
  • 创建 bucket (名称自定义,地域选择北京,公共读写权限:公共读)
  • 输入名称 和 oss-cn-beijing(如不是北京,填写对应地域)到配置中
  1. 打开应用 → 进入 设置页面
  2. 找到 API 配置 部分
  3. 输入你的 百炼 API Key
  4. 点击 保存

🔑 获取 API Key

  • 访问 阿里云百炼
  • 注册账号并创建 API Key
  • 复制 Key 到应用设置中

2. 上传视频

  1. 点击 上传视频 按钮
  2. 选择要编辑的视频文件
  3. 支持格式:MP4、MOV、AVI、MKV 等
  4. 文件大小:建议不超过 500MB

3. 输入台词

  1. 在文本框中输入你想让视频人物说的话
  2. 支持中文、英文等多种语言
  3. 可以输入多段台词(用换行符分隔)

4. 选择音色

点击 音色选择 下拉菜单,选择合适的音色:

5. 生成视频

  1. 点击 生成视频 按钮
  2. 应用开始处理(进度条显示进度)
  3. 处理时间取决于视频长度和系统性能
  4. 完成后,点击 下载 保存视频

✨ 功能详解

🎤 AI 语音合成

使用阿里云百炼 TTS 技术,支持多种音色和语言,生成自然流畅的语音。

👄 对口型生成

自动分析视频中人物的嘴型,匹配语音内容,生成自然同步的对口型视频。

🎨 音色克隆

支持音色克隆功能,用特定人物的声音进行语音合成,保留原有的音色特征。

  1. 上传参考音频(3-10 秒)
  2. 输入要合成的文案
  3. 系统自动克隆音色
  4. 生成带有克隆音色的语音

🔒 本地隐私

所有用户数据存储在本地,不上传到第三方服务器,完全保护用户隐私。

❓ 常见问题

Q1: 应用启动很慢怎么办?

A: 首次启动需要初始化,可能需要 30-60 秒。如果持续缓慢:

Q2: 生成视频失败怎么办?

A: 可能的原因:

Q3: 如何关闭应用?

A: 三种方式:

Q4: 生成的视频在哪里?

A: 生成的视频保存在:

~/VideoRetalk/downloads/

Q5: 支持哪些视频格式?

A: 支持的格式:

🔧 故障排除

问题 1: "API Key 无效"

解决方案:

  1. 检查 API Key 是否正确复制
  2. 确认 API Key 未过期
  3. 检查网络连接
  4. 重新输入 API Key

问题 2: "无法识别人脸"

解决方案:

  1. 确保视频中有清晰的人脸
  2. 人脸应该面向摄像头
  3. 光线要充足
  4. 尝试其他视频

问题 3: "对口型不同步"

解决方案:

  1. 检查音频质量
  2. 确保文案与音频匹配
  3. 尝试调整音色
  4. 重新生成视频

问题 4: "应用崩溃"

解决方案:

  1. 重启应用
  2. 检查系统资源
  3. 更新 macOS
  4. 重新安装应用

问题 5: "生成速度很慢"

解决方案:

  1. 检查网络连接
  2. 关闭其他应用释放资源
  3. 使用更小的视频文件
  4. 检查 CPU 和内存使用情况
💡 需要帮助?扫描官网的微信二维码联系客服。