Voicebox

已跟踪

开源 AI 语音工作室,支持声音克隆、听写和音频创作,提供现代化 Web 界面。

作者 Jamie Pine 开源时间 2026-01-25 最近提交 未知

简介

Voicebox 是一个开源 AI 语音工作室,提供声音克隆、听写和音频创作功能。它将多种 AI 语音模型整合到一个易用的界面中,面向创作者、开发者和内容生产者。

主要特性

  • 从短音频样本克隆声音。
  • 高精度语音转文字听写。
  • 多模型支持,覆盖多种语音生成任务。
  • 现代化 Web 工作室界面。

使用场景

  • 克隆自己的声音用于内容创作和播客。
  • 为视频和演示文稿生成配音。
  • 使用 AI 听写转录音频录音。

技术特点

  • GitHub 29,000+ Star,最受欢迎的开源语音工具之一。
  • MIT 协议,完全开源可自托管。