GPT-SoVITS-WebUI:1分钟语音即可训练一个自己的TTS模型

发布于 2024-02-22

GPT-SoVITS-WebUI

训练自己的TTS模型

GPT-SoVITS-WebUI

GPT-SoVITS-WebUI简介

GPT-SoVITS-WebUI 是一个基于 GPT-SoVITS 模型的强大少样本语音转换和文本到语音 Web 用户界面。它允许用户使用少量语音数据(只需 1 分钟即可!)训练自定义语音模型,并将其用于各种目的。

特征

  • 零样本 TTS:输入 5 秒的声音样本,体验即时文本到语音的转换。
  • Few-shot TTS:仅用 1 分钟的训练数据即可微调模型,以提高语音相似度和真实感。
  • 跨语言支持:使用与训练数据集不同的语言进行推理,目前支持英语、日语和中文。
  • WebUI工具:集成工具包括语音伴奏分离、自动训练集分割、中文ASR和文本标注,帮助初学者创建训练数据集和GPT/SoVITS模型。

GPT-SoVITS-WebUI 提供了以下功能:

  • 简洁易用的界面,即使是初学者也可以轻松使用
  • 内置语音伴奏分离、自动训练集分割、中文ASR和文本标注等工具,帮助用户创建训练数据集和GPT/SoVITS模型
  • 支持多种模型配置和训练参数,可满足不同用户的需求
  • 可将训练好的模型导出为 ONNX 格式,以便在其他应用程序中使用

项目地址: https://github.com/RVC-Boss/GPT-SoVITS

Star History

Star History Chart

GPT-SoVITS-WebUI 是一个功能强大且易于使用的语音转换和文本到语音工具。它可以帮助用户轻松创建自定义语音模型,并将其用于各种目的。

安装指引