GPT-SoVITS-WebUI
GPT-SoVITS-WebUI简介
GPT-SoVITS-WebUI 是一个基于 GPT-SoVITS 模型的强大少样本语音转换和文本到语音 Web 用户界面。它允许用户使用少量语音数据(只需 1 分钟即可!)训练自定义语音模型,并将其用于各种目的。
特征
- 零样本 TTS:输入 5 秒的声音样本,体验即时文本到语音的转换。
- Few-shot TTS:仅用 1 分钟的训练数据即可微调模型,以提高语音相似度和真实感。
- 跨语言支持:使用与训练数据集不同的语言进行推理,目前支持英语、日语和中文。
- WebUI工具:集成工具包括语音伴奏分离、自动训练集分割、中文ASR和文本标注,帮助初学者创建训练数据集和GPT/SoVITS模型。
GPT-SoVITS-WebUI 提供了以下功能:
- 简洁易用的界面,即使是初学者也可以轻松使用
- 内置语音伴奏分离、自动训练集分割、中文ASR和文本标注等工具,帮助用户创建训练数据集和GPT/SoVITS模型
- 支持多种模型配置和训练参数,可满足不同用户的需求
- 可将训练好的模型导出为 ONNX 格式,以便在其他应用程序中使用
项目地址: https://github.com/RVC-Boss/GPT-SoVITS
Star History
GPT-SoVITS-WebUI 是一个功能强大且易于使用的语音转换和文本到语音工具。它可以帮助用户轻松创建自定义语音模型,并将其用于各种目的。