GPT-SoVITS-WebUI:1分钟语音即可训练一个自己的TTS模型

发布于 2024-02-22

GPT-SoVITS-WebUI

训练自己的TTS模型

GPT-SoVITS-WebUI

GPT-SoVITS-WebUI简介

GPT-SoVITS-WebUI 是一个基于 GPT-SoVITS 模型的强大少样本语音转换和文本到语音 Web 用户界面。它允许用户使用少量语音数据（只需 1 分钟即可！）训练自定义语音模型，并将其用于各种目的。

特征

零样本 TTS：输入 5 秒的声音样本，体验即时文本到语音的转换。
Few-shot TTS：仅用 1 分钟的训练数据即可微调模型，以提高语音相似度和真实感。
跨语言支持：使用与训练数据集不同的语言进行推理，目前支持英语、日语和中文。
WebUI工具：集成工具包括语音伴奏分离、自动训练集分割、中文ASR和文本标注，帮助初学者创建训练数据集和GPT/SoVITS模型。

GPT-SoVITS-WebUI 提供了以下功能：

简洁易用的界面，即使是初学者也可以轻松使用
内置语音伴奏分离、自动训练集分割、中文ASR和文本标注等工具，帮助用户创建训练数据集和GPT/SoVITS模型
支持多种模型配置和训练参数，可满足不同用户的需求
可将训练好的模型导出为 ONNX 格式，以便在其他应用程序中使用

项目地址: https://github.com/RVC-Boss/GPT-SoVITS

Star History

GPT-SoVITS-WebUI 是一个功能强大且易于使用的语音转换和文本到语音工具。它可以帮助用户轻松创建自定义语音模型，并将其用于各种目的。

安装指引