Skip to content

Spark-TTS

功能介绍

Spark-TTS 核心能力包含:

  1. 声音克隆 img.png
  2. TTS:使用预训练好的音色来读取文本内容 img_1.png

一键整合包

下载地址:百度网盘 安装方式:下载后,选择文件夹中的所有文件(约14G),右键选择“7-Zip” => “Extract Here”,解压完成后,双击压缩包中的 “启动.bat” 文件即可启动程序。如果想要自行进行安装,继续查看“安装应用”小节。

安装应用

下面以 Windows11 为例,演示安装流程。在 cmd 中依次输入以下命令

shell
git clone https://github.com/SparkAudio/Spark-TTS.git
cd Spark-TTS

conda create -n sparktts python=3.12 -y
conda activate sparktts
pip install -r requirements.txt
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu126
pip install pydantic==2.10.6

mkdir -p pretrained_models
git clone https://huggingface.co/SparkAudio/Spark-TTS-0.5B pretrained_models/Spark-TTS-0.5B

python webui.py

文章的最后,如果您觉得本文对您有用,请打赏一杯咖啡!感谢!