
F5-TTS部署详细介绍
一、环境准备安装基础工具
Python 3.10:http://www.cjbxt.com/soft/1231.html,安装时勾选 Add Python to PATH。
Git:用于克隆源码(下载地址)。
FFmpeg:音频处理工具(安装教程)。
创建 Conda 虚拟环境(推荐)
conda create -n f5tts python=3.10
conda activate f5tts
避免依赖冲突,隔离系统环境。
安装 PyTorch + CUDA
pip install torch==2.4.0+cu124 torchaudio==2.4.0+cu124 --extra-index-url https://download.pytorch.org/whl/cu124
根据显卡 CUDA 版本选择(如 CUDA 12.4)。
二、安装方式选择
方案1:整合包(推荐新手)
下载整合包(含主程序+模型):
百度网盘:链接: https://pan.baidu.com/s/1bHdn_ocgzd0_rA16eUwbDQ?pwd=QUG7 。
解压至无空格路径(如 D:\F5-TTS)。
启动:
Web界面:双击 run-webui.bat → 访问 http://127.0.0.1:7860。
API服务:双击 run-api.bat → 调用地址 http://127.0.0.1:5010/api。
方案2:源码安装(开发者适用)
克隆源码:
git clone https://github.com/SWivid/F5-TTS.git
cd F5-TTS
安装依赖:
pip install -r requirements.txt
pip install -e . # 可编辑模式,支持训练[3](@ref)[4](@ref)。
模型下载(需代理):
huggingface-cli download --resume-download SWivid/F5-TTS --local-dir ./ckpts
或使用国内镜像:export HF_ENDPOINT= https://hf-mirror.com。
三、避坑指南
路径规范
项目路径禁止包含中文或空格(如 C:\F5-TTS)。
模型文件需完整放置于 ckpts/ 目录(整合包已内置)。
依赖冲突解决
Transformers 版本锁定:
pip install transformers==4.49.0 # 避免 forced_decoder_ids 报错[3](@ref)[6](@ref)。
中文支持:安装拼音库:
pip install pypinyin
代理配置
模型需从 Hugging Face 下载,国内用户需设置代理或镜像。
四、启动与验证
启动 Gradio 交互界面
f5-tts_infer-gradio --port 7860 --host 0.0.0.0
访问 http://localhost:7860 输入文本生成语音。
API 调用示例(Python)
import requests
res = requests.post(
" http://127.0.0.1:5010/api ",
data={"text": "你好,欢迎使用F5-TTS", "model": "f5-tts"},
files={"audio": open("ref.wav", "rb")} # 参考音频(10秒)
)
with open("output.wav", "wb") as f:
f.write(res.content)
支持自定义情感参数 emotion(如 happy)。
五、常见问题解决
启动闪退:检查 CUDA 版本是否匹配(需与 PyTorch 一致)。
GPU 内存不足:改用轻量模型 F5TTS_Small 或减小 batch_size。
中文发音异常:确保安装 pypinyin 并启用拼音转换。