Skip to content

ACE-Step:最强歌曲生成工具

功能介绍

核心能力包含:

  1. 文生音乐
  2. 音乐生音乐

安装应用

为了简化使用,制作了一键整合包,关注本公众号,回复 ace 获取下载链接。

前提:需要8G显存。下面以 Windows11 为例,演示安装流程。在 cmd 中依次输入以下命令

shell
git clone https://github.com/ace-step/ACE-Step.git
cd ACE-Step

conda create -n acestep_env python=3.12 -y
conda activate acestep_env

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu126
pip install -e .

启动应用

shell
acestep --checkpoint_path D:\ai\voice\ACE-Step\model --server_name 127.0.0.1 --port 7865

说明:

  • --checkpoint_path:指定模型地址,如果没有,在首次生成音乐时会自动下载 ACE-Step/ACE-Step-v1-3.5B 模型到此处
  • --server_name:Gradio 服务器绑定的 IP 地址或主机名(默认值:“127.0.0.1”)。使用“0.0.0.0”可让网络上的其他设备访问。
  • --port:运行 Gradio 服务器的端口(默认值:7865)
  • --device_id:要使用的 GPU 设备 ID(默认值:0)
  • --share:启用 Gradio 共享链接(默认值:False)
  • --bf16:使用 bfloat16 精度进行更快的推理(默认值:True)
  • --torch_compile:用于torch.compile()优化模型,加快推理速度(默认值:False)。Windows 需要安装 triton:安装方案
  • --cpu_offload:将模型权重卸载到 CPU 以节省 GPU 内存(默认值:False)
  • --overlapped_decode:使用重叠解码来加速推理(默认值:False)

UI 使用

img.png

音乐生成参数

  1. Audio Duration(音乐时长): 期望的音乐时长,最长240s,-1表示在30s~240s之间随机
  2. Tags(标签): 输入 descriptive tags / genres / scene descriptions,多个词之间使用英文逗号分隔, 可以自定义,官方也给出了一些预设标签
  3. lyrics(歌词): 输入歌词,需要使用结构化标签例如 [verse], [chorus], [bridge] 进行歌词的组织
  4. Enable Audio2Audio(启动音乐生音乐)

音乐局部重绘参数

上传音乐,选择需要重绘的时段,进行重绘

音乐标签/歌词重绘参数

上传音乐,填写标签或歌词,选择“only_lyrics”模式(保留旋律)或“remix”模式(改变旋律),进行重绘

音乐扩展参数

上传音乐,选择左右扩展的音乐长度,进行重绘