语音合成-音色融合
接口描述(Description)
基于给定的文字信息,融合多种音色,生成音频。
请求地址(Request URL)
[POST] https://api.sensenova.cn/v1/audio/tts
请求头(Request Header)
无特殊Header,请参考接口鉴权
请求体(Request Body)
参数名 | 类型 | 是否必填 | 默认值 | 说明 |
---|---|---|---|---|
model | string | 是 | 无 | 模型名称:用于指定语音合成所采用的模型,当前为 SenseNova-Audio-Fusion-0603 。 |
input | string | 是 | 无 | 合成文本内容:待转换为语音的文本信息,支持中文及英文内容输入。 |
voice | string | 是 | 无 | 主音色名称:用于指定语音合成时的主要音色,在使用融合音色功能时,该音色也必须包含在 timber_weights 中。 |
stream | boolean | 否 | FALSE | 是否返回音频流:用于控制是否以音频流形式返回合成结果,适用于实时语音合成场景。布尔值类型,默认值为 false,表示返回完整的音频数据。 |
speed | float | 否 | 1 | 语速:用于设置语音的播放速度,取值范围为 [0.5, 2.0]。其中,1.0 表示正常语速,数值越小语速越慢,数值越大语速越快。 |
volume | float | 否 | 1 | 音量:用于调节合成语音的响度,取值范围为 (0, 10],值越大音量越高。 |
language | string | 否 | zh | 支持语言: zh,en,默认zh |
pitch | int | 否 | 0 | 音调:用于控制合成语音的音高,取值范围为整数 [-12, 12]。其中,0 表示保持原始音调,正值提高音调,负值降低音调。 |
timber_weights | object (map) | 否 | 无 | 融合音色权重(音色名称: 权重值):用于自定义混合多种音色的合成效果。各音色的权重值总和建议为 1.0,voice 参数指定的主音色必须包含在该权重列表中。 |
response_format | string | 否 | mp3 | 输出结果格式:可选值 mp3、wav、pcm |
sample_rate | int | 否 | 32000 | 音频采样率,取值范围【8000,16000,22050,24000,32000,44100】 |
channel | int | 否 | 2 | 音频声道,支持单声道1,双声道2 |
bitrate | int | 否 | 128000 | 音频码率,支持MP3,取值范围【32000,64000,128000,256000】 |
voice
可选音色如下:
Voice ID | 名称 | 是否支持融合 |
---|---|---|
child_reqing | 热情孩童 | 是 |
man_zhengqi | 正气中年 | 是 |
man_weiyan | 威严霸总 | 是 |
guy_qingshuang | 清爽帅哥 | 是 |
guy_wenrun | 温润暖男 | 是 |
male_shenqing | 深情男友 | 是 |
male_miantian | 腼腆男友 | 是 |
woman_daihuo | 带货女神 | 是 |
female_chunzhen | 纯真少女 | 是 |
female_jiaomei | 娇媚女友 | 是 |
woman_fengyun | 风韵少妇 | 是 |
man_qiangyu | 强欲霸总 | 是 |
guy_shizun | 清冷师尊 | 是 |
guy_nangong | 挚爱男攻 | 是 |
female_taimei | 甜甜台妹 | 是 |
guy_guimi | 男性闺蜜 | 是 |
female_shumei | 熟媚女神 | 是 |
man_nuanren | 暖人青叔 | 是 |
guy_naigou1 | 贴心奶狗 | 是 |
guy_xingui | 冷御新贵 | 是 |
female_sajiao | 撒娇甜妹 | 是 |
female_diantai | 电台女声 | 是 |
female_diantai_b | 娇俏小妹 | 是 |
female_jiejie | 明魅御姐 | 是 |
female_jiejie_a | 爱欲女王 | 是 |
female_jiejie_b | 柔情女王 | 是 |
girl_banxia | 娇怜软妹 | 是 |
girl_banxia_a | 破碎少女 | 是 |
man_cucao | 冷面硬汉 | 是 |
guy_xingui_b | 深情病娇 | 是 |
guy_qiangai | 强爱病娇 | 是 |
guy_shengse | 生涩奶狗 | 是 |
female_jiaonv_a | 羞婉娇女 | 是 |
female_ruanmei_a | 俏萌软妹 | 是 |
oldman_zhangzhe | 威严长者 | 是 |
woman_xiuse | 羞涩御姐 | 是 |
请求示例(Request Example)
- 流式
curl --request POST "https://api.sensenova.cn/v1/audio/tts" \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $API_TOKEN" \
-d '{
"model": "string",
"input": "string",
"voice": "female_jiaomei",
"stream": false,
"timber_weights":
{
"female_jiaomei": 0.7,
"female_taimei": 0.3
},
"response_format": "string",
"language": "zh",
"speed": 1,
"pitch": 0,
"volume": 3,
"bitrate": 32000,
"sample_rate": 32000,
"channel": 2
}'
响应示例(Response Example)
返回与输入参数response_format指定格式相同的音频文件,单声道,采样率为16000Hz 。
- mp3,有损压缩格式,默认输出,不支持流式传输;
- acc,有损压缩格式,采用ADTS格式编码,支持流式传输;
- wav,无损压缩格式,不支持流式传输,标准格式解码;
- pcm,无损压缩格式,支持流式传输,解码参数为:
- 采样率:16000
- 通道数:1
- 采样位数:小端模式16位有符号整数 采样