语音合成-音色融合
接口描述(Description)
基于给定的文字信息,融合多种音色,生成音频。
请求地址(Request URL)
[POST] https://api.sensenova.cn/v1/audio/tts
请求头(Request Header)
无特殊Header,请参考接口鉴权
请求体(Request Body)
| 参数名 | 类型 | 是否必填 | 默认值 | 说明 |
|---|---|---|---|---|
| model | string | 是 | 无 | 模型名称:用于指定语音合成所采用的模型,当前为 SenseNova-Audio-Fusion-0603 。 |
| input | string | 是 | 无 | 合成文本内容:待转换为语音的文本信息,支持中文及英文内容输入。 |
| voice | string | 是 | 无 | 主音色名称:用于指定语音合成时的主要音色,在使用融合音色功能时,该音色也必须包含在 timber_weights 中。 |
| stream | boolean | 否 | FALSE | 是否返回音频流:用于控制是否以音频流形式返回合成结果,适用于实时语音合成场景。布尔值类型,默认值为 false,表示返回完整的音频数据。 |
| speed | float | 否 | 1 | 语速:用于设置语音的播放速度,取值范围为 [0.5, 2.0]。其中,1.0 表示正常语速,数值越小语速越慢,数值越大语速越快。 |
| volume | float | 否 | 1 | 音量:用于调节合成语音的响度,取值范围为 (0, 10],值越大音量越高。 |
| language | string | 否 | zh | 支持语言: zh,en,默认zh |
| pitch | int | 否 | 0 | 音调:用于控制合成语音的音高,取值范围为整数 [-12, 12]。其中,0 表示保持原始音调,正值提高音调,负值降低音调。 |
| timber_weights | object (map) | 否 | 无 | 融合音色权重(音色名称: 权重值):用于自定义混合多种音色的合成效果。各音色的权重值总和建议为 1.0,voice 参数指定的主音色必须包含在该权重列表中。 |
| response_format | string | 否 | mp3 | 输出结果格式:可选值 mp3、wav、pcm |
| sample_rate | int | 否 | 32000 | 音频采样率,取值范围【8000,16000,22050,24000,32000,44100】 |
| channel | int | 否 | 2 | 音频声道,支持单声道1,双声道2 |
| bitrate | int | 否 | 128000 | 音频码率,支持MP3,取值范围【32000,64000,128000,256000】 |
voice可选音色如下:
| Voice ID | 名称 | 是否支持融合 |
|---|---|---|
| child_reqing | 热情孩童 | 是 |
| man_zhengqi | 正气中年 | 是 |
| man_weiyan | 威严霸总 | 是 |
| guy_qingshuang | 清爽帅哥 | 是 |
| guy_wenrun | 温润暖男 | 是 |
| male_shenqing | 深情男友 | 是 |
| male_miantian | 腼腆男友 | 是 |
| woman_daihuo | 带货女神 | 是 |
| female_chunzhen | 纯真少女 | 是 |
| female_jiaomei | 娇媚女友 | 是 |
| woman_fengyun | 风韵少妇 | 是 |
| man_qiangyu | 强欲霸总 | 是 |
| guy_shizun | 清冷师尊 | 是 |
| guy_nangong | 挚爱男攻 | 是 |
| female_taimei | 甜甜台妹 | 是 |
| guy_guimi | 男性闺蜜 | 是 |
| female_shumei | 熟媚女神 | 是 |
| man_nuanren | 暖人青叔 | 是 |
| guy_naigou1 | 贴心奶狗 | 是 |
| guy_xingui | 冷御新贵 | 是 |
| female_sajiao | 撒娇甜妹 | 是 |
| female_diantai | 电台女声 | 是 |
| female_diantai_b | 娇俏小妹 | 是 |
| female_jiejie | 明魅御姐 | 是 |
| female_jiejie_a | 爱欲女王 | 是 |
| female_jiejie_b | 柔情女王 | 是 |
| girl_banxia | 娇怜软妹 | 是 |
| girl_banxia_a | 破碎少女 | 是 |
| man_cucao | 冷面硬汉 | 是 |
| guy_xingui_b | 深情病娇 | 是 |
| guy_qiangai | 强爱病娇 | 是 |
| guy_shengse | 生涩奶狗 | 是 |
| female_jiaonv_a | 羞婉娇女 | 是 |
| female_ruanmei_a | 俏萌软妹 | 是 |
| oldman_zhangzhe | 威严长者 | 是 |
| woman_xiuse | 羞涩御姐 | 是 |
请求示例(Request Example)
- 流式
curl --request POST "https://api.sensenova.cn/v1/audio/tts" \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $API_TOKEN" \
-d '{
"model": "string",
"input": "string",
"voice": "female_jiaomei",
"stream": false,
"timber_weights":
{
"female_jiaomei": 0.7,
"female_taimei": 0.3
},
"response_format": "string",
"language": "zh",
"speed": 1,
"pitch": 0,
"volume": 3,
"bitrate": 32000,
"sample_rate": 32000,
"channel": 2
}'
响应示例(Response Example)
返回与输入参数response_format指定格式相同的音频文件,单声道,采样率为16000Hz 。
- mp3,有损压缩格式,默认输出,不支持流式传输;
- acc,有损压缩格式,采用ADTS格式编码,支持流式传输;
- wav,无损压缩格式,不支持流式传输,标准格式解码;
- pcm,无损压缩格式,支持流式传输,解码参数为:
- 采样率:16000
- 通道数:1
- 采样位数:小端模式16位有符号整数 采样