语音合成-音色融合

接口描述（Description）

基于给定的文字信息，融合多种音色，生成音频。

请求地址（Request URL）

[POST] https://api.sensenova.cn/v1/audio/tts

请求头（Request Header）

无特殊Header，请参考接口鉴权

请求体（Request Body）

参数名	类型	是否必填	默认值	说明
model	string	是	无	模型名称：用于指定语音合成所采用的模型，当前为 SenseNova-Audio-Fusion-0603 。
input	string	是	无	合成文本内容：待转换为语音的文本信息，支持中文及英文内容输入。
voice	string	是	无	主音色名称：用于指定语音合成时的主要音色，在使用融合音色功能时，该音色也必须包含在 timber_weights 中。
stream	boolean	否	FALSE	是否返回音频流：用于控制是否以音频流形式返回合成结果，适用于实时语音合成场景。布尔值类型，默认值为 false，表示返回完整的音频数据。
speed	float	否	1	语速：用于设置语音的播放速度，取值范围为 [0.5, 2.0]。其中，1.0 表示正常语速，数值越小语速越慢，数值越大语速越快。
volume	float	否	1	音量：用于调节合成语音的响度，取值范围为 (0, 10]，值越大音量越高。
language	string	否	zh	支持语言: zh,en,默认zh
pitch	int	否	0	音调：用于控制合成语音的音高，取值范围为整数 [-12, 12]。其中，0 表示保持原始音调，正值提高音调，负值降低音调。
timber_weights	object (map)	否	无	融合音色权重（音色名称: 权重值）：用于自定义混合多种音色的合成效果。各音色的权重值总和建议为 1.0，voice 参数指定的主音色必须包含在该权重列表中。
response_format	string	否	mp3	输出结果格式：可选值 mp3、wav、pcm
sample_rate	int	否	32000	音频采样率，取值范围【8000，16000，22050，24000，32000，44100】
channel	int	否	2	音频声道，支持单声道1，双声道2
bitrate	int	否	128000	音频码率,支持MP3,取值范围【32000，64000，128000，256000】

voice 可选音色如下：

Voice ID	名称	是否支持融合
child_reqing	热情孩童	是
man_zhengqi	正气中年	是
man_weiyan	威严霸总	是
guy_qingshuang	清爽帅哥	是
guy_wenrun	温润暖男	是
male_shenqing	深情男友	是
male_miantian	腼腆男友	是
woman_daihuo	带货女神	是
female_chunzhen	纯真少女	是
female_jiaomei	娇媚女友	是
woman_fengyun	风韵少妇	是
man_qiangyu	强欲霸总	是
guy_shizun	清冷师尊	是
guy_nangong	挚爱男攻	是
female_taimei	甜甜台妹	是
guy_guimi	男性闺蜜	是
female_shumei	熟媚女神	是
man_nuanren	暖人青叔	是
guy_naigou1	贴心奶狗	是
guy_xingui	冷御新贵	是
female_sajiao	撒娇甜妹	是
female_diantai	电台女声	是
female_diantai_b	娇俏小妹	是
female_jiejie	明魅御姐	是
female_jiejie_a	爱欲女王	是
female_jiejie_b	柔情女王	是
girl_banxia	娇怜软妹	是
girl_banxia_a	破碎少女	是
man_cucao	冷面硬汉	是
guy_xingui_b	深情病娇	是
guy_qiangai	强爱病娇	是
guy_shengse	生涩奶狗	是
female_jiaonv_a	羞婉娇女	是
female_ruanmei_a	俏萌软妹	是
oldman_zhangzhe	威严长者	是
woman_xiuse	羞涩御姐	是

请求示例（Request Example）

流式

curl --request POST "https://api.sensenova.cn/v1/audio/tts" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $API_TOKEN" \
  -d '{
        "model": "string", 
        "input": "string", 
        "voice": "female_jiaomei", 
        "stream": false,
        "timber_weights": 
        { 
          "female_jiaomei": 0.7,
          "female_taimei": 0.3
        },
        "response_format": "string",
        "language": "zh",
        "speed": 1,
        "pitch": 0,
        "volume": 3,
        "bitrate": 32000,
        "sample_rate": 32000,
        "channel": 2
    }'  

响应示例（Response Example）

返回与输入参数response_format指定格式相同的音频文件，单声道，采样率为16000Hz 。

mp3，有损压缩格式，默认输出，不支持流式传输；
acc，有损压缩格式，采用ADTS格式编码，支持流式传输；
wav，无损压缩格式，不支持流式传输，标准格式解码；
pcm，无损压缩格式，支持流式传输，解码参数为：
- 采样率：16000
- 通道数：1
- 采样位数：小端模式16位有符号整数采样

语音合成-音色融合

接口描述（Description）​

请求地址（Request URL）​

请求头（Request Header）​

请求体（Request Body）​

请求示例（Request Example）​

响应示例（Response Example）​

接口描述（Description）

请求地址（Request URL）

请求头（Request Header）

请求体（Request Body）

请求示例（Request Example）

响应示例（Response Example）