Skip to content

Audio(音频服务)

语音合成(TTS)

接口POST /v1/audio/speech

参数类型必填说明
modelstringTTS 模型,如 tts-1tts-1-hd(默认 tts-1
inputstring要转换的文本
voicestring声音类型,如 alloy/echo/fable/onyx/nova/shimmer
response_formatstring输出格式:mp3/opus/aac/flac/wav
speedfloat语速,0.25~4.0,默认 1.0

响应为音频二进制流,非 JSON。

语音转文字(STT)

接口POST /v1/audio/transcriptions

支持 multipart/form-data 格式上传音频文件。

参数类型必填说明
filefile音频文件(mp3/mp4/mpeg/mpga/m4a/wav/webm)
modelstring模型名称,如 whisper-1(默认 whisper-1
languagestring语言代码,如 zhen
response_formatstring输出格式:json/text/srt/verbose_json/vtt

语音翻译

接口POST /v1/audio/translations

与 STT 类似,但输出始终为英文文本。