Audio（音频服务）

语音合成（TTS）

接口：POST /v1/audio/speech

参数	类型	必填	说明
`model`	string	✅	TTS 模型，如 `tts-1`、`tts-1-hd`（默认 `tts-1`）
`input`	string	✅	要转换的文本
`voice`	string	✅	声音类型，如 `alloy`/`echo`/`fable`/`onyx`/`nova`/`shimmer`
`response_format`	string	❌	输出格式：`mp3`/`opus`/`aac`/`flac`/`wav`
`speed`	float	❌	语速，0.25~4.0，默认 1.0

响应为音频二进制流，非 JSON。

接口：POST /v1/audio/transcriptions

支持 multipart/form-data 格式上传音频文件。

参数	类型	必填	说明
`file`	file	✅	音频文件（mp3/mp4/mpeg/mpga/m4a/wav/webm）
`model`	string	✅	模型名称，如 `whisper-1`（默认 `whisper-1`）
`language`	string	❌	语言代码，如 `zh`、`en`
`response_format`	string	❌	输出格式：`json`/`text`/`srt`/`verbose_json`/`vtt`

接口：POST /v1/audio/translations

与 STT 类似，但输出始终为英文文本。