Appearance
Audio(音频服务)
语音合成(TTS)
接口:POST /v1/audio/speech
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
model | string | ✅ | TTS 模型,如 tts-1、tts-1-hd(默认 tts-1) |
input | string | ✅ | 要转换的文本 |
voice | string | ✅ | 声音类型,如 alloy/echo/fable/onyx/nova/shimmer |
response_format | string | ❌ | 输出格式:mp3/opus/aac/flac/wav |
speed | float | ❌ | 语速,0.25~4.0,默认 1.0 |
响应为音频二进制流,非 JSON。
语音转文字(STT)
接口:POST /v1/audio/transcriptions
支持 multipart/form-data 格式上传音频文件。
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
file | file | ✅ | 音频文件(mp3/mp4/mpeg/mpga/m4a/wav/webm) |
model | string | ✅ | 模型名称,如 whisper-1(默认 whisper-1) |
language | string | ❌ | 语言代码,如 zh、en |
response_format | string | ❌ | 输出格式:json/text/srt/verbose_json/vtt |
语音翻译
接口:POST /v1/audio/translations
与 STT 类似,但输出始终为英文文本。