跳到主要内容

音频模型

图标说明

输入: 文本 · 音频 · 输出: 文本 · 音频

语音合成 / TTS

Azure OpenAI

厂商接口模型ID模型能力endpoint价格(每百万 Tokens)上线时间预计下线时间负载能力支持访问地区备注
Azureturing/tts-1输入:
输出:
Tools: 不支持
v1/audio/speech$152024-12-16-全球中国区
欧洲区
北美区
-
Azureturing/tts-1-hd输入:
输出:
Tools: 不支持
v1/audio/speech$302024-12-16-全球中国区
欧洲区
北美区
-

语音转写 / ASR

用于会议纪要、录音转文字、说话人分离和专有名词识别。接口采用异步任务模型,先创建转写任务,再轮询结果。

厂商服务名称模型能力endpoint计费方式上线时间预计下线时间负载能力支持访问地区备注
阿里云aliyun/tingwu输入:
输出:
说话人分离 / 专有名词识别 / 音视频格式转换
v1/audio/transcriptions/runs按音频时长计费---中国区会议纪要 ASR;使用说明见 语音转写 / STT