OpenAI API Audio
2023-03-21 11:57 更新
了解如何将音频转换为文本。
Create transcription
POST https://api.openai.com/v1/audio/transcriptions
将音频转录为输入语言。
Request body
字段 | 类型 | 是否可选 | 说明 |
file | string | 必须 | 要转录的音频文件,采用以下格式之一:mp3、mp4、mpeg、mpga、m4a、wav 或 webm。 |
model | string | 必须 | 要使用的模型的 ID。目前只有 whisper-1 可用。 |
prompt | string | 可选 | 可选文本,用于指导模型的风格或继续之前的音频片段。提示应与音频语言相匹配。 |
response_format | string | 可选 默认为 json | 成绩单输出的格式,采用以下选项之一:json、text、srt、verbose_json 或 vtt。 |
temperature | number | 可选 默认为 0 | 采样 temperature,介于 0 和 1 之间。较高的值(如 0.8)将使输出更加随机,而较低的值(如 0.2)将使输出更加集中和确定。如果设置为 0,模型将使用对数概率自动升高 temperature,直到达到特定阈值。 |
language | string | 可选 | 输入音频的语言。以 ISO-639-1 格式提供输入语言将提高准确性和延迟。 |
示例请求
curl | python | node.js |
|
|
|
参数
{
"file": "audio.mp3",
"model": "whisper-1"
}
响应
{
"text": "Imagine the wildest idea that you've ever had, and you're curious about how it might scale to something that's a 100, a 1,000 times bigger. This is a place where you can get to do that."
}
Create translation
POST https://api.openai.com/v1/audio/translations
将音频翻译成英文。
Request body
字段 | 类型 | 是否可选 | 说明 |
file | string | 必须 | 要翻译的音频文件,采用以下格式之一:mp3、mp4、mpeg、mpga、m4a、wav 或 webm。 |
model | string | 必须 | 要使用的模型的 ID。目前只有 whisper-1 可用。 |
prompt | string | 可选 | 可选文本,用于指导模型的风格或继续之前的音频片段。提示应为英文。 |
response_format | string | 可选 默认为 json | 成绩单输出的格式,采用以下选项之一:json、text、srt、verbose_json 或 vtt。 |
temperature | number | 可选 默认为 0 | 采样 temperature,介于 0 和 1 之间。较高的值(如 0.8)将使输出更加随机,而较低的值(如 0.2)将使输出更加集中和确定。如果设置为 0,模型将使用对数概率自动升高 temperature,直到达到特定阈值。 |
示例请求
curl | python | node.js |
|
|
|
参数
{
"file": "german.m4a",
"model": "whisper-1"
}
响应
{
"text": "Hello, my name is Wolfgang and I come from Germany. Where are you heading today?"
}
以上内容是否对您有帮助:
更多建议: