語音合成

聲音克隆

對口型視頻

其他

語音轉文字

提交音頻 URL,將語音識別為文字,按分鐘消耗 API 積分

語音轉文字接口

接口地址

POST /api/open/speech-to-text

請求頭

Content-Type: application/json
Authorization: Bearer YOUR_API_TOKEN  // 可選,也可在請求體中傳 token

請求參數

{
  "audio_url": string,           // 必填,音頻文件公網可訪問 URL
  "language": string,            // 可選,默認 "auto"。可選: auto, zh, en, ja, ko, fr, de, es, ar
  "ignore_timestamps": boolean,  // 可選,默認 false。為 true 時不返回分段時間戳
  "file_name": string,           // 可選,用於識別格式,如 "audio.mp3"。不傳則按 URL 或默認 "audio.mp3"
  "token": string                // 可選,若未在 Authorization 中提供則必填
}

返回數據

// 成功響應 - 200
{
  "text": string,              // 識別出的全文
  "duration": number,          // 音頻時長(秒)
  "segments": array,           // 分段詳情(含時間戳,若 ignore_timestamps 為 true 可能為空)
  "credits_used": number,      // 本次消耗的 API 積分(約 10 積分/分鐘)
  "quota_remaining": number    // 剩餘 API 積分
}

// 錯誤響應
{
  "error": string,
  "remaining_quota"?: number,  // 402 時返回
  "required_quota"?: number
}

CURL 示例

curl -X POST /api/open/speech-to-text \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -d '{
    "audio_url": "https://example.com/audio.mp3",
    "language": "auto",
    "ignore_timestamps": false
  }'

在線調試

需為公網可訪問的音頻地址,支持 mp3、wav、m4a、ogg、webm、flac、aac、wma,單文件最大 50MB

狀態碼說明

狀態碼說明:
200 OK                  - 請求成功
400 Bad Request         - 請求參數錯誤
401 Unauthorized        - API Token 無效
403 Forbidden          - 禁止訪問
404 Not Found          - 資源不存在
413 Payload Too Large  - 上傳文件過大
429 Too Many Requests  - 請求頻率超限/積分不足
500 Server Error       - 服務器內部錯誤

錯誤響應格式:
{
  "error": string,      // 錯誤信息
  "details": string,    // 詳細錯誤信息(可選)
  "code": string       // 錯誤代碼(可選)
}