語音合成
聲音克隆
對口型視頻
其他
語音合成
聲音克隆
對口型視頻
其他
語音合成 — HTTP v2
通過 HTTP 接口,使用音色 ID 與可選引擎參數合成語音。
語音合成(HTTP v2)
POST /api/open/v2/speech/tts。請求體為 JSON,包含待合成文本、音色 ID,以及可選的引擎與合成參數。鑑權使用 Authorization: Bearer,也可在 JSON 中附帶 token。
接口地址
POST /api/open/v2/speech/tts
請求頭
Content-Type
stringheader必填
application/json
Authorization
stringheader必填
Bearer <token> (API Key)
請求參數
application/json
voiceId
string必填
音色 ID。
modelId
string
引擎 ID。
可選項:fishaudio-s2profishaudio-s1minimax-2.8-turbominimax-2.8-hdminimax-2.6-turbominimax-2.6-hdqwen3-tts-flash
text
string必填
待合成文本。
format
string
輸出音頻格式。
可選項:mp3wav
speed
number
語速倍速(0.5-2.0)。
volume
number
輸出音量(-20~20)。
stability
number
穩定性/表現力(0.5-1.5;僅 Fish Audio 引擎支持)。
similarity
number
相似度(0.5-1.5;僅 Fish Audio 引擎支持)。
pitch
number
音調(半音,-12~12;僅 MiniMax / Qwen 引擎支持)。
language
string
語言提示/覆蓋。
emotion
string
說話情緒(僅 MiniMax 引擎支持)。
可選項:happysadangryfearfuldisgustedsurprisedcalm
token
string // 可選,已使用 Authorization: Bearer 時可省略
API token(已用 Authorization 時可省略)。
返回數據
// 成功響應 - 200
Content-Type: audio/mpeg (or audio/wav / audio/ogg depending on format)
<二進制音頻數據>
// 響應中可能包含與本次用量、剩餘額度相關的響應頭。
// 錯誤響應
{
"code": string,
"message": string,
"requestId"?: string
}CURL 示例
curl -X POST https://kittaai.com/api/open/v2/speech/tts \
-H "Content-Type: application/json" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-d '{
"voiceId": "00a1b221-6137-4b73-ad62-b0cbce134167",
"modelId": "fishaudio-s2pro",
"text": "Hello, world.",
"format": "wav",
"speed": 1,
"volume": 0
}' \
--output output.wav在線調試
狀態碼說明
狀態碼說明:
200 OK - 請求成功
400 Bad Request - 請求參數錯誤
401 Unauthorized - API Token 無效
403 Forbidden - 禁止訪問
404 Not Found - 資源不存在
413 Payload Too Large - 上傳文件過大
429 Too Many Requests - 請求頻率超限/積分不足
500 Server Error - 服務器內部錯誤
錯誤響應格式:
{
"error": string, // 錯誤信息
"details": string, // 詳細錯誤信息(可選)
"code": string // 錯誤代碼(可選)
}