Whisper语音转文字
Whisperモデルのインターフェース説明
Section titled “Whisperモデルのインターフェース説明”このインターフェースは Whisper モデルをベースに、音声をテキストへ変換する機能を提供します。一般的な音声形式に対応しています。
- Whisperモデル: OpenAI がオープンソースで公開している音声認識モデルで、多言語の文字起こしに対応
- 音声形式: mp3、wav、m4a などの一般的な形式に対応
インターフェースURL
Section titled “インターフェースURL”POST https://api.4allapi.com/v1/audio/transcriptions
リクエストパラメータ
Section titled “リクエストパラメータ”| パラメータ名 | 型 | 必須 | 説明 |
|---|---|---|---|
| model | string | はい | 固定値 “whisper-1” |
| file | file | はい | 文字起こしする音声ファイル |
リクエストヘッダー
Section titled “リクエストヘッダー”Authorization: Bearer sk-********************* # 替换为你的 API 令牌Python 呼び出し例
Section titled “Python 呼び出し例”import jsonimport requests
def voice_to_text(file_path): """ 音声をテキストに変換する機能
パラメータ: file_path: 音声ファイルのパス
戻り値: 認識されたテキスト内容 """ url = "https://api.4allapi.com/v1/audio/transcriptions"
# リクエストパラメータを構築 payload = {"model": "whisper-1"} files = {"file": ("audio.mp3", open(file_path, "rb"))}
# リクエストヘッダーを設定(APIキーを置き換えてください) headers = {"Authorization": "Bearer sk-***************************"} # 替换为你的 API 令牌
# POSTリクエストを送信 response = requests.post(url, headers=headers, data=payload, files=files)
# レスポンスデータを解析 data = json.loads(response.text)
# 認識結果を返す return data.get("text", "")
# 使用例print(voice_to_text("audio.mp3")) # 替换为你的音频文件路径レスポンス例
Section titled “レスポンス例”成功レスポンス:
{ "text": "これは認識されたテキスト内容です"}- 音声ファイルのサイズは 25MB 以下を推奨します
- 中国語、英語など複数の言語に対応しています
- API キーは厳重に管理し、漏えいしないようにしてください
4All API フッター
Section titled “4All API フッター”4All API · 一站式AI大模型API聚合平台 | 価格 | お問い合わせ
© 2025 4All API. All rights reserved.