コンテンツにスキップ

Whisper语音转文字

Whisperモデルのインターフェース説明

Section titled “Whisperモデルのインターフェース説明”

このインターフェースは Whisper モデルをベースに、音声をテキストへ変換する機能を提供します。一般的な音声形式に対応しています。

  • Whisperモデル: OpenAI がオープンソースで公開している音声認識モデルで、多言語の文字起こしに対応
  • 音声形式: mp3、wav、m4a などの一般的な形式に対応

POST https://api.4allapi.com/v1/audio/transcriptions

パラメータ名必須説明
modelstringはい固定値 “whisper-1”
filefileはい文字起こしする音声ファイル
Authorization: Bearer sk-********************* # 替换为你的 API 令牌
import json
import requests
def voice_to_text(file_path):
"""
音声をテキストに変換する機能
パラメータ:
file_path: 音声ファイルのパス
戻り値:
認識されたテキスト内容
"""
url = "https://api.4allapi.com/v1/audio/transcriptions"
# リクエストパラメータを構築
payload = {"model": "whisper-1"}
files = {"file": ("audio.mp3", open(file_path, "rb"))}
# リクエストヘッダーを設定(APIキーを置き換えてください)
headers = {"Authorization": "Bearer sk-***************************"} # 替换为你的 API 令牌
# POSTリクエストを送信
response = requests.post(url, headers=headers, data=payload, files=files)
# レスポンスデータを解析
data = json.loads(response.text)
# 認識結果を返す
return data.get("text", "")
# 使用例
print(voice_to_text("audio.mp3")) # 替换为你的音频文件路径

成功レスポンス:

{
"text": "これは認識されたテキスト内容です"
}
  1. 音声ファイルのサイズは 25MB 以下を推奨します
  2. 中国語、英語など複数の言語に対応しています
  3. API キーは厳重に管理し、漏えいしないようにしてください

4All API · 一站式AI大模型API聚合平台 | 価格 | お問い合わせ

© 2025 4All API. All rights reserved.