OpenAI、APIに新音声知能機能を導入:リアルタイム会話、翻訳、文字起こしを強化
-
FromTechCrunch AI
OpenAIは、開発者が会話、文字起こし、翻訳ができるアプリを作成できるよう、APIに新たな音声知能機能を導入した。
新モデル「GPT‑Realtime‑2」は、リアルな音声シミュレーションでユーザーと会話できる。
GPT‑5クラスの推論能力を備え、より複雑な要求に対応する。
「GPT‑Realtime‑Translate」は、70以上の入力言語と13の出力言語に対応し、リアルタイム翻訳を提供する。
「GPT‑Realtime‑Whisper」は、ライブの音声認識(Speech-to-Text)機能を提供し、インタラクションをリアルタイムで文字起こしする。
これらの機能は、カスタマーサービス、教育、メディア、イベント、クリエイタープラットフォームなど、幅広い分野での活用が期待される。
OpenAIは、スパムや不正行為などの悪用を防ぐためのガードレールを設けており、有害コンテンツガイドラインに違反する会話は停止される。
これらの新音声モデルはすべてOpenAIのRealtime APIに含まれる。
TranslateとWhisperは従量課金制、GPT‑Realtime‑2はトークン消費量に基づいた課金となる。
[custom_js_sp]
AIによる翻訳/要約をしています。正確な情報はオリジナルサイトにてご確認ください。
当サイトの記事にはプロモーションが含まれる場合があります。
