忙しい方のためのカメラ関連ニュース
海外のカメラ関連ニュースを翻訳してお届け

OpenAI、APIに新音声知能機能を導入：リアルタイム会話、翻訳、文字起こしを強化

OpenAIは、開発者が会話、文字起こし、翻訳ができるアプリを作成できるよう、APIに新たな音声知能機能を導入した。

新モデル「GPT‑Realtime‑2」は、リアルな音声シミュレーションでユーザーと会話できる。
GPT‑5クラスの推論能力を備え、より複雑な要求に対応する。

「GPT‑Realtime‑Translate」は、70以上の入力言語と13の出力言語に対応し、リアルタイム翻訳を提供する。

「GPT‑Realtime‑Whisper」は、ライブの音声認識（Speech-to-Text）機能を提供し、インタラクションをリアルタイムで文字起こしする。

これらの機能は、カスタマーサービス、教育、メディア、イベント、クリエイタープラットフォームなど、幅広い分野での活用が期待される。

OpenAIは、スパムや不正行為などの悪用を防ぐためのガードレールを設けており、有害コンテンツガイドラインに違反する会話は停止される。

これらの新音声モデルはすべてOpenAIのRealtime APIに含まれる。
TranslateとWhisperは従量課金制、GPT‑Realtime‑2はトークン消費量に基づいた課金となる。

[custom_js_sp]

AIによる翻訳/要約をしています。正確な情報はオリジナルサイトにてご確認ください。
当サイトの記事にはプロモーションが含まれる場合があります。

関連ニュース