メインコンテンツへスキップ

忙しい方のためのカメラ関連ニュース
海外のカメラ関連ニュースを翻訳してお届け


DeepL、テキスト翻訳から音声翻訳へ進出 – 会議や通話でリアルタイム翻訳を提供

  • From 
    TechCrunch AI

DeepLは、テキスト翻訳で知られる同社が、会議、モバイル・Web会話、グループ会話などのユースケースに対応する音声翻訳スイートを発表した。カスタムアプリや、外部開発者・企業がDeepLの技術を基盤に独自のユースケースを構築できるAPIも提供される。

DeepL CEOのJarek Kutylowski氏は、テキスト翻訳で培ってきた長年の経験を活かし、リアルタイム音声翻訳は自然なステップだと語る。リアルタイム音声翻訳の課題は、遅延を減らしつつ正確な結果を維持することにある。

ZoomやMicrosoft Teams向けの追加機能も提供され、ネイティブ言語で話されている間にリアルタイム翻訳を聞いたり、画面上でリアルタイム翻訳テキストを追ったりできる。このプログラムは現在早期アクセス段階で、組織はウェイティングリストへの参加を呼びかけられている。

また、モバイルおよびWebベースの会話、トレーニングセッションやワークショップなどのグループ会話にも対応。QRコードで参加できる。DeepLの音声翻訳技術は、業界固有の専門用語や固有名詞などを学習・適応させることも可能。

同社は音声翻訳のスタック全体を自社でコントロールしているが、現在のシステムは音声をテキストに変換し、翻訳後、再度音声に戻す。

競合としては、Sanas(話者のアクセントをリアルタイムで変更)、Camb.AI(メディア・エンターテイメント企業向けの音声合成・翻訳)、Palabra(意味と話者の声を維持するリアルタイム音声翻訳エンジン)などが挙げられる。DeepLは、テキスト翻訳での優位性を活かし、将来的にはテキスト変換を完全にスキップするエンドツーエンドの音声翻訳モデルの開発を目指している。

[custom_js_sp]

AIによる翻訳/要約をしています。正確な情報はオリジナルサイトにてご確認ください。
当サイトの記事にはプロモーションが含まれる場合があります。

最新ニュース

今週の人気ニュース

アップル関連のニュースはこちら