DeepL、テキスト翻訳から音声翻訳へ進出 – 会議や通話でリアルタイム翻訳を提供
-
FromTechCrunch AI
DeepLは、テキスト翻訳で知られる同社が、会議、モバイル・Web会話、グループ会話などのユースケースに対応する音声翻訳スイートを発表した。カスタムアプリや、外部開発者・企業がDeepLの技術を基盤に独自のユースケースを構築できるAPIも提供される。
DeepL CEOのJarek Kutylowski氏は、テキスト翻訳で培ってきた長年の経験を活かし、リアルタイム音声翻訳は自然なステップだと語る。リアルタイム音声翻訳の課題は、遅延を減らしつつ正確な結果を維持することにある。
ZoomやMicrosoft Teams向けの追加機能も提供され、ネイティブ言語で話されている間にリアルタイム翻訳を聞いたり、画面上でリアルタイム翻訳テキストを追ったりできる。このプログラムは現在早期アクセス段階で、組織はウェイティングリストへの参加を呼びかけられている。
また、モバイルおよびWebベースの会話、トレーニングセッションやワークショップなどのグループ会話にも対応。QRコードで参加できる。DeepLの音声翻訳技術は、業界固有の専門用語や固有名詞などを学習・適応させることも可能。
同社は音声翻訳のスタック全体を自社でコントロールしているが、現在のシステムは音声をテキストに変換し、翻訳後、再度音声に戻す。
競合としては、Sanas(話者のアクセントをリアルタイムで変更)、Camb.AI(メディア・エンターテイメント企業向けの音声合成・翻訳)、Palabra(意味と話者の声を維持するリアルタイム音声翻訳エンジン)などが挙げられる。DeepLは、テキスト翻訳での優位性を活かし、将来的にはテキスト変換を完全にスキップするエンドツーエンドの音声翻訳モデルの開発を目指している。
AIによる翻訳/要約をしています。正確な情報はオリジナルサイトにてご確認ください。
当サイトの記事にはプロモーションが含まれる場合があります。
