マイクロソフト、3つの新基盤モデルでAI競合に挑む
-
FromTechCrunch AI
マイクロソフトのAI研究部門は、テキスト、音声、画像を生成できる3つの新しい基盤AIモデルを発表しました。これは、OpenAIとの連携を維持しつつも、独自のマルチモーダルAIモデル構築を強化し、競合AIラボに対抗する動きです。
発表されたモデルは以下の通りです。
MAI-Transcribe-1
: 25言語の音声をテキストに文字起こしするモデルで、既存のAzure Fastより2.5倍高速です。MAI-Voice-1
: 1秒で60秒の音声を生成でき、カスタム音声も作成可能な音声生成モデルです。MAI-Image-2
: 元々は大規模言語モデルテストソフトウェア「MAI Playground」で3月にリリースされた画像生成モデル(本文中では「video-generating model」と記載がありますが、文脈から画像生成モデルと解釈しました)。
これらのモデルは、CEOのムスタファ・スレイマン氏が率いる「MAI Superintelligence」チームによって開発されました。同チームは「Humanist AI」の構築を目指し、人間中心で実用的なAI開発に重点を置いています。
マイクロソフトは、これらのモデルがGoogleやOpenAIのモデルよりも低価格であることを、競争力のある販売戦略としています。MAI-Transcribe-1は1時間あたり$0.36、MAI-Voice-1は100万文字あたり$22、MAI-Image-2はテキスト入力で100万トークンあたり$5、画像出力で100万トークンあたり$33から提供されます。
スレイマン氏は、OpenAIとのパートナーシップは継続するものの、最近のパートナーシップ再交渉により、マイクロソフトが独自のスーパーインテリジェンス研究を追求することが可能になったと述べています。マイクロソフトはOpenAIに130億ドル以上を投資しており、そのモデルを自社製品に統合しています。
[custom_js_sp]
AIによる翻訳/要約をしています。正確な情報はオリジナルサイトにてご確認ください。
当サイトの記事にはプロモーションが含まれる場合があります。
