インドのスケールに対応、安価で高速、文化も理解するAvataarの動画AI「Varya」が誕生
-
FromTechCrunch AI
インドではAIモデル開発が欧米や中国に遅れをとっており、政府はIndia AI Missionを通じてGPUコンピューティングへのアクセスを補助し、モデルの公開を促進しています。
その一環として選ばれたAvataar AIは、インドの地域文化(祭り、食べ物、衣服など)を理解できる新しい動画モデル「Varya」を発表しました。
Avataar AIは、Alibabaの公開モデル「Wan 2.2」を基に「蒸留」という技術を用いて、より軽量で高速なモデルを開発しました。VaryaはWan 2.2の50ステップに対し4ステップで動作し、処理速度は10倍、コストは大幅に削減されています。
具体的には、NVIDIA H200 GPUで5秒の720p動画を45秒で生成可能で、これはWan 2.2の1,230秒と比較して劇的な改善です。価格も、1秒あたり約0.005ドルと、競合モデル(0.10ドル以上)の約20分の1であり、インドの「動画ファースト」市場におけるAI普及の鍵となります。
Varyaは、地域文化のニュアンスを捉えるために、厳選されたデータで学習されており、インド政府のAI Koshポータルでオープンウェイトモデルとして公開されます。これにより、開発者は自由に利用・改変できます。
Avataar AIは、エンタープライズ顧客への提供や、Higgsfield、Adobe Fireflyなどの動画ツールとの連携も視野に入れています。本モデルは、テキストプロンプトや参照画像でウェブサイトから試用可能です。
Varyaの登場は、インドのAI戦略において、基盤モデルでの競争ではなく、アプリケーション開発とエコシステムの構築に注力するという現実的なアプローチを反映しています。これは、インドにおけるコンピューティングリソースと高品質なデータへのアクセスの制限という課題に対応するものです。インド政府は、2028年までに2000億ドルのAI投資とGPU能力の倍増を目指しています。
AIによる翻訳/要約をしています。正確な情報はオリジナルサイトにてご確認ください。
当サイトの記事にはプロモーションが含まれる場合があります。
