メインコンテンツへスキップ

忙しい方のためのカメラ関連ニュース
海外のカメラ関連ニュースを翻訳してお届け


GoogleのGemmaをClaude Opus風に、米国産AIをローカルPCで手軽に利用可能に

  • From 
    Claude (Hacker News)

Googleのオープンソースモデル「Gemma 4」を基盤に、Claude Opusのような思考スタイルを持つようにファインチューニングされた「Gemopus」が登場しました。

開発者Jackrong氏が手掛けたこのGemopusは、2つのモデルで提供されます。

Gemopus-4-26B-A4B: 260億パラメータを持ちながら、推論時には40億パラメータのみをアクティブにする「Mixture of Experts (MoE)」モデル。これにより、限られたリソースでも高性能なAIのような能力を発揮します。
Gemopus-4-E4B: 40億パラメータの軽量モデルで、iPhoneやMacBook Airのような一般的なデバイスでもGPUなしで快適に動作します。

Gemopusは、Googleの最新モデルGemini 3と共通の技術基盤を持つGemma 4をベースにしているため、Googleの先進技術とAnthropicの思考スタイルを併せ持っています。

他のGemmaファインチューニングモデルとは異なり、GemopusはClaudeの思考プロセスをそのまま模倣するのではなく、回答の質、構造の明確さ、会話の自然さに重点を置いています。これにより、Gemma特有の「Wikipediaのような文体」や「説教臭さ」が改善されています。

独立したベンチマークでも高い評価を得ており、特に長文コンテキストでの一括処理や高速な応答性が注目されています。E4BモデルはiPhone 17 Pro Maxで毎秒45~60トークン、MacBook Air M3/M4で毎秒90~120トークンという高速処理を実現します。

GGUF形式で提供され、LM Studioやllama.cppに容易に統合できます。

ただし、現時点ではツール呼び出し機能に問題があり、エージェントが外部ツールを使用するワークフローには不向きです。また、Jackrong氏は「実運用可能なソリューションというよりは、エンジニアリング探求の参考」と位置づけており、より安定したモデルが必要な場合は自身のQwopus 3.5シリーズを推奨しています。

Claude Opusのような深い思考プロセスをGemmaに無理に押し込むことを避けたのは、安定性を優先した結果であり、意図的なトレードオフです。

Gemma 4ベースのファインチューニングは、Qwenベースよりも学習ダイナミクスが難しく、ハイパーパラメータへの感度も高いとされています。そのため、本番環境での安定性を重視する場合は、Qwopus 3.5シリーズがより堅牢です。しかし、アメリカ製のモデルでOpus風の洗練された質感を求めるのであれば、Gemopusが現時点で最良の選択肢となります。さらに高密度な310億パラメータのGemopusバリアントも開発中です。

[custom_js_sp]

AIによる翻訳/要約をしています。正確な情報はオリジナルサイトにてご確認ください。
当サイトの記事にはプロモーションが含まれる場合があります。

最新ニュース

今週の人気ニュース

アップル関連のニュースはこちら