メインコンテンツへスキップ

忙しい方のためのカメラ関連ニュース
海外のカメラ関連ニュースを翻訳してお届け


Claude Code、ARC-AGI-3公開デモゲームでの再実行可能なトレースを公開

  • From 
    Claude (Hacker News)

本記事は、Claude CodeがARC-AGI-3の公開デモゲームで生成した、再実行可能な実行トレースに関する詳細な記録です。

記事本文は、様々なゲーム(GAME)やバリアント(VARIANT)におけるClaude Codeの実行結果を一覧で示しています。各エントリは、ゲームID、バリアント名、シード値、ステップ数、レベル、トークン数、実行したアクター(claude-code)、最後のアクション、および実行日時を含んでいます。

例えば、以下のような情報が含まれています:

  • GAME ar2511 bp3513 cd8211…: 様々なゲームとバリアントの実行結果が羅列されています。
  • VARIANT A0-replay-m0r03, A1-fresh-m0r03, …: 各バリアントにおける実行詳細が記載されています。
  • bp35 bp35-24d8cfd6-… C3-reverify-progressionfull-harnesswarm-resume seed 3 45 steps 1 level 0 tokens actor: claude-code last action: ACTION4 2026-05-04 20:18:39: 特定のゲーム(bp35)、バリアント(C3-reverify-progression…)、シード値(3)、ステップ数(45)、レベル(1)などの詳細情報です。

これらのデータは、Claude CodeのAIエージェントが、与えられたタスク(ゲーム)に対してどのように推論し、コードを生成・実行し、結果を導き出したのかを追跡・再現可能にするものです。特に、異なるバリアント(例: `no-theory`, `no-code-writing`, `smaller-model`など)での実行結果を比較することで、モデルの振る舞いや能力の変化を分析することができます。

本データは、AIエージェントのデバッグ、評価、および改善に役立つ貴重な情報源となります。

[custom_js_sp]

AIによる翻訳/要約をしています。正確な情報はオリジナルサイトにてご確認ください。
当サイトの記事にはプロモーションが含まれる場合があります。

今週の人気ニュース

アップル関連のニュースはこちら