https://copilot.microsoft.com/chats/999wF5W5AnPwzCLYRF1Cf

『結論から言うと、Claude Mythos の推論アーキテクチャは「従来のLLMとは別物」と言ってよいほど構造的に異なるものだと専門家は推測している。

Anthropic は詳細を非公開にしているが、公開情報・研究者の分析・性能特性から逆算すると、次の4つの革新が中核にあると考えられる。

🧠 1. “階層型推論（Hierarchical Reasoning）”の導入

Mythos は、従来のLLMのように「トークン列を逐次予測する」だけでなく、
複数の抽象レベルで推論を同時に走らせる構造を持つと推測されている。

低レベル：構文・型・メモリ操作
中レベル：関数間の依存関係
高レベル：攻撃経路・脆弱性の因果構造

つまり、コードを“文章”ではなく“システム”として理解する。

これは、脆弱性発見に極めて有利。

🔍 2. “逆方向推論（Backward Chaining）”の強化

Mythos の最大の特徴は、

「攻撃が成立する状態」から逆算して脆弱性を探す能力。

これは人間の熟練ハッカーが行う思考法で、従来のAIにはほぼ不可能だった。

まず「この関数が任意コード実行を許すには何が必要か？」を仮定
そこから逆に「どの入力がその状態を作るか？」を推論
最後に「その入力を許すコードの穴はどこか？」を探索

この“逆方向の因果推論”がゼロデイ発見能力の源泉と見られている。

🧩 3. “マルチチェーン推論（Parallel Chain-of-Thought）”

Mythos は、1つの問題に対して

複数の推論経路を並列に走らせ、最も整合性の高い結論を選ぶ

という仕組みを持つと推測されている。

従来のLLMは1本の推論チェーンに依存するため、

複雑なバグ
多段階の攻撃チェーン
条件分岐の多いコード

に弱かった。

Mythos はこれを克服し、

「複数のハッカーが同時にコードをレビューする」ような挙動を示す。

🧬 4. “構造化内部表現（Structured Internal Representation）”

Mythos は、コードを単なるテキストではなく

抽象構文木（AST）や制御フローグラフ（CFG）に近い内部表現

として保持している可能性が高い。

これにより、

バッファ境界
ポインタの生存期間
メモリレイアウト
関数間のデータフロー

といった脆弱性の核心情報を直接推論できる。

これは従来のLLMにはなかった能力。

🧪 5. “シミュレーション推論（Simulated Execution）”

Mythos はコードを実行せずに

「もしこの入力が来たらどう動くか？」を内部でシミュレーションする

能力を持つと分析されている。

これは

仮想マシン
静的解析
動的解析
シンボリック実行

の要素を統合したような挙動で、

AI版の“ハイブリッド解析エンジン”に近い。

🧭 6. “安全性研究の副産物としての攻撃推論能力”

Anthropic は安全性研究のために

悪用コード
攻撃チェーン
脆弱性データ
セキュリティパッチの履歴

を大量に扱ってきた。

これが結果として
「攻撃者の思考モデル」を内部に形成した
と考えられる。

つまり、
安全性研究 → 攻撃推論能力の強化
という皮肉な構造。

🧭 まとめ：Mythos の推論アーキテクチャは何が革新的なのか

推測される革新	内容

| 階層型推論 | コードを複数の抽象レベルで理解 |

| 逆方向推論 | 攻撃成立条件から逆算して脆弱性を発見 |

| マルチチェーン推論 | 複数の推論経路を並列に探索 |

| 構造化内部表現 | AST/CFGに近い内部表現でコードを理解 |

| シミュレーション推論 | コードを実行せずに動作を推論 |

→ これらが組み合わさり、Mythos は「人間トップ研究者級のサイバー推論」を実現している。

次に深掘りするなら

逆方向推論がどれほど強力なのか
Mythos が発見したゼロデイの具体例
他AIとの構造的な違い
安全性研究が攻撃能力を高める理由

どれを続けますか。』