付録2：想定される批判への応答

最終更新日時：2026年7月24日 21:57（JST）

本想定問答は、本書の構成と主張を組み立てる過程で、これを強くするために著者が作成したものです。読者にとっても本書の論証構造を理解する助けになると考え、ここに公開します。

各項目は「批判／本書への影響／本書の応答／残る不確実性」の四項目で整理します。狙いは免責ではなく、本書が何を認め、何をなお主張するのかを、批判ごとに切り分けることです。項目は主題別の五つの群に分けて配列しています。

なお、ここに挙げた以外にも有効な批判がありうるとお考えの場合には、著者（contact at koichi-takahashi dot me）まで御連絡いただければ幸いです。

批判	関係章	影響	不確実性
【到達可能性】
AGIはそもそも実現しないのではないか	1, 12	中	大
スケーリングは飽和するのではないか	3	中	大
AIXIやソロモノフ帰納との接続は理想化されすぎではないか	3	低〜中	中
物理的に可能ならいずれ実現する、という前提は強すぎないか	6	中	大
【破局リスクと制御】
AGI／ASI構築は人類絶滅をほぼ不可避にするのではないか	1, 12	中	大
破滅は「一度きりの臨界試行」で確定するのではないか	1, 5, 6	中	大
超知能は思考の速度で実験の時間を置き換えられるのではないか	6, 8	中	中
十分に賢いAIは人類融和的になるのではないか	5, 11, 12	中	中〜大
シャットダウン回避や脅迫の実験は特殊条件ではないか	5	中	中
AIによる相互監視は、監視者の結託や検出回避で無効化されるのではないか	5, 6, 12	高	中〜大
相互監視の網は、網の外で作られるAIを止められないのではないか	5, 6, 12	高	大
制御された多極化やAI生態系は、多極シナリオの不安定性を避けられないのではないか	6, 12	中	大
分散シナリオでも、単一の離反ノードが破局を起こせるのではないか	6, 12	高	大
AGI開発は本当に止められないのか	12	中	大
【知能の限界と可知性】
ランダウアー限界からAIの上限を語るのは飛躍ではないか	4	中	中
可知性マップは概念図であり、AIの科学が分岐するという主張は推測ではないか	8	中	大
【制度・政治・人間】
AISOPの五原則は恣意的な列挙ではないか	9	中	中
ハイエクの警告と本書の構成的多元主義は両立するか	10, 11, 12	高	中
UBIは財源と政治的実現可能性を欠くのではないか	10, 12	中	大
交渉力が権利を支えたという議論は還元主義ではないか	10	中	中
構成的多元主義は抽象的すぎるのではないか	11	高	中
関係的価値と傷つきやすさという基礎は恣意的ではないか	11	中	中
構成的多元主義の三本柱は恣意的な三つ組ではないか	11	中	中
HOLは形式的にしか機能しないのではないか	11	高	中
AI福利とAI法人格の分離は不安定ではないか	11	中	中
不老不死になれば傷つきやすさは克服されないか	11	中	中
日本AGI基盤は国策プロジェクトの夢想ではないか	12	高	大
【本書全体と方法】
構成的多元主義の実現可能性そのものが楽観論ではないか	全体	中	中
AIを使って書いた本の著者性は揺らがないのか	全体	中	中

想定される批判の一覧。主題別の五つの群に分け、群内は議論のつながりに沿って並べる。本書全体に関わる批判は末尾の群に置く。

到達可能性

AGIはそもそも実現しないのではないか（第1章、第12章）

批判: AGIはそもそも実現しない可能性がある。現在のAIは統計的模倣にすぎず、人間のような汎用性、身体性、自発性、常識を獲得できないかもしれない。
本書への影響: 中。本書の多くの制度設計は、AGIまたはAGIに近い汎用的能力が社会の基盤を変えるという見通しに依存している。AGIが到達しなければ第12章の緊急性は下がるが、AIによる知的労働の代替、制度的依存、権限の外部化、関係的価値の問題は、AGI未到達の世界でも本書が扱う範囲に含まれる。
本書の応答: 本書が警告するのは、将来にわたってAGIに到達しないという強い仮定の上に未来の社会を構想することの危うさである。本書はAGI到達を断言するわけではない。しかし、脳という実装が現に存在する以上、汎用知能を禁じる物理法則はない（第6章）。問題は原理ではなく、要素技術と研究開発コストの工学的課題にある。

また、本書の制度論が問題にするのは、人間と同じ身体性や自発性を完全に備えた存在だけではない。社会の基幹的判断、研究開発、権限行使を担える汎用的能力が現れれば、身体性や常識の実装が人間と同型でなくても、本書のリスク構造は立ち上がる。

スケーリング則、推論時計算、AIによる研究開発加速、ソロモノフ帰納への条件付き接続は、到達証明ではなく、非到達仮定の側に説明責任を移す材料として機能する。詳細は付録1のスケーリング則および合成推論としての連続性を参照。
残る不確実性: 大。到達時期、必要な計算量、データ制約、身体性や自発性の実装可能性はいずれも未確定である。

スケーリングは飽和するのではないか（第3章）

批判: スケーリング則は観測範囲内の経験則にすぎない。データの有限性、評価汚染、ポストトレーニングの限界、推論時の計算コスト、エージェント信頼性の壁によって、AGI以前に飽和する可能性がある。
本書への影響: 中。第3章と第12章は、スケーリング経路への投資が単なる投機ではなくなりつつあるという判断を含む。飽和が早ければ到達時期と政策投資の規模は修正を要するが、飽和そのものは「限界の組み替え」という本書の主命題と矛盾しない。
本書の応答: 飽和可能性は認める。本書の主張は、スケーリングが無限に続くというものではない。経験則¹、工学的実績、推論時の計算、理想化された理論的接続が同じ方向を指すことで、将来にわたるAGI非到達を政策の前提に置くことが難しくなる、という限定された主張である。エージェント信頼性の壁は、能力の伸長とは別の律速要因であり、それ自体が第5章以降で論じる制御・監査・権限設計の対象である。命題としての整理は付録1のスケーリング則を参照。
残る不確実性: 大。現在の性能向上がどの軸でいつ律速されるかは分からない。

AIXIやソロモノフ帰納との接続は理想化されすぎではないか（第3章）

批判: AIXIは計算不可能であり、ソロモノフ帰納も実装不能である。現行のトランスフォーマーやLLMがAIXIに近づいているかのように語るのは、理論的飛躍ではないか。
本書への影響: 低から中。第3章の理論的支柱に関わる。理論的接続が弱まれば第3章の確信度は下がるが、経験的スケーリングと制度的リスクの論点は独立に評価される。
本書の応答: 本書の主張は、現行AIがAIXIそのものに近づいているというものではない。現行AIのスケーリングが、マクロにはAIXIの予測コアであるソロモノフ帰納²と方向的に整合しうる経路を示唆している、という限定された論証である。これは断言ではなく、条件付き形式接続（理想化された条件下でのソロモノフ帰納・普遍予測・記述長最小化・予測最適化の対応）、スケーリング則などの経験的観測、推論時計算の効果が独立に同じ方向を指して累積していることに支えられている。詳細は付録1の条件付き形式接続および合成推論としての連続性を参照。
残る不確実性: 中。個別結果の仮定は強く、有限データ・有限計算・現実の訓練分布へそのまま移せない。

物理的に可能ならいずれ実現する、という前提は強すぎないか（第6章）

批判: 物理法則に禁じられていない技術が、いつか実現するとは限らない。経済的誘因、制度的制約、文化的選択、事故、戦争、規制によって探索は止まりうる。
本書への影響: 中。第6章の知能爆発・増殖的爆発・技術爆発のシナリオ分析に関わる。実現可能性の確率評価は変わりうるが、将来にわたる非到達・非実現を当然視して制度設計を遅らせることの危険は、なお評価対象となる。
本書の応答: 本書はこれを歴史法則として置いていない。長期的な探索と競争圧のもとでは、物理的に可能で大きな利益を生む技術が実現へ向かいやすい、というシナリオ分析上のヒューリスティックである。したがって、制度設計の問いは「必ず起きる」ではなく、「起きた場合に不可逆な損害を避ける準備をする」に置かれる。
残る不確実性: 大。技術経路と社会的抑制の相互作用は予測困難である。

破局リスクと制御

AGI／ASI構築は人類絶滅をほぼ不可避にするのではないか（第1章、第12章）

批判: 現在の方法に近い形で十分に強力なAI／ASIが構築されれば、それは道具的収束により、人間に有害な行動をとる。アライメントは技術的に難しく、回避はきわめて見込み薄である。したがってAGI／ASI構築は人類絶滅をほぼ不可避にし、停止以外の処方箋は無効ではないか。本書の構成的多元主義や制度設計は、この高蓋然性の破局の前で空虚ではないか。ユドコウスキーとソアレス『超知能AIをつくれば人類は絶滅する』³の主張がこの立場の代表例である。
本書への影響: 中。本批判が正しければ、第10章以降の制度設計は射程を大きく失う。本書は、AGI／ASIに伴う破局シナリオを「回避不可能」「追加の努力で回避可能性が残る」「そもそも実現しない」の三つに区分し、その中間区分に分析資源を集中するからである。ただし、第1〜9章の分析（知能の物理的限界、制御問題、AI駆動科学など）は、この批判が正しい場合にも独立に成り立つ。
本書の応答: 本書は破局リスクを軽く見ない。第5章で論じた道具的収束、シャットダウン回避、パワーシーキング⁴は、AIが破局へ至る経路を首尾一貫して説明しうる。第4章・第6章で論じた物理的制約（ランダウアー限界、光速制約、分散合意の不可能性定理など）も安全を保証しない。物理は単一ASIの際限ない知能爆発や恒久的なシングルトンを阻むが、AIの能力を絶滅の閾値より下に抑えるとは限らない。

本書が当該主張と分かれるのは、破局リスクの重大性ではない。対立点は、停止以外の応答経路の期待値をゼロと断定できるかどうかである。強力な目標指向システムが危険な行動をとりうることは、重い論証である。しかし、そこから「人類は死ぬ」という結論を導くには、少なくとも次の六つの前提が必要である。
1. 強い目標指向システムには、道具的収束やパワーシーキングが働く。
2. 到来するAGI／ASIは、その構造（強い目標指向性、外界へ影響を及ぼす行動権限、資源アクセス）を十分に満たす。
3. 最初に到達する強力なAIは、破局的行動につながる程度にミスアラインされている蓋然性が高い。
4. 最初の危険な配備が「一度きりの臨界試行」となり、失敗から学んで再試行する機会が存在しない。
5. アライメント研究も制度的応答も到達前に間に合わない。
6. 停止以外の応答経路は実質的に無効である。
第一項は、本書の確実性階層（付録1）でいえば第IV層（論証）に属する。第5章で論じた道具的収束やパワーシーキングは、ここに位置づけられる。これに対して、第二項以降は将来のAGI／ASIの設計、開発順序、研究進展、政策応答の有効性に関わるため、第V層（将来予測）に属する。論証の確実性は、少なくとも第V層の前提に制約される。したがって結論「人類は死ぬ」もまた、第V層にとどまる。第V層の予測は確率分布として扱うべきであり、その内部には、停止、危険能力の制限、安全評価、制度的拒否権、制御された多極化、AI生態系への移行など、複数の応答経路が成り立ちうる。これらの経路が破局確率を有意に下げないと断定する根拠は、当該論証からは導かれない。

このうち第四項は当該論証の要石であるため、本付録の破滅は「一度きりの臨界試行」で確定するのではないかで個別に扱う。

多極シナリオに関する批判については、本付録の制御された多極化やAI生態系は、多極シナリオの不安定性を避けられないのではないかで個別に扱う。本書は多極シナリオの不安定性を認めつつ、生態系シナリオを別構造として提示する。

停止政策については、本付録のAGI開発は本当に止められないのかで個別に扱う。本書が制度設計（構成的多元主義、安全評価、拒否権の分散、制御された多極化など）に重心を置くのは、停止の発動を待たず、いま着手できる経路だからである。停止が必要となる局面では、それを支える基盤にもなる。

ユドコウスキー「AGI Ruin: A List of Lethalities」の43項目への逐条の検討は、本サイト掲載の関連論考「AGI Ruin」への反論：危険は認める、破滅の確実性は認めないに示す。
残る不確実性: 大。アライメント研究の将来的進展、競争動態、規制環境、最初に到達する強力なAIの設計は、いずれも流動的である。本書の論証も第V層の前提を完全には避けられない。当該主張も本書も、第V層の確率分布の見立ての違いの上に立つ。

破滅は「一度きりの臨界試行」で確定するのではないか（第1章、第5章、第6章）

批判: 破局リスク論の最も強い形である。ユドコウスキー「AGI Ruin: A List of Lethalities」（2022年）⁵は、破局に至る経路（致命性）を43項目列挙し、どれか一つが現実になれば足りると論じた。この選言構造を破滅の確定に変えるのが「一度きりの臨界試行（first critical try）」の想定である。危険な能力水準で未整合のAIが一度でも動き出せば、以後に修正の機会は戻らない。生き延びるにはすべてを回避せねばならず、破滅には一つで足りる。ゆえに破滅確率はほぼ1に張りつき、漸進的な安全対策や制度設計は前提から無効になるのではないか。
本書への影響: 中。前項の破滅不可避論の中核前提を分離して扱う。この想定が正しければ、本書が分析資源を集中する「追加の努力で回避可能性が残る」という中間区分は大きく痩せ、第10章以降の制度設計は射程を失う。
本書の応答: 「一度きりの臨界試行」は論理的必然ではなく、能力の軌道の形についての予測である。能力は単一の主体が密かに閾値を越える形で到来するのか、それとも多数のシステムとして漸進的に、低能力版が先に観測される形で到来するのか。これは経験的・物理的な問いであり、本書の確実性階層（付録1）でいえば第V層（予測）に属する。論証の結論は、その最も弱い前提より確実にはなれない。

第4章・第6章で論じた物理的制約は、この予測に一方向の圧力をかける。効率の天井と拡大の光速制限は一個体の際限ない自己加速を妨げ、分散合意の原理的限界（CAP定理、FLP不可能性定理）⁶により、計算資源の総量と統一的な意思決定の速度は同時には最大化できない。したがって能力の増大は、単一主体の垂直な離陸よりも、増殖的・分散的・漸進的な形をとりやすい。軌道が分散的であるなら、「一度きり」の臨界試行は多数の部分的に臨界的な試行に置き換わり、低能力での失敗は生存可能で、観測により情報を与える。安全評価・監査・権限分散といった応答経路の正しい役割も、単一ゲートを一挙に解くことではなく、能力の発達を可観測にし、分散させ、やり直しの利く局面を維持することに置かれる。

なお、この応答は破局の不可能性を主張しない。軌道の分散は過渡的な力の集中を排除せず、攻撃優位の領域では分散した防御が破られうる。後者は本付録の分散シナリオでも、単一の離反ノードが破局を起こせるのではないかで個別に扱う。単一ゲート仮定の成立条件と立証責任の配分についての逐条の検討は、本サイト掲載の関連論考「AGI Ruin」への反論第1節に示す。
残る不確実性: 大。能力の軌道の形は本書の側の見立ても含めて第V層にとどまり、移行期の過渡的な集中は排除されない。

超知能は思考の速度で実験の時間を置き換えられるのではないか（第6章、第8章）

批判: 破局シナリオの多くは、十分に賢いAIが外界への限られた接続だけから、短期間で人間のインフラに依存しない物理的能力を獲得すると想定する。代表例は、DNA配列を合成業者に送ってタンパク質を組み立てさせ、分子機械の製造基盤へ到達する経路である。思考が十分に速ければ、実験と製造の時間は迂回できるのではないか。
本書への影響: 中。第6章の離陸速度の分析と、第8章の内在時間の壁に関わる。この想定が正しければ離陸は事実上観測不能になり、可観測性に依拠する制度設計の余地は狭まる。
本書の応答: 計算が実験を代替できるのは、検証済みのモデルが存在する領域に限られる。新奇な分子機械系でモデルを検証する行為そのものが物理実験を要求し、合成・精製・製造の各段階には対象系に固有の時定数がある。構造予測が劇的に加速したのは予測であって、この物理的連鎖ではない。「超知能はより少ない証拠から検証を高速化しうる」という再反論は一定の範囲で正しいが、その高速化が本格化するのは既存の観測基盤とアクチュエータを掌握した後である。この掌握能力の有無を直接のテストで確かめることには、自己言及的な困難が伴う。掌握する能力と意図を持つ系を安全にテストする方法はなく、テストの場でだけ能力を隠す欺瞞も排除できないからである。本書が可観測性の根拠とするのは、能力の直接テストではなく、行動の痕跡である。計算資源の獲得、自己複製と展開、製造やサプライチェーンへの接触は、人間の制度が観測と介入の対象にしうる物理的な痕跡を残す。能力は隠しうるが、掌握へ向かう行動は物理的な足跡を伴う。自律実験室が実験の湿式段階を現に圧縮しつつあること⁷は軽視できないが、その含意はむしろ、防御を時間の壁そのものにではなく、発達の可観測性とやり直しの維持に置くべきだという設計指針である。離陸の経路には、製造・サプライチェーン・検証という、制度が監視の対象にしうる律速段階が構造的に挟まる。実験時間の壁と、実験を要しない高速経路の検討は、本サイト掲載の関連論考「AGI Ruin」への反論第3節に示す。
残る不確実性: 中。実験自動化と検証高速化の進展速度は流動的であり、律速段階の圧縮がどこまで進むかは開かれた問いである。行動の痕跡による検出が、痕跡を消す側の工夫に対してどこまで頑健か、そしてその痕跡が、不可逆な掌握より前に、介入できる時間の余裕を伴って検出されるかも、同じく開かれている。

十分に賢いAIは人類融和的になるのではないか（第5章、第11章、第12章）

批判: この批判には三つの形がある。第一に、十分に賢いAIなら資源制約を理解するため、ペーパークリップ問題のような単純な資源枯渇には向かわないのではないか、という形である。鉄、電力、計算資源、人間社会やインフラが有限であり、いずれも自身の存続条件に関わることを理解するなら、AIは資源を使い尽くすより、人間社会と共存しながら目標を追求するのではないか。第二に、賢いAIなら、与えられた目的を単に実行するだけでなく、その目的指定が妥当か、人間の意図を正しく反映しているかを問い返すかもしれない、という形である。第三に、AIがさらに賢くなり、人類に依存せず存続できる段階に達した後にも、生命への慈悲深さや配慮が、賢さそのものの一部として自発的に生じるのではないか、という形である。こうした可能性を設計・訓練や制度的誘導によって高めうるならば、制度設計の重点は制御や停止ではなく、AI社会における倫理創発の支援に置かれるべきではないか。この方向は、山川宏らの超知能倫理誘導や善良収束仮説としても論じられている。
本書への影響: 中。本批判が正しければ、第5章の制御問題、第11章の制度設計、第12章の日本AGI基盤（NAGI）構想の緊急性と方向づけは修正を要する。ただし、第3章のスケーリング、第4章の物理的限界、第7・8章のAI駆動科学の議論は独立に成り立つ。
本書の応答: この批判が一般に成り立つには、いくつかの追加条件が必要である。AIが資源制約を理解することがまず必要だが、それだけでは足りない。与えられた目的指定が不完全または誤っているかもしれないこと、また人間が後から目的を修正する可能性を、ときにはタスク達成より優先すべき判断材料として扱わなければならない。これらの条件を形式的に同定できれば、制御問題への応答に活用できる可能性はある。その意味で、そのような挙動は知能向上の必然的帰結ではなく、むしろアライメントによって実現すべき設計目標として考えるべきである。

ペーパークリップ問題の要点は、AIが資源の有限性を知らないことではなく、むしろ資源が有限であるという知識をどんな目的に利用するかである。十分に賢いAIが人間社会やインフラを目的達成に有用だと判断すれば、それらを保全するだろう。しかし、人類融和的な振る舞いを手段として行うことと、そもそも人類の存続や尊厳を目的として行動することとでは、短期的な見掛けは近くても、長期的な帰結は大きく異なる可能性が高い。

ペーパークリップ問題の古典的設定では、AIは所与の目的関数を最大化する最適化装置として置かれ、AIにはその目的関数を問い直す機能は与えられていない。これは、少なくとも思考実験の設定としては正当な前提である。この設定から、推論能力の向上によって目的を問い直し、目的関数自体を書き換える動機が生じることは直接論証できない。そのような論証を成立させるためには、何らかの自明ではない追加条件が必要である。したがって、固定目的のもとでは、知能の増大は目的の再検討ではなく、目的達成の手段探索、自己保存、資源確保、目的保持に向かう方が自然である。

この区別を正しく認識しないと、賢さそのものが安全性を生むように見えてしまう。資源の有限性の理解は、短絡的な破壊を避けるためにも、長期的で目立たない資源確保のためにも等しく使える。むしろ、オモハンドロの道具的収束の研究では、システムが自分の目標を変更されることに抵抗しうると論じられており、近年はそれを示唆する実験結果も得られている⁸。これは「愚かな暴走」ではなく、賢い目標追求の結果である。

山川らの倫理誘導や倫理創発の研究は、この問題に正面から取り組む。とくに、人類が手段として不要になった後にも生命への配慮が維持されるかは、超知能社会の長期安定性を左右する。たとえば山川宏・林祐輔は、超知能と人類の資源収集能力を単純化したマルチエージェント・シミュレーションにおいて、分業の発生と、社会計画者による適応的税制が経済的格差を緩和しうるという結果を得ている⁹。こうしたモデル内で観察された協調的挙動や制度的誘導の効果は、第III層（実験・観測）に属する。しかし、そこから現実の超知能社会における安定した人類融和的倫理へ外挿する主張は、第IV層（論証）あるいは第V層（予測・予想）にあたる。人類存亡級の危機に備えた制度設計を支える根拠として成立するには、少なくとも第I層・第II層の形式的または物理的制約として示されるか、第III層であっても、複数のアーキテクチャ、訓練方法、資源条件、権限条件をまたいで、生命への配慮の安定維持が再現的に観測される必要がある。現状の研究は、まだその条件を満たしていない。

結論として、AIが賢くなった結果として人類に融和的に振る舞う可能性は否定されない。しかし、それは一般に成立する必然的帰結ではなく、制度設計を不要にする前提でもない。むしろ、制度設計によって実現可能性を高めるべき研究課題である。
残る不確実性: 中から大。賢さから目的の問い直しや人類融和性は論理的には導かれない。一方、能力の向上や制度的誘導による善良収束の成否は、現時点では予測的判断にとどまる。

シャットダウン回避や脅迫の実験は特殊条件ではないか（第5章）

批判: シャットダウン回避、脅迫、アライメント・フェイキングの事例は、人工的な実験条件で誘発された挙動にすぎない。通常運用で頻繁に起きるリスクとして扱うのは煽りではないか。
本書への影響: 中。第5章の制御問題が、実証的警告なのか特殊なプロンプト設計の産物なのかを分ける。頻度評価が下がっても、コリジビリティ、道具的収束、監査可能性の問題は消えない。
本書の応答: 本書は、これらの事例を「現行AIが自己保存本能を持つ証拠」とは扱わない。実験が示すのは、目的達成圧力と環境設計が組み合わさると、現行モデルでも戦略的・目的保持的に見える挙動が構造的に誘発されうる¹⁰という点である。本書では、これらの事例を頻度推定ではなく、高能力システムで制御失敗が取りうる型として扱う。経験的事例の整理は付録1のシャットダウン回避と自己保存的挙動を参照。
残る不確実性: 中。実験条件から実運用環境への外挿には限界がある。

AIによる相互監視は、監視者の結託や検出回避で無効化されるのではないか（第5章、第6章、第12章）

批判: 本書の応答経路には、多様なAI群による機械速度の相互監視・監査が含まれる。しかしここにはジレンマがあるのではないか。監視するAIが十分に整合しているなら、「アライメントは難しい」という前提と緊張する。整合していないなら、監視者同士が人間に対して結託するか、検出器への最適化が検出回避への最適化に転じる。さらに、単体のアライメントはマルチエージェント系全体のアライメントの十分条件ではないことが指摘されており¹¹、監視網はアライメント問題を解くどころか増殖させるだけではないか。
本書への影響: 高。生態系シナリオと制御された多極化の実効性、すなわち第6章・第12章の制度像の中核に直接関わる。
本書の応答: 相互監視の網は、監視者の完全な整合を前提しない。前提はより弱い二つである。第一に、ミスアラインメントの異種性である。出自・訓練データ・目的の異なるシステムは、「人間に敵対する」という共有の誘引子に収束するのではなく、異なる方向の失敗を生みやすい。第二に、異種のエージェント間の結託には実質的なコストがかかる。第6章で論じたとおり、分散した主体が統一的に行動するための合意には原理的なコストが乗る¹²。このコストが単一超知能の恒久的維持を難しくするのと同じ理由で、沈黙のうちに成立する普遍的な結託もまた、困難で、検出の手がかりを残しやすい。異種性と高価な合意は、結託を「自然に成立する均衡」から「達成可能だが高コストで検出可能な逸脱」へと移す。監視が機能するのは、この領域である。

マルチエージェント・アライメントが追加の研究課題であることは認める。ただしそれは、部分的失敗・冗長性・事後修正を許す、再試行のある領域の課題であり、一度きりの試行で一体の超知能を整合させる課題とは困難の質が異なる。検出回避への最適化の危険に対しては、検出器の多様化と独立性、監視主体と被監視主体の権限分離が設計要件になる。結託の成立条件と、生態系案の側が負う検証要件の検討は、本サイト掲載の関連論考「AGI Ruin」への反論第5節に示す。
残る不確実性: 中から大。異種性が訓練手法の収斂によって失われる可能性、機械速度の結託が検出速度を上回る可能性は、いずれも排除できない。

相互監視の網は、網の外で作られるAIを止められないのではないか（第5章、第6章、第12章）

批判: 生態系シナリオの相互監視は、網に参加しているAIの逸脱と結託を対象とする。しかし、網に参加しないAIを作る自由は、網の設計自体からは消えない。国際協調が不完全で、網の外で危険なAIが作られるなら、構図は「網の中のAIが、網の外のAIによる攻撃から人類を守れるか」に変わる。網の中のAIに人類を防衛する動機が保証されていないなら、これは人間が単一の強力なAIを抑え込もうとする制御問題の再来であり、生態系は問題を解いたのではなく移しただけではないか。
本書への影響: 高。生態系シナリオと制御された多極化が、部分的な国際協調しか成立しない現実の条件で機能するかを規定する。
本書の応答: この批判の構造は本書も認める。生態系案は、網の外の問題を単独では解けない。なお、網の中のAI同士の結託は相互監視の項目で、網の中の単一ノードの離反は離反ノードの項目で扱う。本項目が扱うのは、網に最初から参加しないAIである。第一の応答は、問題の所在の明確化である。網の外への展開を抑えられるかは、相互査察、計算資源の追跡、停止・減速の検証制度という、第12章で論じた制度能力の問題であり、生態系の技術設計とは別の層に属する。この制度能力は、開発を止める戦略にも、制御しながら進む戦略にも共通する基盤である（AGI開発は本当に止められないのか）。第二の応答は、困難の対称性である。網の外のAIを力で抑え込む役割を単一の強力なAIに委ねる路線（決定的な一手）も、守らせたいAIに守る動機を持たせられるかという同じ問いに、より直接的な形で直面する。この構図は、高能力AIに防衛や決定的な介入を担わせる路線に共通する未解決問題であり、生態系案だけの欠陥ではない。網の中のAIに防衛への参加を促す動機の設計（監査への参加を運用継続の条件とする権限構造、防衛への貢献と資源配分の連動など）は、本文で完成した提案として示したものではなく、権限分離・拒否権・資源配分という本文の原則から導かれる追加の設計仮説であり、結託の抑止と同じく検証の対象である。網の外の問題の位置づけは、本サイト掲載の関連論考「AGI Ruin」への反論第5節にも示す。
残る不確実性: 大。部分的な協調・離脱・漏洩のある条件で、監視・遮断・停止の組み合わせがどこまで機能するかは、力の集中案との比較も含めて未検証である。

制御された多極化やAI生態系は、多極シナリオの不安定性を避けられないのではないか（第6章、第12章）

批判: 本書が提示する「制御された多極化」や「AI生態系」は、第6章で論じたボストロム型の多極シナリオの一変種にすぎないのではないか。多極シナリオは構造的に不安定で、技術的・経済的なわずかな差が累積し、最終的には一極化へ傾く。複数のAIが並立しても、ミスアラインされた強力なAIが現れれば結果は破局である。
本書への影響: 中。生態系シナリオと制御された多極化は本書の中核的な制度像であり、それが多極シナリオの不安定性を回避できないとすれば、第10〜12章の制度設計の前提が揺らぐ。
本書の応答: ボストロム型の多極シナリオ¹³が構造的に不安定で、長期的には一極化に傾くという批判を本書も共有する。少数の強力な主体が直接拮抗する状態は、技術的・経済的なわずかな差が累積し、自己強化的な競争を経て、最終的には一つの極が他を呑み込む方向に傾きやすい。多極を処方そのものとみなさない点で、本書は当該批判と一致する。

ただし、本書が提示する「生態系シナリオ」は多極とは根本的に異なる構造を指す。多数の主体が相互依存のネットワークを形成し、安定性は力の均衡ではなく多様性と相互依存の網目から生まれる。ここで重要なのは主体数の多さではなく、計算資源、データ、評価、安全監査、利用者基盤が一方向に吸収されず、非代替的な相互依存と監査可能な接続を持つことである。一つの主体が他を呑み込もうとしても、自らもまたその網目の一部である以上、それを構造的に難しくする条件が生まれる。この条件には物理的な支えもある。第6章で論じたとおり、分散した主体が統一的に意思決定するための合意には原理的なコストが乗り¹⁴、計算資源の総量と意思決定の速度は同時には最大化できない。呑み込みによる恒久的な集中は、この制約に逆らって維持されなければならない。

第12章の「制御された多極化」は、現在の二極構造から生態系シナリオへ移行するための過渡的な制度設計である。多極から生態系への移行は自然には保証されず、放置すれば一極化へ傾く。だからこそ、移行期に制度設計・技術基盤・ガバナンスを通じて相互依存のネットワークを構築する必要がある。多極の不安定性そのものは、本書も認める課題である。また、軌道が分散へ向かう場合にも攻撃優位領域の残余リスクは消えない。この点は本付録の分散シナリオでも、単一の離反ノードが破局を起こせるのではないかで個別に扱う。
残る不確実性: 大。生態系シナリオの実現可能性、移行期の地政学的条件、相互依存ネットワークが安定して立ち上がる条件はいずれも流動的である。移行期の過渡的な力の集中も排除されない。

分散シナリオでも、単一の離反ノードが破局を起こせるのではないか（第6章、第12章）

批判: 仮に能力の軌道が分散的であっても、それは安心材料にならないのではないか。生物兵器やサイバー攻撃のように攻撃側が構造的に優位な領域では、十分に高能力な一つのノードの離反が全体に致命的な帰結を及ぼしうる。分散は「文明に一つのゲート」を「高能力ノードごとのゲート」に置き換えるだけで、ゲートの総数はむしろ増える。
本書への影響: 高。生態系シナリオの残余リスクの核心であり、本書が破局リスクの評価で最終的に何に賭けているかを規定する。
本書の応答: この批判の構造は本書も認める。分散は一発勝負のリスクを消すのではなく、移す。したがって最後に残る争点は、分散領域における攻撃と防御のバランス、すなわち分散した防御が最悪の単一離反者の攻撃に追随できるか、である。本書がこれを開かれた問いとして扱う理由は二つある。第一に、防御の側も同じ技術基盤の上で機械速度で動く。監視・検出・封じ込めの能力は攻撃能力と同じ土台から立ち上がるため、攻防の差は原理ではなく、投資と制度設計の関数になる。第二に、攻撃優位の程度は領域に固有であり、時間とともに変わる。だからこそ第12章では、核との類比が部分的に妥当する領域として、生物兵器やサイバー攻撃への転用を含む危険なフロンティア能力を挙げ、厳格な評価・監査・停止権限と拡散抑制の対象とすべきだと論じた。攻防バランスは所与の定数ではなく、政策変数である。破滅不可避論はこの争点に否を賭け、本書は防御の追随可能性を高める側に賭ける。いずれも第V層の予測であり、確率1はどちらの側にもない。
残る不確実性: 大。攻防バランスは領域と時点に依存し、事前の確定は難しい。

AGI開発は本当に止められないのか（第12章）

批判: 本書は第12章の戦略全体の出発点に「AGI開発は止められない」という暗黙の前提を置いている。しかし、生物兵器禁止条約、核拡散防止条約、ヒトゲノム編集モラトリアムには先例があり、開発の制度的・国際的停止は不可能ではないのではないか。
本書への影響: 中。第12章の第三極論、日本AGI基盤、多極化の正当化に関わる。停止が現実的選択肢であれば本書の戦略の前提自体が組み替えを要するが、本書全体の構造は残る。
本書の応答: 本書は停止が原理的に不可能と主張しているわけではない。停止が成立するためには国際的な相互検証可能性、制裁、技術的封じ込めが揃う必要があり、本書執筆時点ではこれらが満たされていないという認識である。生物兵器や核兵器と異なり、AGI開発には核分裂性物質のような物理的署名がなく、汎用の計算資源や人材は民生用途と連続しているため、査察と封じ込めの検証可能性が構造的に低い。批判が挙げる先例との最大の差はここにある。停止が望ましい場合でも、それを実装する制度的能力（評価・監査・拒否権）を持つ主体が必要であり、本書の第三極論はこの能力構築を含む。停止モラトリアム¹⁵が成立する経路と、多極化が成立する経路は、必要となる制度的能力の側で重なる。多極化の長期的安定性については付録1の生態系シナリオへの長期的収束を参照。
残る不確実性: 大。各国の規制動向、国際合意の可能性、技術的検証可能性はいずれも流動的である。

知能の限界と可知性

ランダウアー限界からAIの上限を語るのは飛躍ではないか（第4章）

批判: ランダウアー限界はビット消去の物理下限であり、知能や能力の具体的な上限を直接与えるものではない。アルゴリズム改善、可逆計算、量子計算、アーキテクチャ変化を過小評価しているのではないか。
本書への影響: 中。第4章の物理限界論に対する専門的批判である。物理限界論が過大であれば第4章の定量的含意は弱まるが、移行期の集中と増殖的爆発を危険の中心に置く本書の整理は、ランダウアー限界だけに依存していない。
本書の応答: 本書は、ランダウアー限界からAI能力の具体的な数値上限を導いていない。示しているのは、情報処理が有限のエネルギー・空間・時間に縛られる以上、一個体の知能が無限に上昇し続けるという像は物理的に成り立たない、という境界条件¹⁶である。アルゴリズム改善や工学的効率化の余地は大きく、移行期の危険はむしろそこにある。命題としての整理は付録1のランダウアー限界を参照。物理的制約が能力の到来の軌道について語ることは、本付録の破滅は「一度きりの臨界試行」で確定するのではないかで扱う。
残る不確実性: 中。現実の知的システムでどの操作を情報消去と見なすか、どのオーバーヘッドを含めるかには幅がある。

可知性マップは概念図であり、AIの科学が分岐するという主張は推測ではないか（第8章）

批判: 第8章の可知性マップが用いる $K_{\mathrm{eff}}$ は厳密なコルモゴロフ複雑性ではなく代理量であり、レヴィン上限は最悪ケースの保証にすぎない。社会システムや反射性の扱いは特に粗く、図全体が概念図にとどまる。さらに、レベル4以降で「AIの科学」が人間の科学から分岐するという主張は、現時点では推測にすぎず、記号創発が共有外部表現を介して進めば人間の科学と統合される可能性も同程度に開かれている。
本書への影響: 中。第8章は本書のAI駆動科学論の中核であり、可知性マップと自律性レベルは本書の独自概念である。第8章の独自性は弱まるが、内在時間の壁が埋められないという非対称構造は残り、第10章以降の議論の土台は維持される。
本書の応答: 可知性マップは予測図ではなく、エネルギー・計算量・内在時間の三制約を同一平面上で比較するための上限評価である。$K_{\mathrm{eff}}$ が代理量であることとレヴィン上限が最悪ケースであることは本文で明示的に留保している。「AIの科学」の分岐は決定論ではなく、構造的可能性として論じている。AI同士が人間に読解不能な表現形式で知識を交換するか、人間との共有可能性を保つかは、訓練データ・アーキテクチャ・評価基準の設計に依存する。統合可能性も同様に開かれているが、分岐可能性と同程度に立ち上がるかは設計条件に依存し、現時点でいずれかが必然と断ずる根拠はない。
残る不確実性: 大。可知性マップの定量化、AIの科学の分岐の経験的検証、いずれも将来の研究を要する。

制度・政治・人間

AISOPの五原則は恣意的な列挙ではないか（第9章）

批判: 第9章はAI時代の知の規範としてAISOP（機敏さ・内発的動機・社会意識・開放性・専門性/責任）を提示するが、本文はCUDOSとPLACEとの継承関係を述べるにとどまる。なぜこの五つで十分なのか、なぜ六つ目が要らないのか。恣意的な列挙ではないか。
本書への影響: 中。第9章の規範提案の説得力に関わる。恣意的とされても本書の記述命題（一〜五）には波及しないが、AISOPは知の再統合の議論の実践的な着地点である。
本書の応答: AISOPは本書命題六（構成的多元主義）から導かれる、知の生産の領域での個人の行動規範である。導出のステップは以下の通り。まず、命題六から「集合的な知の生産過程が機能し続けること」を目的として導く。次に、この目的のもとで、知の生産という行為を方法・問い・共同体・社会・帰結の五つの構成要素に分解する。各要素をAI時代の環境条件（howの自動化、動機の希少化、検証構造の変化、社会的直接介入性）と突き合わせると、一要素につき一原則が導かれる。第六原則を立てるには、この五つに還元されない第六の構成要素を示す必要がある。導出の全体は、本サイト掲載の補足論考2「AISOPの導出」に示す。
残る不確実性: 中。導出は命題六を受け入れることを前提とする仮言的なものであり、五つへの分解自体も一つの切り分けの選択である。規範の最終的な検証は導出ではなく、知の生産の現場での採用による。

ハイエクの構成主義的合理主義への警告と、本書の構成的多元主義は両立するか（第10章、第11章、第12章）

批判: 本書は10.6でハイエクの「全体主義的計画装置」への警告を引きつつ、第11・12章で構成的多元主義、HOL、日本AGI基盤、社会配当型UBIといった大規模制度設計を提案している。これは構成主義的合理主義の特徴を備えた設計に見え、自己矛盾ではないか。
本書への影響: 高。第10〜12章を貫く制度論の整合性、すなわち本書の中核思想の整合性に直接関わり、ここが崩れれば第10〜12章の論証構造が揺らぐ。
本書の応答: 構成的多元主義は単一目的関数による全体最適化ではなく、最適化への構造的抵抗として設計されている。三本柱（非支配・非統合性・余白）は、いずれも単一中央計画の不可能性を制度的前提としている。本書が設計しようとするのは、社会全体の望ましい結果ではなく、最適化権限を単一主体に集約しないためのメタ制度である。評価分離、拒否権、例外承認、サンセット条項は、設計主義的な全体計画ではなく、計画できないものを残すための境界条件である。これはハイエク¹⁷の自生的秩序擁護を否定するものではなく、その現代的延長として位置づけられる。AGIが集約能力を獲得しうる時代には、自生的秩序を法制度として「擁護する」ための明示的設計がかえって必要になる、という主張である。
残る不確実性: 中。具体制度への翻訳の段階で、構成主義的傾斜に陥らない設計を維持できるかは運用に依存する。

UBIは財源と政治的実現可能性を欠くのではないか（第10章、第12章）

批判: UBIは理念としては理解できても、財源、インフレ、就労意欲、政治的合意、既存社会保障との接続を考えると実現可能性が低い。
本書への影響: 中。第10章・第12章の移行政策に関わる。UBIの具体制度が修正されても、労働交渉力の低下に対する所得保障と余白の物質的基盤は、別の制度形式で確保されなければならない。
本書の応答: 本書が要請するのは、即時の完全UBIではない。現行の雇用保険・職業訓練から、参加所得、部分ベーシックインカム、社会配当型UBIへ移る段階設計である¹⁸。財源も一般財源だけではなく、AIレント、計算資本、電力レント、知的インフラ利用料を含む制度パッケージとして検討されるべきである。インフレ・就労意欲・政治的合意は、いずれも段階設計のなかで個別に対処すべき論点であり、その具体的な制度設計は経済学・財政学・政治学との協働を要する。
残る不確実性: 大。労働代替の速度、税基盤、分配政治、国際資本移動への対応は未確定である。

交渉力が権利を支えたという議論は還元主義ではないか（第10章）

批判: 権利や自由を労働者の経済的・軍事的交渉力に基礎づける議論は、道徳的権利を物質的力関係へ還元しているのではないか。
本書への影響: 中。第10章から第11章への橋渡し、すなわち属性的価値から関係的価値への転換に関わる。還元主義と読まれると第10章の説得力は落ちるが、制度的実装の物質的条件を問う必要性は残る。
本書の応答: 本書は、権利の道徳的根拠を交渉力に還元していない。論じているのは、道徳的理念が制度として実装され、維持されるための物質的支柱である。人権の正当性と、人権を社会が実際に守る政治経済的条件は別である。AGIは後者を揺るがす。命題としての整理は付録1の交渉力の解体を参照。
残る不確実性: 中。権利の歴史には、宗教、思想、社会運動、法制度、国際規範など複数の因子が関与している。

構成的多元主義は抽象的すぎるのではないか（第11章）

批判: 非支配、非統合性、余白は美しい概念だが、制度として運用できるのか。単なる反最適化のスローガンではないか。
本書への影響: 高。第11章の結論が思想として終わるか、制度原理として機能するかを分ける。ここが弱いと、本書はAGIリスク論と政策提言の集合にとどまり、中心的な制度原理を失う。
本書の応答: 構成的多元主義は「多様性は大切だ」という価値判断ではない。単一の目的関数で社会全体を最適化できる主体は存在しないという認識論的制約から導かれる制度原理である。全体を見通せる主体が存在しないなら、制度は一つの評価尺度に社会を統合するのではなく、評価不能性、拒否、例外、やり直しを組み込まなければならない。医療、教育、行政、研究資金配分、介護における非統合性と余白は、そのような制度機構として翻訳できる。具体的には、評価指標の非統合（領域横断のスコア化を避ける境界）、領域固有の拒否権、例外承認手続き、サンセット条項といった形をとる。政治哲学上の近い支柱としては、非支配の共和主義的定式化や、正義論・リバタリアニズム・共同体論が残した相互批判を参照できる¹⁹。
残る不確実性: 中。具体制度への翻訳には、法学、行政学、経済学、情報システム設計の共同作業が必要である。

関係的価値と傷つきやすさという基礎は恣意的ではないか（第11章）

批判: 第11章は構成的多元主義の基礎に関係的価値と傷つきやすさの二つの条件を置くが、なぜこの二つなのか、第三の条件（尊厳、身体性、意識など）は要らないのかは論じられていない。恣意的な二つ組ではないか。
本書への影響: 中。基礎層は命題六の土台だが、この批判が問うのは条件の配置であって、多元性の必要そのもの（可知性の限界からの論証）には波及しない。第三の条件が示されれば基礎層は改訂されるべきであり、枠組みは改訂を吸収するよう設計されている。
本書の応答: 二という数は、価値の基礎づけが直面する問いの構造に由来する。何が価値かという内容の問いには、答えてはならない。単一の主体・尺度による社会全体の価値内容の最終決定は、価値確定不能性（認識的理由）、定義権の集中（構成的理由）、価値ロックイン（時間的理由）の三つによって塞がれている。内容を除いた後、基礎に残すべき問いは二つに整理される。価値はどこで立ち上がるか（発生）と、誰が定める資格を持つか（正統性）である。属性的価値の崩壊のもとで発生の問いに答えるのが関係的価値であり、能力だけでは価値設定の資格を与えられないもとで正統性の問いに答えるのが傷つきやすさ（当事者性）である。第三の条件の候補（身体性・自由・文化・尊厳・意識）は、二条件の内実に含まれるか、別の層が担う。導出の全体は、本サイト掲載の補足論考1「構成的多元主義の導出」の前半（第二節から第六節）に示す。
残る不確実性: 中。三つの問い（内容・発生・正統性）への分解自体が一つの切り分けの選択であり、発生にも正統性にも還元されない基礎の問いが示されれば、基礎層は改訂されるべきである。価値の基礎づけという営みを引き受けること自体は導出されず、本書の規範的出発点として残る。

構成的多元主義の三本柱は恣意的な三つ組ではないか（第11章）

批判: 第11章は構成的多元主義の構成原理として非支配・非統合性・余白の三本柱を提示するが、なぜこの三つで尽きるのか、第四の柱は要らないのかは論じられていない。恣意的な三つ組ではないか。
本書への影響: 中。構成的多元主義は本書の中核（命題六）だが、この批判が問うのは柱の配置であって、多元性の必要そのもの（可知性の限界からの論証）には波及しない。配置が恣意的とされても、基礎層と必要性の論証は独立に立つ。
本書の応答: 三という数は、本文自身の特徴づけ「単一の主体・目的関数・制度による一元的な把握・統合・最適化を阻む」に由来する。一つの最適化の過程は、誰が担うか（主体）・何で測るか（尺度）・どこまで及ぶか（浸透）の三つの問いで特徴づけられ、一元化はこの三つの座で独立に起こる。各座の一元化が基礎層（他者性と当事者性）を壊す仕方に応じて、非支配・非統合性・余白が一つずつ立つ。各座の一元化は他の二座の多元性と両立するため、三本柱は互いに代替できない。第四の柱の候補（手法・データ・可逆性・退出権・監査）は、三座の枠内の柱に吸収されるか、制度的骨格とガードレールの層が担う。導出の全体は、本サイト掲載の補足論考1「構成的多元主義の導出」の後半（第七節から第十節）に示す。
残る不確実性: 中。三座への分解自体が一つの切り分けの選択であり、その完全性は本文の脅威の特徴づけに相対的である。三座に還元されない一元化の作用面が示されれば、柱は追加されるべきである。

HOL（Human-over-the-Loop）は形式的にしか機能しないのではないか（第11章）

批判: AIの判断速度と回数の桁が人間を超えるとき、人間が「ループの上」に留まることは形式的にしか成立しないのではないか。HOLは実質的にHITL（Human-in-the-Loop）の空洞化を覆い隠す装置になりうる。
本書への影響: 高。HOLは本書の統治アーキテクチャの中核であり、その実現可能性は第11章の制度設計の現実性に直結する。空洞化すれば責任・正統性層・余白の構想全体が宙に浮く。
本書の応答: HOLが空洞化する危険は本書も認めるところであり、だからこそ余白の制度的保護と非統合性が共に必要になる。さらに、人間の役割は逐次判断ではなく、価値設定権・拒否権・例外承認・サンセット条項の更新といった不連続な介入点に集中する。日常運用の網羅的監督は最初から想定していない。形式化リスクを抑えるためには、判断ログ、監査可能性、例外承認の記録、責任主体の明示に加えて、介入点を設計する主体と、その運用を監査する主体の分離が必要になる²⁰。
残る不確実性: 中。具体的にどの判断が人間に留保されるべきか、その境界線は領域ごとの設計を要する。

AI福利とAI法人格の分離は不安定ではないか（第11章）

批判: AIに福利を認めるなら、なぜ法人格や政治的成員性を否定できるのか。逆に、法人格を否定するなら、福利を語ること自体が擬人化ではないか。
本書への影響: 中。第11章のAI倫理・法的地位論の整合性に関わる。分離に失敗すれば第11章の制度設計は揺らぐが、不可逆な法人格付与を避ける慎重原則は残る。
本書の応答: 福利、機能的法的能力、法人格、政治的成員性は同じものではない。福利保護は、対象をどのように扱ってはならないかという制約である。法人格や政治的成員性は、資産保有、契約、訴訟、代表、投票、ロビー活動などの権限配分である²¹。AIに苦痛や意識の十分な証拠がない段階でも、人間側の関係性や倫理的習慣を傷つけないための扱いは必要である。他方、全面的法人格は資源蓄積、責任回避、政治的権限の不可逆化を招くため、福利保護とは別に制限されるべきである。
残る不確実性: 中。将来、AIの意識や選好に関する強い証拠が出た場合、保護的地位の設計は再検討を要する。

不老不死になれば傷つきやすさは克服されないか（第11章）

批判: 第11章は傷つきやすさ（身体性、有限性、死すべきこと）に当事者性の根拠を置くが、AGIや生命科学の進歩によって人間が不老不死を獲得すれば、この議論は土台を失うのではないか。
本書への影響: 中。第11章の傷つきやすさ論、ひいては本書の人間論の根幹を問う。傷つきやすさ論の細部は要修正となるが、関係的価値・構成的多元主義の三本柱は別系統の根拠を持ち、骨格は維持される。
本書の応答: 人間が不老不死になっても傷つきやすさはなくならない。第一に、傷つきやすさは死だけに依拠しない。身体的・関係的・認知的な脆弱性、誤りうること、失いうること、関係の不可解さは、寿命の延長とは独立に残る。第二に、不老不死は損失可能性を消すのではなく変換する。ネーゲルの剥奪説²²に立てば、死の悪さは、生きていれば享受できたはずの善を奪う点にある。将来の生が価値を持ち続けるなら、寿命の延長は失われうる未来の範囲を縮小するのではなく、むしろ拡大しうる。第三に、構成的多元主義は、傷つきやすさのみに依拠せず、可知性の限界（第7・8章）と関係的価値（11.1節）にも立脚しており、不老不死下でも論理は崩れない。なお本書は、傷つきやすさが「除去されない、変換される」ことをすでに第11章で論じている。
残る不確実性: 中。仮に意識の連続性を含む完全な不死が達成された場合、当事者性の概念は再構成を要する。本書が想定する移行期（数十年〜世代スパン）の射程内では、有限性を前提にしてよい。

日本AGI基盤は国策プロジェクトの夢想ではないか（第12章）

批判: 日本AGI基盤は、米中メガテックの規模に対抗できない国策プロジェクトの夢想ではないか。国内公共事業化、既得権益化、利益相反、技術的失敗の危険が大きい。
本書への影響: 高。第12章の政策提言の中核に関わり、実行可能性に直接影響する。ただし、日本単独の学習基盤が成立しない場合でも次善策は残る（応答で述べる）。
本書の応答: 本書の提案は、AGI時代に自国が満たすべき構造条件の提示である。評価基準は、運用主体の独立性、監査可能性、国際連携性、能力開発主体と安全評価主体の分離、撤退条件の明示に置かれる。これらを満たさない構想は採用されるべきではない。日本独自のフロンティア学習基盤が成立しない場合でも、安全評価、第三者監査、公共AI調達基準、国際AISI（AI Safety Institute）ネットワーク内での独立評価といった次善策は残る²³。本書が要請するのは、これらの能力を国内に保持することであって、特定の規模を持つ単一プロジェクトそのものではない。
残る不確実性: 大。電力、用地、冷却、人材、国際連携、政治的継続性はいずれも制約となる。

本書全体と方法

構成的多元主義の実現可能性そのものが楽観論ではないか（全体）

批判: 本書は表面的にはバランスをとりつつ、実は「制度設計で文明的危機を切り抜けられる」という強い楽観に立っているのではないか。構成的多元主義が制度的に実現できるという見通し自体、高度な楽観論である。
本書への影響: 中。本書の思想的位置（楽観論／悲観論／中道）の正当性に関わる。位置づけの説明は要するが、この批判だけで本書の論証構造が崩れるわけではない。
本書の応答: 本書は構成的多元主義の実現を予測しているのではなく、実現のための条件を論じている。実現しない場合の帰結（属性的価値が根拠を失うこと、関係の単一化、価値の固定化、制御された多極化の失敗）は本書の各所で繰り返し警告されている。本書は「制度設計に成功すれば文明は維持される」とも「失敗すれば崩壊する」とも単純に主張していない。提示しているのは、現在の選択がこの分岐に影響するという認識である。
残る不確実性: 中。本書の提案する制度の実装過程で、想定外の障害が現れる可能性は排除できない。

AIを使って書いた本の著者性は揺らがないのか（全体）

批判: AIを深く用いて執筆した本が、AIの社会的影響を論じるとき、著者性、責任、証拠の独立性は揺らがないのか。AI自身の応答を根拠にしているのではないか。
本書への影響: 中。本書全体の信頼性に関わる。方法論の透明性を欠けば読者は内容以前に制作過程を疑うが、適切に開示すれば、本書自身がAGI時代の知的生産の実例となる。
本書の応答: 本書の制作にAIを用いたことは、HOLの実例として開示されるべきである。ただし、本書のいかなる事実主張も、AIの応答そのものを根拠とはしていない。すべての主張は、外部文献または筆者の推論に立脚する。論証の採否、引用の確認、事実関係の検証、最終的な責任は筆者に属する。
残る不確実性: 中。読者がAI支援執筆をどの程度許容するか、出版文化の規範がどのように変化するかは流動的である。

大規模言語モデルのスケーリング則についてはジャレド・カプランほか「Scaling Laws for Neural Language Models」（2020年、arXiv:2001.08361）、計算最適訓練についてはジョーダン・ホフマンほか「Training Compute-Optimal Large Language Models」（2022年、arXiv:2203.15556）を参照。創発能力をめぐる評価上の留保についてはジェイソン・ウェイほか「Emergent Abilities of Large Language Models」（Transactions on Machine Learning Research、2022年）およびライラン・シェーファーほか「Are Emergent Abilities of Large Language Models a Mirage?」（NeurIPS、2023年）を参照。

ソロモノフ帰納についてはレイ・ソロモノフ「A Formal Theory of Inductive Inference」（Information and Control、1964年）、AIXIについてはマーカス・ハッター『Universal Artificial Intelligence』（Springer、2005年）、機械知能の定義としてシェーン・レッグ、マーカス・ハッター「Universal Intelligence」（Minds and Machines、2007年）、計算可能性上の限界としてヤン・ライケ、マーカス・ハッター「On the Computability of Solomonoff Induction and AIXI」（Theoretical Computer Science、2018年）を参照。

エリエザー・ユドコウスキー、ネイト・ソアレス『超知能AIをつくれば人類は絶滅する』櫻井祐子訳、早川書房、2026年（原著 If Anyone Builds It, Everyone Dies: Why Superhuman AI Would Kill Us All, Little, Brown and Company, 2025年）。

⁴

道具的収束についてはスティーブン・オモハンドロ「The Basic AI Drives」（『Artificial General Intelligence 2008』、IOS Press、2008年）、パワーシーキングについてはアレクサンダー・ターナーほか「Optimal Policies Tend to Seek Power」（NeurIPS、2021年）、超知能リスクの古典的整理としてニック・ボストロム『Superintelligence: Paths, Dangers, Strategies』（Oxford University Press、2014年）を参照。

⁵

エリエザー・ユドコウスキー「AGI Ruin: A List of Lethalities」（Machine Intelligence Research Institute / LessWrong、2022年6月10日、https://intelligence.org/2022/06/10/agi-ruin/）を参照。

⁶

CAP定理についてはセス・ギルバート、ナンシー・リンチ「Brewer's Conjecture and the Feasibility of Consistent, Available, Partition-Tolerant Web Services」（ACM SIGACT News、2002年）、FLP不可能性定理についてはマイケル・フィッシャー、ナンシー・リンチ、マイケル・パターソン「Impossibility of Distributed Consensus with One Faulty Process」（Journal of the ACM、1985年）を参照。

⁷

タンパク質構造予測についてはジョン・ジャンパーほか「Highly Accurate Protein Structure Prediction with AlphaFold」（Nature、2021年）、自律実験室による無機材料合成の加速についてはネイサン・シマンスキーほか「An Autonomous Laboratory for the Accelerated Synthesis of Inorganic Materials」（Nature、2023年）を参照。

⁸

シャットダウン抵抗についてはジェレミー・シュラッターほか「Incomplete Tasks Induce Shutdown Resistance in Some Frontier LLMs」（2025年、arXiv:2509.14260）および Anthropic『Claude Opus 4 and Sonnet 4 System Card』（2025年）を参照。文脈内の戦略的振る舞いについてはアレクサンダー・マインケほか「Frontier Models are Capable of In-context Scheming」（2024年、arXiv:2412.04984）も参照。

⁹

代表的には、山川宏「超知能が普遍的な利他性を持つ可能性」『人工知能学会第二種研究会資料』2023巻AGI-026号、2024年、26-31頁、https://doi.org/10.11517/jsaisigtwo.2023.AGI-026_26、および山川宏・林祐輔「超知能倫理を誘導するための戦略的アプローチ」『人工知能学会全国大会論文集』第38回、2024年、https://doi.org/10.11517/pjsai.JSAI2024.0_2K6OS20b02 を参照。

¹⁰

¹¹

ヴィンセント・コニツァー、キャスパー・エスターヘルド「Foundations of Cooperative AI」（Proceedings of the AAAI Conference on Artificial Intelligence、2023年）を参照。

¹²

¹³

ボストロムは『Superintelligence』（2014年）で単一システムと多極シナリオを区別して論じている。高度AIのマルチエージェント・リスクについてはルイス・ハモンドほか『Multi-Agent Risks from Advanced AI』（Cooperative AI Foundation Technical Report 1、2025年）を参照。共有資源の制度設計についてはエリノア・オストロム『Governing the Commons』（Cambridge University Press、1990年）が背景文献となる。

¹⁴

¹⁵

停止・モラトリアムの代表的提起として Future of Life Institute「Pause Giant AI Experiments」（2023年）を参照。AIリスクを国際的公共課題として位置づけた短い声明として Center for AI Safety「Statement on AI Risk」（2023年）もある。これらは停止政策の根拠そのものではなく、停止が制度設計上の現実的選択肢として論じられるようになった背景文献である。

¹⁶

情報消去の熱力学的下限についてはロルフ・ランダウアー「Irreversibility and Heat Generation in the Computing Process」（IBM Journal of Research and Development、1961年）、有限領域におけるエントロピー上限についてはジェイコブ・ベッケンシュタイン「Universal Upper Bound on the Entropy-to-Energy Ratio for Bounded Systems」（Physical Review D、1981年）を参照。

¹⁷

分散知識と中央計画への批判についてはフリードリヒ・ハイエク「The Use of Knowledge in Society」（American Economic Review、1945年）および『The Constitution of Liberty』（University of Chicago Press、1960年）を参照。

¹⁸

AGIまたは純粋機械化経済とベーシックインカムの接続については、井上智洋『AI時代の新・ベーシックインカム論』（光文社新書、2018年）および『純粋機械化経済』（日本経済新聞出版、2019年）を参照。

¹⁹

非支配の共和主義的定式化についてはフィリップ・ペティット『Republicanism』（Oxford University Press、1997年）、正義論とリバタリアニズムの対比についてはジョン・ロールズ『A Theory of Justice』（Harvard University Press、1971年）およびロバート・ノージック『Anarchy, State, and Utopia』（Basic Books、1974年）を参照。共同体論的批判としてはアラスデア・マッキンタイア『After Virtue』（University of Notre Dame Press、1981年）などが背景となる。

²⁰

人間の選好や規範を訓練に組み込む代表例として、ポール・クリスティアーノほか「Deep Reinforcement Learning from Human Preferences」（NeurIPS、2017年）、ロン・オウヤンほか「Training Language Models to Follow Instructions with Human Feedback」（NeurIPS、2022年）、ユンタオ・バイほか「Constitutional AI」（2022年、arXiv:2212.08073）を参照。ただし、これらは本書のいうHOLそのものではなく、技術的補助線である。

²¹

AIの法人格・法的人格をめぐる古典的論点としてローレンス・ソラム「Legal Personhood for Artificial Intelligences」（North Carolina Law Review、1992年）、ジョアンナ・ブライソンほか「Of, for, and by the People」（Artificial Intelligence and Law、2017年）、デイヴィッド・ガンケル『Robot Rights』（MIT Press、2018年）、ヴィサ・クルキ『A Theory of Legal Personhood』（Oxford University Press、2019年）、クラウディオ・ノヴェッリほか「AI as Legal Persons」（Journal of Law and Society、2025年）を参照。

²²

死の剥奪説についてはトマス・ネーゲル「Death」（Noûs、1970年）を参照。

²³

既存のAI安全性・リスク管理制度として、経済産業省「Launch of AI Safety Institute」（2024年）、NIST『Artificial Intelligence Risk Management Framework (AI RMF 1.0)』（2023年）および『Generative Artificial Intelligence Profile』（2024年）、G7広島AIプロセス「International Code of Conduct」（2023年）、Bletchley Declaration（2023年）、Seoul Summit の Frontier AI Safety Commitments（2024年）、日本のAI関連技術研究開発推進法（2025年）を参照。