付録3:可知性マップの算出根拠
『AGI――知の構造転換と文明の再設計(仮)』(高橋恒一, 講談社選書メチエ) 付録3。第8章で導入した可知性マップの算出根拠と読み方を整理する。ランダウアー限界近傍の計算量上限、Levin 探索の上界、内在時スケールの三制約をひとつの平面に重ねる。
第8章では、AI駆動科学が到達しうる科学のフロンティアを、(1) 対象系の内在的時スケール、(2) 必要計算量、(3) 投入可能エネルギーの三制約のもとで評価する「可知性マップ」を導入した。本付録は、その図の前提、各問題群の数値設定、エネルギー階級の計算、図の読み方、限界を整理する。
図の狙い
可知性マップは、科学問題を次の軸で整理する。
- 横軸: 対象系の内在的時スケール [秒]
- 左縦軸: 必要計算量 $C_{\rm req}$ [bit erasures at 300 K]
- 右縦軸: 実効コルモゴロフ複雑性 $K_{\rm eff}$ [bits]
そのうえで、エネルギー投入レベルごとに「1年間で到達可能な科学フロンティア」を可視化する。エネルギー階級は、1 kW(一般家庭)、100 MW(巨大データセンター)、地球全体(約 20.6 TW)、ダイソン球(1 $L_\odot$)、銀河全体、の五段階を取る。
各問題群は、1点ではなく 縦バー で表す。バーの意味は次の通り。
- バー下端: 情報理論的下限 $O(K_{\rm eff})$
- バー上端: Levin 探索上限 $O(2^{K_{\rm eff}})$
バーの長さは、原理的には必要だがアルゴリズム改善で圧縮できる余地を表す。
基本前提
前提A: AGIはランダウアー限界近傍で不可逆計算できる
1ビットの不可逆消去に必要な最小エネルギーを次のように置く。
$$ E_{\rm bit} = k_B T \ln 2 $$
300 K では
$$ E_{\rm bit} = 1.380649 \times 10^{-23} \times 300 \times \ln 2 \approx 2.87 \times 10^{-21};{\rm J/bit} $$
である。よって、電力 $P$、継続時間 $\tau$ のとき投入可能な最大計算量は
$$ C_{\max}(P, \tau) = \frac{P,\tau}{k_B T \ln 2} $$
となる。
前提B: 実験の工学的待ち時間はゼロ
サンプル調製、摂動印加、計測、データ回収、次の実験条件生成はすべて自動化されると仮定する。したがって横軸に残る時間は、対象系そのものが持つ内在的な物理・生物・社会的時間スケールのみである。
前提C: 必要計算量は区間で評価する
各問題群の必要計算量を一点で決め打ちせず、次の区間で表す。
問題の本質的な最短記述長が $K_{\rm eff}$ bits であるなら、少なくともそのオーダーの情報処理は必要である(下端、情報理論的下限)。
$$ C_{\rm low} \sim K_{\rm eff} $$
最短プログラム長が $K_{\rm eff}$ であるなら、万能探索の上界として次を置く(上端、Levin 探索上限)。
$$ C_{\rm high} \sim 2^{K_{\rm eff}} $$
なぜ点ではなくバーで表すか
点表示は「必要計算量が一意に決まっている」ように見える。しかし実際には、同じ問題でも、
- 良い表現を見つけられるか
- 良いモデル化を見つけられるか
- 因果構造を明示できるか
- 効率的な探索アルゴリズムを発見できるか
によって必要計算量は大きく変わる。そのため、必要計算量を $K_{\rm eff}$ から $2^{K_{\rm eff}}$ までの範囲として表す方が、科学問題の本質に近い。
- バー下端 = これ以下では原理的に無理
- バー上端 = ここまで計算すれば理論上は必ず到達可能
- バーの中間 = アルゴリズムの良し悪し、表現発見、実験設計の巧拙で決まる
問題群と内在時スケール
各問題群の横位置は、対象系の内在的時スケールの概算値で固定する。縦方向は、下端が $K_{\rm eff}$、上端が $2^{K_{\rm eff}}$ である。
| 問題群 | 内在時スケール [秒] | $\log_{10}(t)$ | $K_{\rm eff}$ [bits] | 上端 $\log_{10}(C_{\rm req})$ |
|---|---|---|---|---|
| AGI理論・計算知能 | $10^{5.8}$ | 5.8 | 114 | 34.3 |
| エネルギー・材料 | $10^{6.4}$ | 6.4 | 120 | 36.1 |
| 細胞生物学 | $10^{6.7}$ | 6.7 | 127 | 38.2 |
| パンデミック対策 | $10^{7.0}$ | 7.0 | 131 | 39.4 |
| 物理学フロンティア | $10^{7.3}$ | 7.3 | 143 | 43.1 |
| 脳・認知・意識 | $10^{7.5}$ | 7.5 | 137 | 41.2 |
| 地球環境・気候 | $10^{8.4}$ | 8.4 | 151 | 45.5 |
| 社会システム・制度 | $10^{8.9}$ | 8.9 | 158 | 47.6 |
エネルギー階級
各斜線は、与えられた電力 $P$ を1年間使ったときに投入できる最大計算量を表す。
$$ \log_{10} C_{\max}(t) = \log_{10} C_{\max}(1,{\rm yr}) + \log_{10}!\left(\frac{t}{1,{\rm yr}}\right) $$
すなわち、対数グラフ上では傾き1の直線になる。
| エネルギー階級 | 電力 $P$ [W] | 1年間の最大計算量 $\log_{10}(C_{\max})$ |
|---|---|---|
| 1 kW(一般家庭) | $10^{3}$ | 31.0 |
| 100 MW(巨大DC) | $10^{8}$ | 36.0 |
| 地球全体(約 20.6 TW) | $2.06\times10^{13}$ | 41.4 |
| ダイソン球(1 $L_\odot$) | $3.83\times10^{26}$ | 54.6 |
| 銀河全体 | $1.15\times10^{37}$ | 65.1 |
さらに、「1年」の縦破線を $t = 10^{7.5},{\rm s}$ の位置に引く。
図の読み方
ある問題群が、あるエネルギー水準で1年間で到達可能であるための条件は二つある。
条件1: 時間条件
問題群の横位置が1年の縦破線より左にあること。
$$ t_{\rm intrinsic} \le 1,{\rm year} $$
条件2: 計算条件
問題群バーの上端が、そのエネルギー水準の斜線より下にあること。
$$ C_{\rm high} \le C_{\max}(P, 1,{\rm yr}) $$
両条件を満たす場合、その問題は Levin 上限で見ても1年以内に到達可能、すなわち 確実到達領域 である。
一方で、バー下端は線より下、バー上端は線より上、という場合は、情報理論的には到達可能だがアルゴリズムや表現の発見に依存する。**ここがバー表示の最重要点である。**
図から読める主要結論
1 kW(一般家庭)
1年以内・Levin 上限ベースでは、どの問題群にも届かない。ただし AGI 理論・計算知能の下端には近いので、理論下限としては可能性があるがアルゴリズム依存、という読みになる。
100 MW(巨大データセンター)
AGI 理論・計算知能の上端にほぼ届く。エネルギー・材料は境界付近。細胞生物学以降はまだ上端が高い。
地球全体(約 20.6 TW)
AGI 理論・計算知能、エネルギー・材料、細胞生物学、パンデミック対策、脳・認知・意識、あたりが1年境界の近傍に入ってくる。一方で、物理学フロンティア、気候、社会制度はまだ重い。
ダイソン球($1,L_\odot$)
計算量制約はほぼ消える。しかし気候や制度のように内在時間が長い問題は、なお1年では詰め切れない。
銀河全体
計算量制約は完全に二次的になる。最後まで残る壁は 対象系が自分で進む時間 である。
思想的核心
この図の核は次の一文にある。
計算資源が増えても、科学の最終ボトルネックは、しばしば計算量ではなく対象系の内在時間になる。
とくに、地球環境・気候、社会システム・制度は、巨大計算資源を与えても最後まで残りやすい。これは、AGI の能力が上がっても「すぐには解けない科学問題」が依然として存在することを意味する。
なぜ表現サイズではなく探索計算量で評価するか
素朴に考えると、必要計算量は「最終的に得られる知識の表現サイズ」として見積もりたくなる。たとえば 1 kW × 1年でも $10^{31}$ bits 程度の情報処理が可能であり、その尺度であれば多くの問題が「理論上いける」ように見える。
しかし本図では、
知識表現のサイズ ≠ その知識を発見する探索計算量
と区別する。発見の困難性は、得られた知識を書き下す長さではなく、その知識に至るまでに探索しなければならない仮説空間の大きさで決まる。
そこで探索コストの上界として Levin 型の $2^{K_{\rm eff}}$ を採用する。下端 $K_{\rm eff}$ は表現サイズに近い理論下限、上端 $2^{K_{\rm eff}}$ は探索を含む理論上限、という区間として描く。
したがって本図は、知識の保存容量の図ではなく、**科学発見の探索困難性を含む上限図** である。
この図の限界
この図はあくまで上限評価であって、予測図ではない。限界は多い。
- $K_{\rm eff}$ は厳密なコルモゴロフ複雑性ではなく、問題群ごとの実効的な探索複雑性の代理量である
- Levin 探索の定数因子は巨大で、実務的には使えない
- ランダウアー限界近傍計算という仮定自体が極端に楽観的である
- 通信、誤り訂正、記憶アクセス、実験失敗率、観測ノイズを無視している
- 社会制度系では観測が介入で変質する「反射性」が強く、単純な時間スケール化が難しい
- 同じ問題群でも、表現の発見で $K_{\rm eff}$ は大きく変わりうる
それでもこの図には意味がある。なぜなら、エネルギー・探索計算量・対象系の時間という三つの制約を、同一の平面上で直感的に比較できるからである。