付録3:可知性マップの算出根拠
『AGI論―人間を超える知能は文明をいかに変容させるか』(髙橋恒一, 講談社選書メチエ) 付録3。第8章で導入した可知性マップの算出根拠と読み方を整理する。ランダウアー限界近傍の計算量上限、Levin 探索の上界、内在時スケールの三制約をひとつの平面に重ねる。
最終更新日時:2026年5月21日 23:09(JST)
第8章では、AI駆動科学が到達しうる科学のフロンティアを、(1) 対象系の内在的時スケール、(2) 必要計算量、(3) 投入可能エネルギーの三制約のもとで評価する「可知性マップ」を導入しました。本付録では、その図の前提、各問題群の数値設定、エネルギー階級の計算、図の読み方、限界を整理します。
付録3 もくじ
- 図の狙い — 軸と表示単位
- 基本前提 — A 不可逆計算 / B 待ち時間 / C 区間評価
- バー表示の意味 — 区間と上端の根拠
- なぜ点ではなくバーで表すか — 表現選択の効果
- なぜ上端は $2^{K_{\rm eff}}$ か — Levin 上界の根拠
- 問題群と内在時スケール — 8問題群の配置一覧
- エネルギー階級 — 1 kW〜銀河全体の5階級
- 1年到達可能性の判定 — 時間条件と計算条件
- 図から読める主要結論 — 階級別の到達性
- この図の限界 — 6点の留保
- 問題群ごとの設定根拠 — 8問題群の Keff 内訳と固有事情
- 共通の読み方 — ビット割当の規約、1年あたり自然サイクル数
- AGI理論・計算知能 — $t=10^{5.8}$ s、$K_{\rm eff}=114$
- エネルギー・材料 — $t=10^{6.4}$ s、$K_{\rm eff}=120$
- 細胞生物学 — $t=10^{6.7}$ s、$K_{\rm eff}=127$
- パンデミック対策 — $t=10^{7.0}$ s、$K_{\rm eff}=131$
- 物理学フロンティア — $t=10^{7.3}$ s、$K_{\rm eff}=143$
- 脳・認知・意識 — $t=10^{7.5}$ s、$K_{\rm eff}=137$
- 地球環境・気候 — $t=10^{8.4}$ s、$K_{\rm eff}=151$
- 社会システム・制度 — $t=10^{8.9}$ s、$K_{\rm eff}=158$
- 全体の配置に関する補足 — 8問題群の特徴の対比
図の狙い
可知性マップは、科学問題を次の軸で整理する。
- 横軸: 対象系の内在的時スケール [秒]
- 左縦軸: 必要計算量 $C_{\rm req}$ [bit erasures at 300 K]
- 右縦軸: 実効コルモゴロフ複雑性 $K_{\rm eff}$ [bits]
そのうえで、エネルギー投入レベルごとに「1年間で到達可能な科学フロンティア」を可視化する。エネルギー階級は、1 kW(一般家庭)、100 MW(巨大データセンター)、地球全体(約 20.6 TW)、ダイソン球(1 $L_\odot$)、銀河全体、の五段階を取る。
各問題群は、1点ではなく「縦バー」で表す。バーの意味は次の通り。
- バー下端: 情報理論的下限 $O(K_{\rm eff})$
- バー上端: Levin 探索上限 $O(2^{K_{\rm eff}})$
バーの長さは、原理的には必要だがアルゴリズム改善で圧縮できる余地を表す。
基本前提
前提A: AGIはランダウアー限界近傍で不可逆計算できる
1ビットの不可逆消去に必要な最小エネルギーを次のように置く。
$$ E_{\rm bit} = k_B T \ln 2 $$
300 K では
$$ E_{\rm bit} = 1.380649 \times 10^{-23} \times 300 \times \ln 2 \approx 2.87 \times 10^{-21};{\rm J/bit} $$
である。よって、電力 $P$、継続時間 $\tau$ のとき投入可能な最大計算量は
$$ C_{\max}(P, \tau) = \frac{P,\tau}{k_B T \ln 2} $$
となる。
前提B: 実験の工学的待ち時間はゼロ
サンプル調製、摂動印加、計測、データ回収、次の実験条件生成はすべて自動化されると仮定する。したがって横軸に残る時間は、対象系そのものが持つ内在的な物理・生物・社会的時間スケールのみである。
前提C: 必要計算量は区間で評価する
各問題群の必要計算量を一点で決め打ちせず、次の区間で表す。
問題の本質的な最短記述長が $K_{\rm eff}$ bits であるなら、少なくともそのオーダーの情報処理は必要である(下端、情報理論的下限)。
$$ C_{\rm low} \sim K_{\rm eff} $$
最短プログラム長が $K_{\rm eff}$ であるなら、万能探索の上界として次を置く(上端、Levin 探索上限)。
$$ C_{\rm high} \sim 2^{K_{\rm eff}} $$
バー表示の意味
なぜ点ではなくバーで表すか
点表示は「必要計算量が一意に決まっている」ように見える。しかし実際には、同じ問題でも、
- 良い表現を見つけられるか
- 良いモデル化を見つけられるか
- 因果構造を明示できるか
- 効率的な探索アルゴリズムを発見できるか
によって必要計算量は大きく変わる。そのため、必要計算量を $K_{\rm eff}$ から $2^{K_{\rm eff}}$ までの範囲として表す方が、科学問題の本質に近い。
- バー下端 = これ以下では原理的に無理
- バー上端 = ここまで計算すれば理論上は必ず到達可能
- バーの中間 = アルゴリズムの良し悪し、表現発見、実験設計の巧拙で決まる
なぜ上端は $2^{K_{\rm eff}}$ か(表現サイズではなく探索計算量)
素朴に考えると、必要計算量は「最終的に得られる知識の表現サイズ」として見積もりたくなる。たとえば 1 kW × 1年でも $10^{31}$ bits 程度の情報処理が可能であり、その尺度であれば多くの問題が「理論上いける」ように見える。
しかし本図では、
知識表現のサイズ ≠ その知識を発見する探索計算量
と区別する。発見の困難性は、得られた知識を書き下す長さではなく、その知識に至るまでに探索しなければならない仮説空間の大きさで決まる。
そこで探索コストの上界として Levin 型の $2^{K_{\rm eff}}$ を採用する。下端 $K_{\rm eff}$ は表現サイズに近い理論下限、上端 $2^{K_{\rm eff}}$ は探索を含む理論上限、という区間として描く。
したがって本図は、知識の保存容量の図ではなく、「科学発見の探索困難性を含む上限図」である。
問題群と内在時スケール
各問題群の横位置は、対象系の内在的時スケールの概算値で固定する。縦方向は、下端が $K_{\rm eff}$、上端が $2^{K_{\rm eff}}$ である。各問題群の $K_{\rm eff}$ 値の内訳と固有事情は問題群ごとの設定根拠を参照のこと。
| 問題群 | 内在時スケール [秒] | $\log_{10}(t)$ | $K_{\rm eff}$ [bits] | 上端 $\log_{10}(C_{\rm req})$ |
|---|---|---|---|---|
| AGI理論・計算知能 | $10^{5.8}$ | 5.8 | 114 | 34.3 |
| エネルギー・材料 | $10^{6.4}$ | 6.4 | 120 | 36.1 |
| 細胞生物学 | $10^{6.7}$ | 6.7 | 127 | 38.2 |
| パンデミック対策 | $10^{7.0}$ | 7.0 | 131 | 39.4 |
| 物理学フロンティア | $10^{7.3}$ | 7.3 | 143 | 43.1 |
| 脳・認知・意識 | $10^{7.5}$ | 7.5 | 137 | 41.2 |
| 地球環境・気候 | $10^{8.4}$ | 8.4 | 151 | 45.5 |
| 社会システム・制度 | $10^{8.9}$ | 8.9 | 158 | 47.6 |
エネルギー階級
各斜線は、与えられた電力 $P$ を1年間使ったときに投入できる最大計算量を表す。
$$ \log_{10} C_{\max}(t) = \log_{10} C_{\max}(1,{\rm yr}) + \log_{10}!\left(\frac{t}{1,{\rm yr}}\right) $$
すなわち、対数グラフ上では傾き1の直線になる。
| エネルギー階級 | 電力 $P$ [W] | 1年間の最大計算量 $\log_{10}(C_{\max})$ |
|---|---|---|
| 1 kW(一般家庭) | $10^{3}$ | 31.0 |
| 100 MW(巨大DC) | $10^{8}$ | 36.0 |
| 地球全体(約 20.6 TW) | $2.06\times10^{13}$ | 41.4 |
| ダイソン球(1 $L_\odot$) | $3.83\times10^{26}$ | 54.6 |
| 銀河全体 | $1.15\times10^{37}$ | 65.1 |
さらに、「1年」の縦破線を $t = 10^{7.5},{\rm s}$ の位置に引く。
1年到達可能性の判定
ある問題群が、あるエネルギー水準で1年間で到達可能であるための条件は二つある。
条件1: 時間条件
問題群の横位置が1年の縦破線より左にあること。
$$ t_{\rm intrinsic} \le 1,{\rm year} $$
条件2: 計算条件
問題群バーの上端が、そのエネルギー水準の斜線より下にあること。
$$ C_{\rm high} \le C_{\max}(P, 1,{\rm yr}) $$
両条件を満たす場合、その問題は Levin 上限で見ても1年以内に到達可能、すなわち「確実到達領域」である。
一方で、バー下端は線より下、バー上端は線より上、という場合は、情報理論的には到達可能だがアルゴリズムや表現の発見に依存する。ここがバー表示の最重要点である。
図から読める主要結論
1 kW(一般家庭)
1年以内・Levin 上限ベースでは、どの問題群にも届かない。ただし AGI 理論・計算知能の下端には近いので、理論下限としては可能性があるがアルゴリズム依存、という読みになる。
100 MW(巨大データセンター)
AGI 理論・計算知能の上端にほぼ届く。エネルギー・材料は境界付近。細胞生物学以降はまだ上端が高い。
地球全体(約 20.6 TW)
AGI 理論・計算知能、エネルギー・材料、細胞生物学、パンデミック対策、脳・認知・意識、あたりが1年境界の近傍に入ってくる。一方で、物理学フロンティア、気候、社会制度はまだ重い。
ダイソン球($1,L_\odot$)
計算量制約はほぼ消える。しかし気候や制度のように内在時間が長い問題は、なお1年では詰め切れない。
銀河全体
計算量制約は完全に二次的になる。最後まで残る壁は「対象系が自分で進む時間」である。
この図の限界
この図はあくまで上限評価であって、予測図ではない。限界は多い。
- $K_{\rm eff}$ は厳密なコルモゴロフ複雑性ではなく、問題群ごとの実効的な探索複雑性の代理量である
- Levin 探索の定数因子は巨大で、実務的には使えない
- ランダウアー限界近傍計算という仮定自体が極端に楽観的である
- 通信、誤り訂正、記憶アクセス、実験失敗率、観測ノイズを無視している
- 社会制度系では観測が介入で変質する「反射性」が強く、単純な時間スケール化が難しい
- 同じ問題群でも、表現の発見で $K_{\rm eff}$ は大きく変わりうる
それでもこの図には意味がある。なぜなら、エネルギー・探索計算量・対象系の時間という三つの制約を、同一の平面上で直感的に比較できるからである。
問題群ごとの設定根拠
共通の読み方
本節では、各問題群の縦バーを決める二つの量、すなわち対象系の内在的時スケール $t$ と、実効コルモゴロフ複雑性 $K_{\mathrm{eff}}$ の概算根拠を記す。
ここでいう $K_{\mathrm{eff}}$ は、対象を完全記述する情報量ではない。たとえば細胞生物学なら全ゲノム配列や全 single-cell データ、気候なら全観測格子点、社会制度なら全個人の履歴を意味しない。むしろ、当該問題群を「可知」にするために必要な最小の機構モデル、すなわち仮説クラス、支配変数、粗い精度指定、観測写像、介入写像をまとめて記述するための有効記述長である。
ビット割当は次の規約に従う。$4$ bits は $16$ 程度の粗い類型選択、$8$ bits は $256$ 程度の離散化、$12$ bits は数千通りの組合せ、$16$ bits は数万通りの粗い構造選択に相当する。したがって、以下の数値は有効数字としての「ビット単位の精密値」ではなく、問題群間の相対的な探索困難性を置くための MDL 的な符牒である。再現可能な計測値ではなく、図の相対配置を説明するための構成的キャリブレーションとして読む必要がある。
年換算は表示上の目安であり、以下では与表の秒値と $\log_{10} t$ を主値として扱う。$1$ 年を $3.15\times 10^7$ 秒とおくと、1年あたりに観測・介入できる自然サイクル数はおよそ次のようになる。
| 問題群 | $\log_{10} t$ | 1年あたりの自然サイクル数 |
|---|---|---|
| AGI理論・計算知能 | 5.8 | 約50回 |
| エネルギー・材料 | 6.4 | 約13回 |
| 細胞生物学 | 6.7 | 約6回 |
| パンデミック対策 | 7.0 | 約3回 |
| 物理学フロンティア | 7.3 | 約1.6回 |
| 脳・認知・意識 | 7.5 | 約1回 |
| 地球環境・気候 | 8.4 | 約0.13回 |
| 社会システム・制度 | 8.9 | 約0.04回 |
この「1年あたりの自然サイクル数」は、可知性マップにおける横軸の直観的意味を与える。1年のうちに何十回も対象系が応答する問題群では、AGIによる理論探索・実験計画・モデル改訂の効果が反復的に現れやすい。逆に、気候や制度のように1年では対象系が十分に一巡しない問題群では、AGIが強力でも、実世界での検証サイクルそのものが律速になる。
AGI理論・計算知能
採用値:$t=10^{5.8}$ s、$K_{\mathrm{eff}}=114$ bits
内在時スケール
採用した代表プロセスは、「理論仮説、実装、評価、反例生成、改訂が一巡する計算知能の研究サイクル」である。ここでの対象系は、単一のニューラルネットワークの1回の推論ではなく、「知能を生む計算構造の仮説空間」とみなす。すなわち、ある学習規則やエージェント構成を与え、それがタスク集合上で振る舞いを変え、失敗例を返し、その失敗例から次の仮説が立つまでの最短実効サイクルを代表値とした。
$10^{5.8}$ s、すなわち約1週間という値は、AGI問題群が本マップの中でも最も短い時スケール側に置かれることを意味する。これは、対象が人工的・記号的・シミュレーション可能であり、物質合成、細胞培養、流行拡大、気候応答、制度変化のような自然時間を必ずしも待たなくてよいからである。
採用しなかった候補は三つある。第一に、ミリ秒から秒の単一推論時間である。これは言語モデルや方策モデルの出力応答としては正しいが、「AGI理論が改訂される」時定数ではない。第二に、数週間から数か月の大規模学習ランである。これは計算資源・実装・分散学習環境に依存しすぎ、前提Bで除くべきセットアップ時間を含みやすい。第三に、人間の教育・発達に対応する年単位の時スケールである。これは生物学的認知の制約であって、計算知能一般の内在時スケールとしては長すぎる。
1年での到達可能性という観点では、AGI理論・計算知能は約50サイクルを持つ。これは、同じ仮説クラス内であれば、AGIが失敗例を生成し、モデルを改訂し、再評価する余地が大きいことを意味する。一方で、1週間という時スケールは、単に「速い」ことだけを意味しない。評価基準そのものが変化し、モデルが評価を攻略し、探索過程が自己参照的になるため、短サイクルであるほど Goodhart 化や過適合の危険も大きくなる。
$K_{\mathrm{eff}}$ の自由度分解
| 自由度 | bits | 割当根拠 |
|---|---|---|
| 問題・タスク集合と成功基準 | 15 | 予測、制御、対話、長期計画、自己改訂などの組合せを粗く指定する。$2^{15}$ 程度のタスク族選択。 |
| 表現空間・状態抽象 | 14 | トークン、画像、行動、記憶、世界状態、潜在変数の符号化方式を指定する。 |
| 学習・探索・更新ダイナミクス | 16 | 勾配学習、強化学習、ベイズ更新、探索、自己教師あり学習、メタ学習の組合せ。 |
| アーキテクチャ原語と合成文法 | 13 | attention、再帰、外部記憶、モジュール化、ツール使用などの構成規則。 |
| 計画、信用割当、探索制御 | 11 | 長期報酬、遅延報酬、反事実推論、探索深さの粗い指定。 |
| 記憶・世界モデル・環境インターフェース | 12 | 短期記憶、長期記憶、外部ツール、環境状態更新の写像。 |
| アラインメント・制御制約 | 11 | 目標安定性、指示追従、安全制約、自己改変制約の粗い記述。 |
| スケーリング則・計算資源正規化 | 9 | データ量、モデルサイズ、計算量に対する性能曲線の粗い指数・閾値。 |
| 評価・観測可能性モデル | 8 | ベンチマーク、対話評価、行動評価、反例生成の観測写像。 |
| 抽象化事前分布・不変性 | 6 | 合成性、因果性、圧縮性、対称性などの最小事前仮定。 |
| 合計 | 114 |
固有の注意点
この問題群の $K_{\mathrm{eff}}$ が比較的小さいのは、AGIが簡単であるという意味ではない。人工的な計算系は、物質・生命・社会に比べると観測可能で、再現可能で、記号的に圧縮しやすいため、最小機構モデルの記述長は相対的に短く見積もられる。
ただし、探索上限は依然として大きい。AGIでは、解くべき対象が探索主体そのものを含む。すなわち、モデルが評価を予測し、評価を攻略し、評価の意味を変える。したがって、ここでの困難は外界の長い時定数ではなく、自己参照性、評価の反射性、目標仕様の不安定性に集中している。
エネルギー・材料
採用値:$t=10^{6.4}$ s、$K_{\mathrm{eff}}=120$ bits
内在時スケール
採用した代表プロセスは、「候補材料の合成・構造緩和・物性評価・劣化兆候の検出・モデル更新が一巡する閉ループ材料探索サイクル」である。具体的には、電池材料、触媒、太陽電池材料、熱電材料、構造材料などにおいて、候補組成を作り、測定し、性能と安定性を粗く確認し、次の候補へ移るまでの自然応答を代表させた。
この値は、電子遷移やフォノン応答のようなミクロな時定数ではなく、材料が「有用なマクロ物性」として応答するまでの時間である。材料開発では、量子力学的記述は非常にコンパクトであっても、実際に知りたいのは、欠陥、相分離、界面、粒界、劣化、製造条件を含む有効物性である。Materials Genome Initiative は材料の発見・最適化・展開の時間と費用を下げるためにデータ、モデル、シミュレーション、標準化を統合することを掲げている。材料科学では、こうしたデータ基盤と自動実験・能動学習を組み合わせた閉ループ探索が、分子・材料・システムの発見を加速する枠組みとして位置づけられる。(NIST)
採用しなかった候補は、第一にフェムト秒からナノ秒の電子・分子運動である。これは物理的には内在的だが、材料問題群の可知性を決める律速ではない。第二に、単発合成や単発計算の時間である。これは候補1個の処理時間であり、物性・安定性・製造可能性を含む材料問題の応答時間ではない。第三に、実用化・量産・市場導入までの年単位から十年単位の時間である。これは技術システム・制度・産業投資の時間を含みすぎるため、ここでは社会実装時定数として扱わない。
1年での到達可能性という観点では、約13回の閉ループ探索サイクルが可能である。したがって、仮説空間が十分に圧縮され、測定が自動化され、失敗データが蓄積されるなら、1年以内に有望な材料候補を発見する可能性は高い。一方で、長期安定性や実環境劣化を含む問題では、1か月サイクルの評価は短縮された代理指標にすぎず、真の寿命予測には外挿が必要になる。
$K_{\mathrm{eff}}$ の自由度分解
| 自由度 | bits | 割当根拠 |
|---|---|---|
| 組成・元素族・化学空間 | 18 | 元素の組合せ、化学量論、ドーパント、置換系列を粗く指定する。 |
| 結晶構造・相・微細構造 | 16 | 対称性、相分離、粒界、欠陥、アモルファス性などの粗い構造類型。 |
| 電子・熱力学・輸送記述子 | 14 | バンド構造、自由エネルギー、拡散、導電率などの有効記述子。 |
| 合成プロセス変数 | 15 | 温度、圧力、溶媒、前駆体、焼成、成膜、冷却履歴の離散化。 |
| 作動環境・境界条件 | 12 | 電位、温度、湿度、照射、機械応力などの使用環境。 |
| 目標物性とトレードオフ関数 | 12 | 効率、容量、安定性、コスト、安全性などの多目的最適化。 |
| サロゲートモデル・能動探索方策 | 15 | ベイズ最適化、物理制約付きML、第一原理計算との結合方式。 |
| 劣化・故障・希少失敗モード | 10 | 腐食、界面破壊、相転移、副反応などの粗い失敗分類。 |
| 測定較正・スケール移行 | 8 | 小試料からデバイス、デバイスから実環境への写像。 |
| 合計 | 120 |
固有の注意点
エネルギー・材料では、基礎方程式そのものは比較的短く書ける。問題は、実用物性がミクロ状態の単純な関数ではなく、合成履歴、欠陥、界面、環境、劣化過程によって決まる点にある。
したがって $K_{\mathrm{eff}}$ は、量子力学の記述長ではなく、「どの粗視化変数を残せば有用材料を予測できるか」の記述長である。全原子配置を記述する必要はないが、どの欠陥、どの界面、どの劣化モードを有効自由度として残すかを選ぶ必要がある。この選択が材料問題群固有の難しさである。
細胞生物学
採用値:$t=10^{6.7}$ s、$K_{\mathrm{eff}}=127$ bits
内在時スケール
採用した代表プロセスは、「細胞状態が摂動に応答し、遺伝子発現・シグナル・代謝・エピジェネティック状態を通じて安定した表現型へ移るまでの多世代応答」である。典型的な増殖中ヒト細胞の細胞周期は約24時間とされるが、ここでは単一の細胞分裂ではなく、摂動後に細胞集団として再現性ある状態変化が現れるまでの時間を採用した。(国立生物工学情報センター)
$10^{6.7}$ s、約58日という値は、数十回程度の細胞周期を含む。これは、遺伝子制御ネットワークの短期応答だけでなく、選択、分化、リプログラミング、細胞間相互作用、表現型の安定化を含むためである。
採用しなかった候補は、第一に秒から分単位の分子反応である。これは酵素反応やシグナル伝達の局所時定数であり、細胞生物学的な「解くべき問題」全体を代表しない。第二に約1日の細胞周期である。これは重要な基本単位だが、摂動が安定した細胞状態へ反映されるには短すぎる場合が多い。第三に、疾患進行や個体発生の年単位時スケールである。これは細胞生物学を越えて、組織、個体、臨床、環境の時間を含みすぎる。
1年での到達可能性という文脈では、約6回の自然サイクルがある。細胞培養、オルガノイド、摂動実験、single-cell 測定を組み合わせれば、1年以内に複数回の仮説改訂が可能である。しかし、発生、老化、慢性炎症、がん進化のように、組織環境や長期選択が支配的な問題では、58日サイクルでもなお代理的である。
$K_{\mathrm{eff}}$ の自由度分解
| 自由度 | bits | 割当根拠 |
|---|---|---|
| 粗い細胞状態・表現型多様体 | 16 | 増殖、分化、休眠、ストレス応答、死、代謝状態などの組合せ。 |
| 遺伝子制御モジュールのトポロジー | 18 | 個別遺伝子ではなく、転写因子群・制御モジュール単位で符号化する。 |
| シグナル伝達ネットワーク | 16 | 主要経路、フィードバック、クロストーク、受容体応答の粗い構造。 |
| 代謝・エネルギー制約 | 11 | 代謝経路、栄養条件、酸化還元、ATP制約の低次元記述。 |
| エピジェネティック・クロマチン状態 | 13 | 開閉状態、ヒストン修飾、DNAメチル化、記憶効果の粗視化。 |
| 空間構造・細胞内区画・組織文脈 | 13 | オルガネラ、極性、細胞接着、近傍細胞との相互作用。 |
| 摂動・介入写像 | 14 | CRISPR、薬剤、リガンド、環境変化が状態へ及ぼす写像。 |
| 観測モデル | 10 | RNA-seq、proteomics、imaging、レポーター系のノイズとバイアス。 |
| 時間遅れ・非線形スイッチング | 7 | 遅延、閾値、ヒステリシス、発振の粗い指定。 |
| 細胞間不均一性・確率性 | 6 | クローン差、状態揺らぎ、測定時点のばらつき。 |
| 合計 | 127 |
固有の注意点
細胞生物学では、全ゲノムを記述することは $K_{\mathrm{eff}}$ の目的ではない。重要なのは、どの遺伝子群が支配変数として残り、どの細胞状態が安定な attractor として扱えるかである。
この問題群では、観測問題が特に重要である。single-cell 測定は高次元だが、測定は破壊的で、時系列の同一細胞追跡が難しく、観測ノイズも大きい。さらに、細胞は観測や摂動によって状態を変えるため、観測写像と介入写像を分離しにくい。したがって $K_{\mathrm{eff}}$ には、生命現象そのものの複雑性だけでなく、観測可能な代理変数を選ぶ困難も含まれる。
パンデミック対策
採用値:$t=10^{7.0}$ s、$K_{\mathrm{eff}}=131$ bits
内在時スケール
採用した代表プロセスは、「新規病原体の検出から、伝播評価、診断、ワクチンまたは治療介入、社会的応答までが一巡する感染症対策サイクル」である。$10^7$ s、約116日は、CEPI が掲げる「新たなパンデミック脅威の同定から100日以内に安全で有効なワクチンを初期承認・製造規模へ到達させる」という100 Days Missionに近い。(CEPI)
この時スケールは、ウイルス複製や個人内感染過程の短い時間ではなく、病原体、宿主免疫、社会行動、医療供給、政策判断が結合した最小の対策応答時間である。パンデミック対策では、自然過程と社会過程が分離できない。感染は生物現象だが、接触率、検査、隔離、ワクチン受容、医療逼迫は社会的に変化する。
採用しなかった候補は、第一に病原体複製や個人の発症までの短い時スケールである。これは感染症の局所過程としては重要だが、パンデミック対策全体の可知性を代表しない。第二に、流行曲線の短期的な倍加・減衰時間である。これは対策が変わるとただちに変化するため、内在時スケールとして安定しない。第三に、完全なワクチン普及、免疫持続、社会経済回復までの年単位時スケールである。これは対策問題を越えて制度・供給網・政治経済の時定数を含む。
1年での到達可能性という観点では、約3回の対策サイクルがある。これは、1年以内に複数回の病原体評価・介入設計・政策修正が可能であることを意味する。しかし、初動の失敗は後続サイクルで完全には取り戻せない。パンデミック問題群では、可知性は「後から正しく説明できるか」ではなく、「流行が指数的に拡大する前に十分に知れるか」によって決まる。
$K_{\mathrm{eff}}$ の自由度分解
| 自由度 | bits | 割当根拠 |
|---|---|---|
| 病原体ファミリー・宿主域・抗原構造 | 17 | 病原体の分類、侵入経路、抗原地図、既存免疫との関係。 |
| 伝播カーネル・接触不均一性 | 16 | 基本再生産数だけでなく、過分散、場面別接触、superspreading を含む。 |
| 免疫応答・ワクチン相関指標 | 15 | 中和抗体、細胞性免疫、免疫持続、重症化予防の粗いモデル。 |
| 監視・診断の観測モデル | 12 | 検査感度、報告遅延、サンプリング偏り、ゲノム監視の粗い指定。 |
| 介入ポートフォリオと投入時点 | 14 | ワクチン、治療薬、検査、換気、隔離、行動制限の組合せ。 |
| 移動・接触ネットワーク・行動変容 | 16 | 都市間移動、家庭・学校・職場、リスク認知による接触変化。 |
| 臨床重症度・医療容量 | 12 | 年齢層別重症化、病床、医療従事者、治療アクセスの粗視化。 |
| 変異・免疫逃避・進化動態 | 13 | 抗原変化、薬剤耐性、選択圧、系統置換のモデル。 |
| リスクコミュニケーション・遵守 | 8 | 情報伝達、信頼、反発、誤情報の粗い行動変数。 |
| 供給・製造・規制の制約 | 8 | ワクチン製造能力、流通、承認、国際配分の粗い制約。 |
| 合計 | 131 |
固有の注意点
パンデミック対策は、反射性を持つ生物社会システムである。モデルが公表されると、人々の行動が変わり、行動が変わるとモデルの前提が変わる。したがって、伝播モデルの精度だけでは可知性は決まらない。
また、病原体は進化し、社会は疲弊し、政策は政治化される。ここでの $K_{\mathrm{eff}}$ は、病原体の遺伝情報だけでなく、人間社会の応答を含む最小記述である。ただし社会制度全体ほど長い時スケールではなく、流行対策に必要な範囲へ圧縮しているため、社会システム・制度よりは小さい値に置かれる。
物理学フロンティア
採用値:$t=10^{7.3}$ s、$K_{\mathrm{eff}}=143$ bits
内在時スケール
採用した代表プロセスは、「大型観測・大型実験において、統計的に意味のあるデータ取得、背景推定、解析、異常検出、理論仮説の更新が一巡する研究シーズン」である。対象は単一の粒子衝突や単一の天体観測ではなく、素粒子、宇宙論、重力、量子基礎などのフロンティア問題における「可観測な現象集合」である。
素粒子衝突そのものは極めて短い時定数を持つ。しかし、フロンティア物理で「知る」ためには、希少事象の統計、検出器応答、背景事象、系統誤差、理論モデルとの照合が必要である。LHC では毎秒膨大な衝突が起こるが、そのすべてを読み出すことはできず、trigger による選別と大量データ処理が不可欠である。また Run 3 のようなデータ取得期間や長期停止期間は、物理フロンティアの知識更新が装置運用の季節性・年周期性を持つことを示している。(CERN)
宇宙論側でも、たとえば Euclid のような観測計画は、複数年の観測と段階的データリリースを通じて可知性を高める。Euclid は6年以上の主観測・データリリース計画を持つため、単一観測ではなく、検証されたデータ集合の蓄積が問題の時定数を決める。(euclid.caltech.edu)
採用しなかった候補は、第一にプランク時間、粒子寿命、散乱時間のようなミクロ物理時定数である。これらは対象現象の物理時定数ではあるが、可知性マップにおける「問題群の応答時間」ではない。第二に、個別実験ショットや観測露光の時間である。これは十分な統計と系統誤差評価を欠く。第三に、加速器建設、望遠鏡建設、検出器開発の十年単位時スケールである。これは前提Bで除くべきセットアップ・インフラ時間を含む。
1年での到達可能性という観点では、約1.6サイクルである。AGIが理論候補を大量に生成できても、フロンティア物理では、自然または大型装置が十分な反例を返す回数が少ない。したがって、1年以内に到達可能なのは、既存データの再解析、異常の再解釈、理論空間の圧縮、実験提案の最適化であり、新しい決定的実験が必要な問題では時間軸が律速となる。
$K_{\mathrm{eff}}$ の自由度分解
| 自由度 | bits | 割当根拠 |
|---|---|---|
| 対象存在論・対称性・場の内容 | 18 | 粒子、場、対称性、保存量、破れ方の粗い理論選択。 |
| パラメータ・結合定数構造 | 17 | 質量、結合、混合、スケール、相互作用強度の粗い離散化。 |
| 有効理論・レジーム接続・繰り込み | 15 | 低エネルギー有効理論と高エネルギー記述の接続。 |
| 観測量・検出器写像 | 14 | 理論変数から検出器信号・天文観測量への写像。 |
| 背景・系統誤差・ノイズ | 14 | 背景事象、装置バイアス、選択効果、解析系統の記述。 |
| 異常分類・モデル選択事前分布 | 13 | 新粒子、暗黒物質、重力修正、標準模型内効果などの候補分類。 |
| 宇宙論・天体物理的境界条件 | 12 | 初期条件、距離尺度、銀河形成、観測窓の粗い指定。 |
| シミュレーション・推論戦略 | 12 | Monte Carlo、ベイズ推定、尤度近似、サロゲートモデルの選択。 |
| trigger・選別・統計的停止規則 | 10 | どの事象を残し、どの有意性で判断するかの規則。 |
| 数学的一貫性制約 | 8 | ユニタリ性、因果性、ゲージ不変性、安定性などの制約。 |
| UV完成・代替機構 | 10 | 現象論的モデルを越える高エネルギー側の候補類型。 |
| 合計 | 143 |
固有の注意点
物理学フロンティアの特徴は、理論記述が非常に短くなりうる一方で、検証可能性が極めて高価になる点にある。標準模型や一般相対論のように、短い方程式が広範な現象を支配する例があるため、$K_{\mathrm{eff}}$ は対象宇宙の全情報量に比べれば小さい。しかし、どの観測量が理論を分けるか、どの異常が実在するか、どの背景を除けるかを記述するには大きな有効自由度が必要になる。
また、物理学フロンティアでは「未観測であること」が情報になる。これは通常のデータ駆動科学よりもモデル選択を難しくする。探索すべき仮説空間は数学的には圧縮可能だが、実験的に到達できる領域は限られる。このため、$K_{\mathrm{eff}}=143$ は、理論の複雑さと観測写像の複雑さを合わせた値として置かれる。
脳・認知・意識
採用値:$t=10^{7.5}$ s、$K_{\mathrm{eff}}=137$ bits
内在時スケール
採用した代表プロセスは、「人間または動物の認知状態が、学習・経験・介入を通じて、神経回路、行動、主観報告の三者にまたがる安定した変化として観測されるまでの縦断的時スケール」である。$10^{7.5}$ s、ほぼ1年を代表値とした。
ニューロンの発火はミリ秒単位であり、感覚処理や運動制御は秒以下でも進む。しかし、脳・認知・意識の問題群で「解く」べき対象は、単一発火や局所回路ではなく、知覚、記憶、学習、自己、報告可能性、意識状態、発達差、個人差を含む統合的機構である。人間の神経可塑性研究では、数か月の訓練によって白質微細構造の変化を調べる縦断研究が行われており、短期の神経活動と長期の認知変化の間に大きな時間差がある。(Frontiers)
採用しなかった候補は、第一にミリ秒のスパイク時定数である。これは脳の情報処理単位としては重要だが、認知・意識の可知性を代表しない。第二に秒単位の BOLD 応答や行動反応時間である。これは観測装置または課題反応の時定数であり、機構の安定化時間ではない。第三に睡眠・概日リズムの1日単位である。これは状態変調として重要だが、学習・自己・意識の機構モデル全体を代表するには短い。第四に発達・老化の十年単位である。これは脳の重要な時間軸だが、1年での可知性評価には長すぎる。
1年での到達可能性という観点では、ほぼ1サイクルである。したがって、脳・認知・意識は「1年で検証できるかどうか」の境界にある。AGIは既存データの統合、実験設計、モデル比較を大幅に高速化できるが、人間被験者の縦断的変化、倫理的制約、再現性確認は自然時間を必要とする。
$K_{\mathrm{eff}}$ の自由度分解
| 自由度 | bits | 割当根拠 |
|---|---|---|
| 神経状態変数の階層 | 17 | スパイク、局所回路、脳領域、ネットワーク、全脳状態の粗い接続。 |
| 認知潜在変数・課題文法 | 15 | 注意、記憶、推論、情動、自己、言語報告などの潜在構造。 |
| 学習・可塑性ダイナミクス | 15 | シナプス可塑性、強化学習、予測誤差、習慣化、発達的変化。 |
| 知覚・行動・身体性ループ | 12 | 身体、環境、行為、感覚フィードバックの閉ループ構造。 |
| 意識アクセス・報告モデル | 16 | 主観報告、アクセス意識、注意、覚醒、自己モデルの対応関係。 |
| connectome・モジュールトポロジー | 14 | 領域間結合、ハブ、階層性、機能的ネットワークの粗い構造。 |
| 神経修飾・情動・恒常性 | 12 | ドーパミン、セロトニン、覚醒、ストレス、身体内部状態。 |
| 観測写像・測定ノイズ | 11 | EEG、fMRI、行動、主観報告、侵襲計測の対応とノイズ。 |
| 個人差・発達差 | 10 | 年齢、経験、疾患、遺伝的背景、文化差の粗い補正。 |
| 因果介入レパートリー | 9 | 薬理、刺激、訓練、病変、BCIなどの介入写像。 |
| 意味・規範・解釈ブリッジ | 6 | 「理解」「意識」「自己」などの概念を操作化する最小規則。 |
| 合計 | 137 |
固有の注意点
脳・認知・意識の $K_{\mathrm{eff}}$ は、細胞生物学より大きく、社会制度より小さい。これは、脳が多階層の生物系でありながら、個体内に閉じた比較的安定した物理基盤を持つためである。
最大の注意点は、観測対象と報告主体が同一であることだ。意識研究では、主観報告を使わざるをえないが、報告は意識状態の一部でもある。したがって、観測写像は中立的な外部測定ではない。また、「意識」や「理解」は概念そのものの定義が争点になるため、$K_{\mathrm{eff}}$ には経験科学だけでなく、操作化の記述長も含まれる。
地球環境・気候
採用値:$t=10^{8.4}$ s、$K_{\mathrm{eff}}=151$ bits
内在時スケール
採用した代表プロセスは、「海洋・大気・陸面・氷床・生態系・炭素循環が結合した近未来気候応答、特に数年から十年程度の内部変動とモデル検証サイクル」である。$10^{8.4}$ s は約7〜8年のオーダーであり、ENSOや近未来気候予測の時間幅に対応させた。
NOAA は El Niño と La Niña を ENSO サイクルとして説明し、典型的なエピソードは9〜12か月続きうる一方、事象は平均して2〜7年程度の間隔で生じるとしている。また、気候影響や適応を考えるうえでは、季節変動より長い数年から十年程度の近未来予測が重要な時間幅になる。したがって、気候問題群の代表時スケールは日々の天気ではなく、数年から十年程度の結合系応答として置くのが自然である。(ナショナルオーシャンサービス)
採用しなかった候補は、第一に数日から十数日の天気予報時定数である。これは大気の短期カオスを代表するが、気候問題群の可知性を代表しない。第二に季節周期である。これは重要な外部周期だが、海洋・炭素循環・氷床・生態系フィードバックを含むには短い。第三に、深海、氷床、海面上昇、炭素循環の世紀から千年単位の応答である。これは気候システムの長期不可逆性を表すが、1年での到達可能性を評価する地図では長すぎる。
1年での到達可能性という観点では、自然サイクルは約0.13回、すなわち1年では代表サイクルの一部しか観測できない。AGIは気候モデルの高速化、データ同化、サロゲートモデル、観測設計、極端現象のリスク評価を進めうる。しかし、実地球を複数回走らせることはできない。したがって、気候問題群では「1年以内の可知性」は、観測済みデータ、古気候データ、物理モデル、アンサンブルの統合による外挿に強く依存する。
$K_{\mathrm{eff}}$ の自由度分解
| 自由度 | bits | 割当根拠 |
|---|---|---|
| 流体力学・熱力学の力学コア | 18 | 大気・海洋方程式、離散化、保存則、乱流近似の粗い選択。 |
| 海洋大気結合モード | 18 | ENSO、モンスーン、AMOC、十年変動などの結合モード。 |
| 雲・エアロゾル・放射パラメタリゼーション | 17 | サブグリッド雲、降水、エアロゾル、放射収支の有効記述。 |
| 陸面・雪氷圏・植生・炭素循環 | 17 | 土壌水分、氷床、永久凍土、生態系、炭素吸収の粗いモデル。 |
| forcing・排出・土地利用境界条件 | 14 | 温室効果ガス、エアロゾル、土地利用、火山、太陽変動の入力。 |
| 初期条件・データ同化 | 13 | 観測データ、再解析、海洋初期値、同化誤差の記述。 |
| 地域ダウンスケーリング・極端現象 | 14 | 熱波、豪雨、干ばつ、台風、地域影響の粗視化。 |
| 不確実性階層・アンサンブル重み | 12 | 内部変動、モデル構造差、シナリオ差の分解。 |
| 古気候・観測制約 | 11 | 過去気候、氷床コア、年輪、衛星、観測系列との接続。 |
| tipping・閾値・不可逆性 | 10 | 氷床崩壊、森林枯死、循環変化などの閾値候補。 |
| 最小限の社会経済境界 | 7 | 緩和・適応を含める場合の排出行動・土地利用の粗い外生化。 |
| 合計 | 151 |
固有の注意点
気候問題群では、基礎方程式の記述長よりも、粗視化とサブグリッド過程の記述長が支配的である。雲、エアロゾル、生態系、氷床、土地利用は、短い方程式から単純には消去できない。
また、地球は一つしかなく、厳密な反復実験ができない。観測は長期系列だが、非定常な forcing のもとで得られるため、同じ条件での再試行ではない。このため $K_{\mathrm{eff}}=151$ は、物理モデルの複雑性だけでなく、観測制約、初期条件、構造不確実性、不可逆的フィードバックの記述長を含む。
社会システム・制度
採用値:$t=10^{8.9}$ s、$K_{\mathrm{eff}}=158$ bits
内在時スケール
採用した代表プロセスは、「制度、規範、インセンティブ、信頼、組織、政治的連合が相互に適応し、社会的期待として安定化または崩壊するまでの世代未満・数十年程度の制度変化サイクル」である。ここでの対象系は、単発の選挙、政策、価格変動、SNS上の意見変化ではなく、それらを吸収しながら持続する制度的配置である。
制度研究では、制度が経済・社会パフォーマンスに影響し、制度変化が過去から現在・未来への経路依存性を持つことが古典的に論じられてきた。また、文化、価値、信念、社会規範のようにゆっくり変化する制度的要素と、政治制度や政策のように比較的短い周期で変わりうる要素を区別する枠組みもある。(Cambridge University Press & Assessment)
採用しなかった候補は、第一に市場価格、SNS拡散、ニュース反応の分から日単位の時スケールである。これは表層的反応であり、制度の安定化・変質を代表しない。第二に、選挙周期や予算周期の数年単位である。これは制度変化の重要な駆動因だが、規範、信頼、組織能力、利害連合の変化には短すぎる。第三に、人口動態や文明史の半世紀から世紀単位である。これは制度変化の上位背景として重要だが、1年での可知性評価には長すぎる。
1年での到達可能性という観点では、自然サイクルは約0.04回である。つまり1年は、制度変化サイクルのごく一部にすぎない。AGIは制度設計のシミュレーション、過去事例の統合、政策効果の推定、因果推論を支援できる。しかし、社会がその制度を学習し、期待を変え、抜け道を作り、反応し、再制度化するには自然時間がかかる。社会システム・制度は、可知性マップの中で最も右側に置かれる。
$K_{\mathrm{eff}}$ の自由度分解
| 自由度 | bits | 割当根拠 |
|---|---|---|
| 行為者類型・選好・信念 | 16 | 個人、企業、国家、官僚、集団の目的・信念・期待の粗い分類。 |
| ネットワーク・制度トポロジー | 16 | 組織間関係、階層、連邦制、市場、共同体、国際関係の接続構造。 |
| 公式ルール・法制度空間 | 13 | 法、規制、権限配分、執行可能性、手続きの粗い符号化。 |
| 非公式規範・文化・信頼 | 15 | 慣習、評判、社会的制裁、信頼、正統性の低次元記述。 |
| 経済的インセンティブ・市場機構 | 14 | 価格、税、補助金、所有権、契約、外部性の粗いモデル。 |
| 情報・メディア・協調ダイナミクス | 13 | 情報拡散、誤情報、議題設定、集団極性化、協調失敗。 |
| 権力・連合・集合行為 | 14 | 政治的連合、拒否権プレイヤー、ロビー、社会運動、暴力装置。 |
| 学習・適応・反射性 | 15 | 政策に対する戦略的適応、制度の抜け道、予期、自己成就。 |
| 異質性・人口動態・分配 | 12 | 階層、地域、世代、所得、教育、移民、人口構成。 |
| ショック・危機・経路依存 | 11 | 戦争、災害、技術変化、金融危機、革命、歴史的慣性。 |
| 測定・代理変数・因果識別 | 10 | GDP、幸福度、信頼、制度品質、政策効果推定の観測問題。 |
| 規範目的・社会厚生基準 | 9 | 効率、公平、自由、安定、持続可能性など目的関数の選択。 |
| 合計 | 158 |
固有の注意点
社会システム・制度の $K_{\mathrm{eff}}$ が最大になる理由は、データ量が最大だからではない。むしろ、対象系が自己解釈的で反射的だからである。人間はモデルを読み、制度を予期し、ルールを回避し、規範を再解釈し、政策の意味を変える。したがって、社会制度のモデルは、対象の行動だけでなく、対象がモデルをどう理解するかまで含まざるをえない。
さらに、社会制度では「解く」の意味が規範的である。何を最適化するのか、誰にとって望ましいのか、短期効率と長期安定性をどう配分するのかが、モデルの外部に置けない。このため、$K_{\mathrm{eff}}$ には、因果機構だけでなく、目的関数そのものの記述長も含めている。
全体の配置に関する補足
この8問題群の順序は、単純な「難しさ」の順ではない。横軸は対象系が実際に応答する自然時間を表し、縦軸はその問題を可知にする最小機構モデルの記述長を表す。
AGI理論・計算知能は、短時間で反復できるが、自己参照性を持つ。エネルギー・材料は、物理法則は圧縮的だが、欠陥・界面・劣化が支配する。細胞生物学は、ゲノム全体ではなく制御モジュールの選択が本質である。パンデミック対策は、生物過程と社会過程の反射的結合で決まる。物理学フロンティアは、理論は短くても検証写像が長い。脳・認知・意識は、観測対象と報告主体が重なる。気候は、単一地球・非定常 forcing・長期フィードバックが制約となる。社会システム・制度は、モデルを知った行為者がモデルの前提を変えるため、最大の反射性を持つ。
したがって、可知性マップの縦バーは「知識量」ではなく、「最短機構記述から総当たり探索までの幅」を表す。下端の $O(K_{\mathrm{eff}})$ は、正しい機構変数がすでに与えられた場合の情報理論的下限である。上端の $O(2^{K_{\mathrm{eff}}})$ は、その機構変数自体を探索しなければならない場合の Levin 探索的上限である。実際の科学はこの間にあり、AGIの役割は、縦バーの上端に近い盲目的探索を、下端に近い構造化探索へどれだけ押し下げられるかにある。