情報幾何学とAIの統一視点

TIP

続編に「情報幾何学とAIの動態論」を予定しています。

情報幾何学とAIの統一視点

深層学習の歴史で紐解く、超球面上の「プラネタリウム」構築論

概要

深層学習を幾何で統べる全15回講義。
従来のユークリッド空間から、nGPTや双曲多様体が示す「曲がった空間」へのパラダイムシフト。
MoEやTDA等の最新知見を交え、手法の陳腐化に抗う普遍的な「空間の形」を探る。
平坦な地図を捨て、AIの星空を読み解く旅へ。

目次

イントロ

リンク	説明
重要な前提と制約	比喩と厳密性の関係や条件付き主張の扱いを整理する。概念と実装のギャップを最初に共有する。
キーワード集	各回のキーワードを整理したもの
参考文献

第0部：準備と地図

回	リンク	概要	キーワード
0	幾何学という言語～この講義の羅針盤～	多様体・測地線・曲率などの最小限の道具を導入する。全体像の地図と視点を揃える。	(リーマン)多様体, 測地線, 曲率

第1部：平坦な世界の限界と「コペルニクス的転回」

回	リンク	概要	キーワード
1	かつての地図～平らな世界で戦っていた私たち～	古典的手法が前提としていたユークリッド空間観を振り返る。見落とされた構造の兆しを掘り起こす。	ユークリッド空間, PCA, Isomap, LLE, SVM, LDA, PMI, TF-IDF, 分布仮説
2	ノルムの呪い～意味と不確実性の未分化～	ノルムが担っていた複数の意味が混線していた背景を整理する。高次元の直交性が持つ効用にも触れる。	ノルムの三重の意味, ハブ化, 距離の集中
3	プラネタリウムの建設～極座標へのパラダイムシフト～	角度中心の設計へ移る必然を説明する。球面上の分布や正規化の実装的注意点も扱う。	nGPT, 球面制約, vMF分布, 測地線距離

第2部：統一的視点への接続

回	リンク	概要	キーワード
4	分類の再統一 I ～Softmaxと情報幾何学～	Softmaxを確率多様体の写像として読み直す。自然勾配や温度の意味づけを整理する。	確率単体, 自然勾配, フィッシャー情報行列, CRF
5	分類の再統一 II ～マージンの幾何学～	角度マージンの直感をSVM的視点と接続する。ArcFaceの設計意図と数値安定性を確認する。	最大マージン原理, 角度マージン, ArcFace
6	Transformerという測量士～動的な接続～	Attentionを動的な空間変形として捉え直す。正規化条件の有無で解釈が変わる点を強調する。	Scaled Dot-Product, Cosine Attention, RoPE
7	不確実性の復権～Variance Matters～	点表現から分布表現への移行を議論する。不確実性を持つ表現が何を可能にするかを示す。	vMF分布, 集中度, OOD検知, VAE, 無知の捏造によるハルシネーション

第3部：時間とダイナミクス

回	リンク	概要	キーワード
8	時間の発見～一撃からの脱却～	生成をプロセスとして捉える必然を解説する。時間軸が表現に与える構造的効果を見る。	残差接続 (ResNet), Neural ODE, ベクトル場
9	拡散と凝縮～熱力学との融合～	拡散モデルとSDE/ODEの対応を整理する。ノイズから意味が立ち上がる過程を描く。	スコア関数, ランジュバン動力学, Flow Matching
10	思考の連鎖～推論の軌跡～	推論過程を幾何学的な軌跡として扱う。Chain of Thoughtの利点と限界も確認する。	Chain of Thought, 推論の結び目

第4部：マルチモーダルと拡張幾何学

回	リンク	概要	キーワード
11	感覚の統合～異種多様体の結婚～	異なるモダリティの空間をどう接続するかを考える。統合のための幾何学的条件を整理する。	マルチモーダル整列, CLIP, FEDA, 概念の直交性
12	双曲幾何学～負の曲率の世界～	階層構造に適した空間の選び方を学ぶ。球面では表現しづらい構造を示す。	負の曲率, ポアンカレ円板, 階層的埋め込み

第5部：未来と哲学

回	リンク	概要	キーワード
13	高次元の深淵～幾何学的な恐怖と祝福～	高次元の集中現象とスパース性を両面から扱う。MoEの設計思想への接続も行う。	次元の呪い, 距離の集中, 内在次元
14	トポロジーという顕微鏡～穴とループの発見～	形ではなく構造を測る視点を導入する。TDAが表現学習に与える示唆を整理する。	持続的ホモロジー, パーシステンス図, TDA
15	次の時代を設計する	これまでの視点を統合し、未来の設計課題を提示する。ワークショップの意図と問いをまとめる。	多様体の純度, 幾何学的帰納バイアス

Appendix

回	リンク	概要	キーワード
A1	量子化の幾何学	量子化の幾何学的解釈を補足する。講義本編の議論を補完する目的で、背景と直感をまとめる。	量子化, PTQ, QAT
A2	多様体の純度問題: 幾何学がまだ解けていない課題	幾何学が解けない「真偽」の限界と、続編「動態論」への接続。	純度, EL2Nスコア, Influence Functions, 誤信念の表出によるハルシネーション
A3	動的剪定の幾何学: 柔軟な回路がもたらす知能	「動的剪定」で繋ぐAttentionとMoE	動的剪定, ルーティング, MoE
A4	空間の「物差し」再考: 2点間から情報の密度まで	距離、非対称性、密度で測る「情報の地形」	内積, KLダイバージェンス, フィッシャー情報行列
A5	情報幾何学における双対構造：2種類のまっすぐ	確率の世界は平らではなく「歪んでいる」ため、普通の定規では測れない。	$α$ -接続, e-接続, m-接続, 双対平坦空間
A6	特異点の幾何学: AIはなぜ汎化するのか	学習の停滞、相転移、そして汎化の根本原理を理解するのに必要な幾何の紹介。	特異モデル, 正則モデル, 特異学習理論 (SLT), 特異点, 相転移, 特異点解消

制作

以下に主担当を示す。

企画・統括: 林部祐太
執筆: Claude
主査読: ChatGPT
副査読・インサイトコンサル: Gemini

WARNING

誤りを含めないように努めましたが、鵜呑みにせず慎重に検討しながらお読みください。