Skip to content
情報幾何学とAIの統一視点

TIP

続編に「情報幾何学とAIの動態論」を予定しています。

情報幾何学とAIの統一視点

深層学習の歴史で紐解く、超球面上の「プラネタリウム」構築論

概要

深層学習を幾何で統べる全15回講義。
従来のユークリッド空間から、nGPTや双曲多様体が示す「曲がった空間」へのパラダイムシフト。
MoEやTDA等の最新知見を交え、手法の陳腐化に抗う普遍的な「空間の形」を探る。
平坦な地図を捨て、AIの星空を読み解く旅へ。

目次

イントロ

リンク説明
重要な前提と制約比喩と厳密性の関係や条件付き主張の扱いを整理する。概念と実装のギャップを最初に共有する。
キーワード集各回のキーワードを整理したもの
参考文献

第0部:準備と地図

リンク概要キーワード
0幾何学という言語 ~この講義の羅針盤~多様体・測地線・曲率などの最小限の道具を導入する。全体像の地図と視点を揃える。(リーマン)多様体, 測地線, 曲率

第1部:平坦な世界の限界と「コペルニクス的転回」

リンク概要キーワード
1かつての地図 ~平らな世界で戦っていた私たち~古典的手法が前提としていたユークリッド空間観を振り返る。見落とされた構造の兆しを掘り起こす。ユークリッド空間, PCA, Isomap, LLE, SVM, LDA, PMI, TF-IDF, 分布仮説
2ノルムの呪い ~意味と不確実性の未分化~ノルムが担っていた複数の意味が混線していた背景を整理する。高次元の直交性が持つ効用にも触れる。ノルムの三重の意味, ハブ化, 距離の集中
3プラネタリウムの建設 ~極座標へのパラダイムシフト~角度中心の設計へ移る必然を説明する。球面上の分布や正規化の実装的注意点も扱う。nGPT, 球面制約, vMF分布, 測地線距離

第2部:統一的視点への接続

リンク概要キーワード
4分類の再統一 I ~Softmaxと情報幾何学~Softmaxを確率多様体の写像として読み直す。自然勾配や温度の意味づけを整理する。確率単体, 自然勾配, フィッシャー情報行列, CRF
5分類の再統一 II ~マージンの幾何学~角度マージンの直感をSVM的視点と接続する。ArcFaceの設計意図と数値安定性を確認する。最大マージン原理, 角度マージン, ArcFace
6Transformerという測量士 ~動的な接続~Attentionを動的な空間変形として捉え直す。正規化条件の有無で解釈が変わる点を強調する。Scaled Dot-Product, Cosine Attention, RoPE
7不確実性の復権 ~Variance Matters~点表現から分布表現への移行を議論する。不確実性を持つ表現が何を可能にするかを示す。vMF分布, 集中度, OOD検知, VAE, 無知の捏造によるハルシネーション

第3部:時間とダイナミクス

リンク概要キーワード
8時間の発見 ~一撃からの脱却~生成をプロセスとして捉える必然を解説する。時間軸が表現に与える構造的効果を見る。残差接続 (ResNet), Neural ODE, ベクトル場
9拡散と凝縮 ~熱力学との融合~拡散モデルとSDE/ODEの対応を整理する。ノイズから意味が立ち上がる過程を描く。スコア関数, ランジュバン動力学, Flow Matching
10思考の連鎖 ~推論の軌跡~推論過程を幾何学的な軌跡として扱う。Chain of Thoughtの利点と限界も確認する。Chain of Thought, 推論の結び目

第4部:マルチモーダルと拡張幾何学

リンク概要キーワード
11感覚の統合 ~異種多様体の結婚~異なるモダリティの空間をどう接続するかを考える。統合のための幾何学的条件を整理する。マルチモーダル整列, CLIP, FEDA, 概念の直交性
12双曲幾何学 ~負の曲率の世界~階層構造に適した空間の選び方を学ぶ。球面では表現しづらい構造を示す。負の曲率, ポアンカレ円板, 階層的埋め込み

第5部:未来と哲学

リンク概要キーワード
13高次元の深淵 ~幾何学的な恐怖と祝福~高次元の集中現象とスパース性を両面から扱う。MoEの設計思想への接続も行う。次元の呪い, 距離の集中, 内在次元
14トポロジーという顕微鏡 ~穴とループの発見~形ではなく構造を測る視点を導入する。TDAが表現学習に与える示唆を整理する。持続的ホモロジー, パーシステンス図, TDA
15次の時代を設計するこれまでの視点を統合し、未来の設計課題を提示する。ワークショップの意図と問いをまとめる。多様体の純度, 幾何学的帰納バイアス

Appendix

リンク概要キーワード
A1量子化の幾何学量子化の幾何学的解釈を補足する。講義本編の議論を補完する目的で、背景と直感をまとめる。量子化, PTQ, QAT
A2多様体の純度問題: 幾何学がまだ解けていない課題幾何学が解けない「真偽」の限界と、続編「動態論」への接続。純度, EL2Nスコア, Influence Functions, 誤信念の表出によるハルシネーション
A3動的剪定の幾何学: 柔軟な回路がもたらす知能「動的剪定」で繋ぐAttentionとMoE動的剪定, ルーティング, MoE
A4空間の「物差し」再考: 2点間から情報の密度まで距離、非対称性、密度で測る「情報の地形」内積, KLダイバージェンス, フィッシャー情報行列
A5情報幾何学における双対構造:2種類のまっすぐ確率の世界は平らではなく「歪んでいる」ため、普通の定規では測れない。α -接続, e-接続, m-接続, 双対平坦空間
A6特異点の幾何学: AIはなぜ汎化するのか学習の停滞、相転移、そして汎化の根本原理を理解するのに必要な幾何の紹介。特異モデル, 正則モデル, 特異学習理論 (SLT), 特異点, 相転移, 特異点解消

制作

以下に主担当を示す。

WARNING

誤りを含めないように努めましたが、鵜呑みにせず慎重に検討しながらお読みください。