情報幾何学におけるダイバージェンス
この記事は、6/21に書いた記事を清書したものです。
◇概要
情報幾何学は、確率分布を統計多様体上の点とみなし、統計多様体の幾何的な性質を解析する学問である。統計多様体が双対平坦な場合には、確率分布間の「距離の2乗」に該当する正準ダイバージェンスを導入することができる。3つの確率分布および、正準ダイバージェンスに対し、余弦定理に対応する三角関係式が成り立つことが知られている。特殊な場合において、三角関係式は拡張ピタゴラスの定理に帰着し、射影に関して基礎的な定理となる。
本記事では、三角関係式を用いて、主に二つの性質を示す。
まず、正準ダイバージェンスから新しいダイバージェンス(幾何ダイバージェンス(仮称)を導入し、正準ダイバージェンス、幾何ダイバージェンスともに、2つのアファイン座標の測地線上で、単調性を有することを示す。
次に、確率分布同士の「ベクトル和」演算を導入し、4つの確率分布が「平行四辺形」の頂点上にあるとき、幾何ダイバージェンスに対して、平行四辺形の法則(中線定理)が成り立つことを示す。
◇基本的な定義[1]
を統計多様体におけるアファイン座標、をその双対座標(期待値座標)とする。
統計多様体の二点, を考え、の座標を, の座標をとする。
このとき、二点間の正準ダイバージェンスを
で定義する。
上付き添え字、下付き添え字がペアで現れたときは、の記号を省略するものとする。(Einsteinの縮約規則)
, はポテンシャルであり、互いにLegendre変換の関係にある。即ち、
以下では、を, をのように略記する。
は次の関係式を満たす。
, , ,
ここで、はFisher情報量から導出されるRiemann計量とする。
指数型分布族の場合、おおむねは負の自由エネルギーを表し、は負のエントロピーを表す。
詳細は参考文献[1]を参照のこと。
◇幾何ダイバージェンスの定義
と定義し、を幾何ダイバージェンスと呼ぶことにする。
幾何ダイバージェンスは、Euclid空間のL2ノルムと類似した性質を示す(後述)。
定義から、幾何ダイバージェンスは点p,qに対し対称である。
また、指数型分布族に対しては、幾何ダイバージェンスは、Kullbalk-Leiblerダイバージェンスの対称和にほぼ一致する。
命題1.
幾何ダイバージェンスは、アファイン座標を用いてと表される。
また、であり、となるのは、のみである。
証明
正準ダイバージェンスの三角関係式
において、と置くことで、を得る。
後半は、正準ダイバージェンスが(等号成立はのみ)から従う。
Riemann空間における微小距離の2乗はと書けることから、幾何ダイバージェンスも距離の2乗のような振る舞いをすると予想される。
◇測地線における単調性
正準ダイバージェンス、幾何ダイバージェンスとも測地線の方向ベクトルに対し、単調増加関数となる。これは、距離において望まれる性質である。
定理 1.
正準ダイバージェンスは、pを固定し、qをもしくは、-測地線に沿って動かした場合、測地線の方向ベクトルに対し、単調増加関数となる。
qを固定してpを動かした場合も同様である。
証明
を用いる。
-測地線の場合、と書けるので、
(1)を用いると、
右辺は、計量の正定値性より、tの符号と一致する。よって、単調性が示せた。
-測地線は、と書ける。(2)より、
となる。
命題1より、であるから、右辺はtの符号と一致し、単調性が示せた。
系1.
◇内積、ベクトル和の定義
系2. (余弦定理の拡張)
定理 2.(ベクトル和の公式)
系3.(平行四辺形の定理の拡張)
References
[1]甘利 俊一, "情報幾何とその応用"