
Screenshot
ジョルダン測度からルベーグ測度への発展は、
ダブりを許容してでも漏れは許さない
みたいなものでもあるけど、確率計算において確率空間・解空間を考える上で、
『誤差』
をどう考えるかは常に意識しないといけない。
まず、粒度を考える前に、3Dを2Dで近似すると明らかに取り尽くせない範囲が出てくるという意味では、ジョルダン以前の問題として変数漏れがある。その次が近似する単位粒度の問題となる。
マーケティングにおける確率計算で、可処分所得や可処分時間、可処分時間行動における確率的な割り当てに関しては、まるでテトリスやレゴブロックのように制約の関係からある程度まとまった形を持つため、全てを細かく細分化できない。それの面積、体積の取り合いである。
つまり、行動空間は自由な連続空間ではなく、制約付き多面体に近い。
(『五冠王』で指摘した通り、エリアマーケティングではこの観点が絶対に欠かせない。なぜならばエリア的なものは文脈、買い周りが大事だからだ。)
被覆以前の問題というのがある。
まず強調すべきなのは、
誤差には二種類ある、という点だ。
1つは
数値誤差(granularity error)
もう1つは
構造誤差(modeling error)
多くの人は前者ばかりを気にする。
サンプル数が足りない、分割が粗い、近似が甘い、などだ。しかし、ジョルダン測度からルベーグ測度への飛躍が示しているのは、それ以前に、そもそも「覆っている空間は合っているのか?」という問いである。
森岡毅のようなプレーヤーは根本的な理解が浅いために運用を間違える。
主役は
確率空間 (Ω, F, P)
のうち、
Ω(標本空間)でも
P(確率測度)でもなく
F(事象集合=σ代数)
である。
確率はベクトルと対応させて考えることができる。
高校数学と大学数学を架橋する二本柱(ツインタワー) 「確率型」「微積分型」
工学的な設計でも、
- 変数漏れ
- 変数の相互作用
を予見できなかったケースにおける事故は非常に多い。もし、複数の変数な組み合わせによる双線型な変数軸の生成を見逃していた場合、単純に確率計算はバグる。
確率計算でよく起きる致命的なミスは、
サンプル空間を狭く取りすぎる
無視した変数が実は支配的だった
独立だと思った変数が相関していた
というものだ。
ここで重要なのは、
誤差とは「小さい数値」ではなく、「構造の欠落」だ
という認識である。確率をベクトルとして捉える、という視点は極めて強力だ。
確率分布 = 状態空間上のベクトル
期待値 = 内積
条件付き確率 = 射影
正規化 = ノルム調整
と見なせば、
「どの軸を立てているか」
「どの方向を落としているか」
が、そのまま結果の歪みとして現れる。
つまり、
確率が狂うのは、計算が間違っているからではなく、座標系が間違っているから
なのだ。
そもそも観測不能誤差はいかなる統計処理でも無意味である。
ジョルダン測度は
「人間が直感的に図形として把握できるもの」
を測ろうとした。
一方ルベーグ測度は、
境界がどれだけ壊れていても
穴だらけでも
点が無限に散っていても
測れる構造を持つなら測る
という立場に立った。
重要なのは、
σ代数は拡張できても、
過去の観測データは遡及的に拡張できない
という点だ。
これは情報幾何の問題になる。
確率分布の空間は、
ユークリッド空間ではない
単純な線形空間でもない
指数型分布族などを考えると、
パラメータ空間
分布空間
は曲がっている多様体になる。
「確率の世界は、地図だと思って歩くと必ず遭難する山岳地帯」
普通、我々はこう考える。
AとBの中間 → ちょうど真ん中
少し動かす → 少し変わる
距離が近い → 性質も似ている
これは全部
平面(ユークリッド空間)の発想。
でも確率分布の世界では、これが成立しない。
情報幾何では、分布空間には少なくとも二つの自然な接続がある。
フィッシャー距離を意識しないとコイントスにおける0.99と0.98のようなある種どうでもいいことに固執するようになる
特徴として細部をチェリーピッキングして『誤差1%』などと意味不明なことを言い出す
フィッシャー距離はこう聞いている:
「その差は、観測して本当に区別できるのか?」
観測しても区別できない差
→ 距離はほぼゼロ
観測で明確に違いが出る差
→ 距離が大きい
つまり:
意味のある違いだけを距離として残す
これが最大のメリット。
e-接続(指数接続)
m-接続(混合接続)
これは何を意味するか。
同じ「補間」「更新」「平均との差分」をしているつもりでも、
パラメータ空間で直線なのか
分布空間で直線なのか
によって、全く別の操作になるということだ。
マーケティングや工学で頻発する事故の多くは、
「同じ方向に少し動かしただけ」
という認識と、
実際には多様体上で全く別の曲線を辿っていた
という乖離から生じる。
これは数値誤差ではない。
幾何構造の誤認である。
制約付き多面体や行動空間では、
制約条件そのものが
直積構造を破壊する
以上に気づかないプレーヤーは大抵データのせいにする。
「データが汚いから」ではなく、
幾何的に独立であり得ない空間を扱っているからだ。
確率の取り扱いに注意が必要であることが直感的にわかる例を出そう。
分布A
50%の人は「必ず買う」
50%の人は「絶対買わない」
分布B
全員が「50%で迷っている」
どちらも平均購入率は 50%。
ここで A と B を直線で結ぶ。
すると中間は:
「全員が 50% 〜 75% くらいで迷っている」
になる。
だから情報幾何では:
混ぜる操作(集団の割合)
更新する操作(個人の確率)
を明確に分ける。
これが:
m接続(混合)
e接続(更新)
ここで、根本的な問題にぶち当たる
いかにも大学的な問題。
なぜ大学卒業が大事なのか。
高卒、中退はダメなのか。
大学の学部の専門が一生つきまとうのか。
それは、哲学的な問題。
確率についても、大学受験までの処理とはまた異なって、そもそも論がある。
確率とは何か?
確率はそもそも、
「観測結果がどう分布するか」
を表す道具。
本質的に絶対的に意味ある数値というより、観測なのである。
情報幾何では、こんな条件を課す。
条件A:パラメータの取り方に依存しない
(再パラメータ化不変性)
→ θ で書いても φ(θ) で書いても
「同じ分布なら同じ距離」
条件B:観測に基づく
→ データから区別できない差は距離ゼロ扱い
条件C:独立サンプルで自然に加算される
→ n回観測したら情報量が n倍になる
条件D:局所的に二次形式
→ 「少し違う」をちゃんと近似できる
これらの条件を同時に満たす距離は、フィッシャー情報量に一致する(定数倍を除いて)
これは
Cencov(チェンツォフ)の定理
という、かなり強い結果。
つまり:
フィッシャーは
「それっぽい距離」の一例
ではなく
条件を全部守ると逃げ場がない唯一解
になる。
フィッシャーはKLの微小変化を近似したもの
KL:
「観測のズレ」をそのまま測る
フィッシャー:
KL を 微小変化で近似したもの
※KL を2次近似するとフィッシャーが出る
0.50 → 0.55
差 = 0.05
0.02 → 0.07
差 = 0.05
差は同じ。
でも:
前者:1.1倍
後者:3.5倍
構造的インパクトは後者が圧倒的に大きい。
差だけ見てると、この違いが消える。
倍率はそのまま足せない
対数を取ると
倍率が 加算可能 になる
つまり:
対数は「倍率のズレを集計するための道具」
でも、
マーケットシェアのばらつき
についてふれたが、
- 2強構図
- 乱戦分散
は、状況が異なる。
これは数理的にも扱いが異なる。
競争を巡って取り合う売り上げの絶対額が同じでも、相対的な力関係で見るとかなり話が異なる。これが、KLだと捉えられる。
ディズニーvsユニバ
みたいなある種の2強で、仮に互いに拮抗してるという場合、シーソーと同じで、『どっちに傾くか』みたいなのは微細な差が生みやすい。
(関西圏に絞って距離対抗を踏まえた確率補正をすると、一定の範囲で『ディズニーかユニバか』みたいなシーソーがある種、イーブンになっていた層がいる)
ところが、
ディズニーvs地方の遊園地
とかになるとそもそも勝負にならない。
フィッシャー、KL的にも、キワキワな部分は、理論と実際のギャップが生じやすく、また、理論値の変化が結果に影響を与えやすい。
ルベーグ測度の話に戻ると、統計的な近似でざっくり捉えるマーケは、『購買にかかる単価、時間、手間の粒度が小さい、スケールの大きい全国、世界戦』であれば、それなりに近似通りになり、占い🔮もそこそこ効くだろう。
===
![]() ![]() ![]() ![]() |
![]() ![]() ![]() ![]() |
![]() ![]() ![]() ![]() |
"make you feel, make you think."
SGT&BD
(Saionji General Trading & Business Development)
説明しよう!西園寺貴文とは、常識と大衆に反逆する「社会不適合者」である!平日の昼間っからスタバでゴロゴロするかと思えば、そのまま軽いノリでソー◯をお風呂代わりに利用。挙句の果てには気分で空港に向かい、当日券でそのままどこかへ飛んでしまうという自由を履き違えたピーターパンである!「働かざること山の如し」。彼がただのニートと違う点はたった1つだけ!そう。それは「圧倒的な書く力」である。ペンは剣よりも強し。ペンを握った男の「逆転」ヒップホッパー的反逆人生。そして「ここ」は、そんな西園寺貴文の生き方を後続の者たちへと伝承する、極めてアンダーグラウンドな世界である。 U-18、厳禁。低脳、厳禁。情弱、厳禁。



