多項分布、ディリクレ分布

多項分布を連続化すると、多項分布が持つ離散的な性質が滑らかに変化し、連続的な確率分布に移行します。この連続化は、多項分布の確率変数を連続型の確率分布に近づけるという意味です。具体的には、多項分布の連続化は、マルチノミアル分布(Multinomial Distribution)の連続バージョンとして理解できます。

多項分布を連続化した場合:

  • 多項分布は、各カテゴリに対する確率が固定され、各カテゴリに何回成功したかを求めるものです(つまり、成功回数を整数で表現)。例えば、サイコロの目に関して多項分布を考えた場合、サイコロの目がどれだけ出るかを数えますが、この回数は離散的な値を取ります。

  • 連続化すると、確率が連続的に分布するようになります。例えば、サイコロの目の代わりに、連続的に変動する確率密度関数に変換されるといった具合です。これを連続的に表すためには、確率質量関数(PMF)を確率密度関数(PDF)に変換する必要があります。

連続化された場合、何が起きるか:

  • 確率の分布が滑らかになる: 多項分布のように、確率が「段階的」ではなく、連続的に変化するようになります。例えば、多項分布であれば、各カテゴリ(サイコロの目)に対して確率が決まっていましたが、連続化した場合、カテゴリの分布が連続的に変わるようになります。

  • マルチノミアルから連続分布へ: 多項分布は、マルチノミアル分布の特別な場合で、独立した確率変数が離散的にいくつかのカテゴリに分けられる問題です。これを連続型にするには、Dirichlet分布カイ二乗分布、あるいは他の連続型分布が使われることが多いです。Dirichlet分布は、多項分布の連続バージョンとして、各カテゴリの確率が連続的に分布します。

具体例:

例えば、サイコロを6回振る場合を考えます。各目が出る回数が多項分布に従っている場合、その結果は離散的な整数で表現されます。しかし、この多項分布を連続化すると、例えば、6回中で目1が出る確率が「0.2」や「0.3」などの連続的な確率に変換されます。これが連続型の分布に変わった状態です。

  • Dirichlet分布: これは、多項分布を連続的に拡張したものであり、確率の分布が連続的に変動する特性を持っています。

  • カイ二乗分布やベータ分布なども、多項分布を連続的に拡張する形で現れる分布です。これらは、確率が複数のカテゴリに均等に分配される場合に関連します。

多項分布を連続化すると、離散的な確率が連続的な確率密度関数に変換されます。具体的には、Dirichlet分布などの連続型分布に近づき、確率が滑らかに広がる特徴を持つようになります。これによって、多項分布が持っていたかくばった形がなくなり、連続的な確率分布として表現されることになります。

連続化した多項分布と多変数正規分布の違い:

  1. 連続化した多項分布(Dirichlet分布など):

    • 確率の分布は、複数のカテゴリにわたって均等に分布し、各カテゴリの確率が連続的に変化します。
    • この場合、確率密度関数(PDF)が多項分布のように離散的でなく、連続的に滑らかに分布します。もし多項分布を連続化すると、多項分布の確率質量が連続型になり、分布は丘状に見えることがあります。
    • しかし、この場合でも、カテゴリ間の相関性や確率の分布方法が異なるため、正規分布と完全には一致しません
  2. 多変数正規分布:

    • 多変数正規分布は、複数の連続変数に対する確率分布であり、各変数が正規分布に従い、線形の相関関係を持っています。
    • 確率密度関数は、平均と共分散行列によって形が決まる対称的で滑らかな丘の形を持ちます。
    • この分布は、各変数間の線形な依存関係をモデル化するため、複数の変数における連続的な相関がそのまま反映されます。

両者の主要な違い:

  • 依存関係の違い:
    多項分布を連続化した場合(たとえば、Dirichlet分布の場合)、カテゴリ間の確率は連続的に変化しますが、変数間に線形な依存関係が直接的に反映されないことが多いです。
    一方で、多変数正規分布は、変数間の線形な依存関係(共分散)を明示的にモデル化します。変数間の関係が相関行列によって完全に決まるため、確率の形は常に平均を中心に対称的な「なだらかな丘」になります。

  • 形状の違い:
    連続化した多項分布(たとえばDirichlet分布)では、確率がカテゴリ間で連続的に広がるため、分布は滑らかに広がりますが、完全な「なだらかな丘」という形にはならない場合もあります。特に、カテゴリが増えると、分布の形が複数のピークを持つことがあり、一つの丘ではなく**多峰性(multi-modal)**になることがあります。

    これに対して、多変数正規分布は常に単一の対称的なピーク(山)を持ち、形状は滑らかで一方向に連続的に広がる特徴を持っています。これが、多変数正規分布を「砂場の山」のようにイメージする理由です。

結論:

確かに、多項分布を連続化した場合、その分布が丘状の形になることがあります。しかし、多項分布の連続化(Dirichlet分布など)は、変数間の依存関係や確率分布の形状が多変数正規分布とは異なるため、完全に似たものにはなりません。具体的には、多項分布の連続化は、確率が複数のカテゴリにまたがって均等に広がるのに対し、多変数正規分布は、変数間の相関が定義された一つの「なだらかな丘」として現れるため、根本的には異なる性質を持っています。

そのため、多項分布を連続化したものが確かに丘のように見えることもありますが、それと多変数正規分布の間には依存関係や形状の違いがあるため、両者は異なるという点を考慮する必要があります。


===

西園寺貴文(憧れはゴルゴ13)#+6σの男

   




"make you feel, make you think."

 

SGT&BD
(Saionji General Trading & Business Development)

新たなるハイクラスエリート層はここから生まれる
         




Lose Yourself , Change Yourself.
(変えることのできるものについて、それを変えるだけの勇気を我らに与えたまえ。変えることのできないものについては、それを受け入れられる冷静さを与えたまえ。そして、変えることのできるものと、変えることのできないものとを、見分ける知恵を与えたまえ。)
 
説明しよう!西園寺貴文とは、常識と大衆に反逆する「社会不適合者」である!平日の昼間っからスタバでゴロゴロするかと思えば、そのまま軽いノリでソー◯をお風呂代わりに利用。挙句の果てには気分で空港に向かい、当日券でそのままどこかへ飛んでしまうという自由を履き違えたピーターパンである!「働かざること山の如し」。彼がただのニートと違う点はたった1つだけ!そう。それは「圧倒的な書く力」である。ペンは剣よりも強し。ペンを握った男の「逆転」ヒップホッパー的反逆人生。そして「ここ」は、そんな西園寺貴文の生き方を後続の者たちへと伝承する、極めてアンダーグラウンドな世界である。 U-18、厳禁。低脳、厳禁。情弱、厳禁。