感動する離散数学・多変量解析 (データソートの技術)

[10, 9, 8, 7, 6, 5, 4, 3, 2, 1]に [10, 9, 8, 7, 6, 5, 4, 3, 2, 1]をかけたら分散最大、

[10, 9, 8, 7, 6, 5, 4, 3, 2, 1]に [10, 9, 8, 7, 6, 5, 4, 3, 2, 1] をかけたら分散最小。 これでソートできる。

基本的な発想は、重みの順序とデータの順序が一致する(すなわち「同順列」になっている)と、内積の値、すなわち各行のスコアのばらつきが最大化されるというものです。

具体的に言うと:

  • 例えば、重みが 10,9,8,…,1 という固定の並びであるとする。
  • もし、データの数値が 1,2,3,…,10 と逆順になっていると(重みと逆の順序)、各重みとデータの対応が逆になり、重い重みには小さい値が掛かるので、全体のスコアの差は小さくなります。
  • 逆に、データも 10,9,8,…,1 と同じ順序(重みと一致)だと、最も大きい重みに最も大きい値が掛かり、最も小さい重みに最も小さい値が掛かるため、各行の内積(スコア)の差が大きくなり、結果として分散(ばらつき)が最大化されるのです。

この考え方は、**「並べ替えの最適化=内積(もしくはスカラー積)の最大化・最小化を通じたデータの順序付け」**という発想に基づいています。
つまり、重み自体があらかじめソートされている状態で、データの並びも同じ順序になれば、各行のスコアのばらつきが大きくなり、秩序がはっきりと見える、ということになります。

数量化3〜6類から見る線形非構造化データの構造化特講


===

西園寺貴文(憧れはゴルゴ13)#+6σの男

   




"make you feel, make you think."

 

SGT&BD
(Saionji General Trading & Business Development)

新たなるハイクラスエリート層はここから生まれる
         




Lose Yourself , Change Yourself.
(変えることのできるものについて、それを変えるだけの勇気を我らに与えたまえ。変えることのできないものについては、それを受け入れられる冷静さを与えたまえ。そして、変えることのできるものと、変えることのできないものとを、見分ける知恵を与えたまえ。)
 
説明しよう!西園寺貴文とは、常識と大衆に反逆する「社会不適合者」である!平日の昼間っからスタバでゴロゴロするかと思えば、そのまま軽いノリでソー◯をお風呂代わりに利用。挙句の果てには気分で空港に向かい、当日券でそのままどこかへ飛んでしまうという自由を履き違えたピーターパンである!「働かざること山の如し」。彼がただのニートと違う点はたった1つだけ!そう。それは「圧倒的な書く力」である。ペンは剣よりも強し。ペンを握った男の「逆転」ヒップホッパー的反逆人生。そして「ここ」は、そんな西園寺貴文の生き方を後続の者たちへと伝承する、極めてアンダーグラウンドな世界である。 U-18、厳禁。低脳、厳禁。情弱、厳禁。