2次元であれば2本で、
3次元であれば3本の固有ベクトルによって
データを要約する
(あとは固有値で説明する)
統計学だけでこの
- 固有値
- 固有ベクトル
に馴染みがある人は文系にはいるかもしれないが、
大学理系だと「線形代数」の文脈でこれをしっかりとやる
なぜ固有値・固有ベクトルが大事かというと、ある行列があった時、
その行列を固有ベクトルを使って
「固有ベクトル×固有値」
の形に抽出することができて、
それは線形代数の計算上、便利な「対角化」につながる。
対角化がなぜ便利かというと、計算が混み合った時に固有値の累乗だけで計算が終わるから。
そもそも本来、
行列[ab ; cd]
というのは、abベクトルと、cdベクトルで示される面積を表している。
行列の積についてはこちら
(2次元の時)全ての線形変換は、
- 拡大・縮小(scale)だろうと
- 鏡映(reflect)だろうと
- 回転(rotate)だろうと
- 剪断(shear)だろうと
「全ての直線を直線に保つ」「原点を動かさない」という条件を満たす変換=線形変換である限りは、2つのベクトル(基底)がどう動くかという情報だけで表現できます。
-
固有値:「主成分の分散」を表し、固有値が大きいほど、データの情報量を多く保有する主成分として位置付けられます。最も固有値が大きい主成分が、第1主成分となります。
-
寄与率:その主成分が元のデータの何%を説明できているかを示します。例えば、表から寄与率の第1主成分は、0.828とあるので、この例では、第1主成分の軸だけでデータ全体の約8割を説明していることになります。寄与率を見れば、その主成分の重要度を知ることができます。
-
累積寄与率:第1主成分から第X主成分までの寄与率の累計を示します。表の累積寄与率を見ると、第2主成分までの寄与率の累計が0.918なので、第2主成分まででデータ全体の約9割を表していることになります。
https://korekara-marketing.com/statistics-pca/
大学で線形代数か統計学やらんと定量マーケティングなんてできまへん
===
"make you feel, make you think."
SGT&BD
(Saionji General Trading & Business Development)
説明しよう!西園寺貴文とは、常識と大衆に反逆する「社会不適合者」である!平日の昼間っからスタバでゴロゴロするかと思えば、そのまま軽いノリでソー◯をお風呂代わりに利用。挙句の果てには気分で空港に向かい、当日券でそのままどこかへ飛んでしまうという自由を履き違えたピーターパンである!「働かざること山の如し」。彼がただのニートと違う点はたった1つだけ!そう。それは「圧倒的な書く力」である。ペンは剣よりも強し。ペンを握った男の「逆転」ヒップホッパー的反逆人生。そして「ここ」は、そんな西園寺貴文の生き方を後続の者たちへと伝承する、極めてアンダーグラウンドな世界である。 U-18、厳禁。低脳、厳禁。情弱、厳禁。