全然ロジカルじゃない(!)書きたいことをひたすら書くブログ

全然ロジカルじゃない(!)書きたいことをひたすら書くブログです。ノンロジカルエッセイ。

統計学(その4)ピアソンの積率相関係数

ここしばらく統計学とそれに応用できそうな分野をひたすらつまみ食いするスタイルが続いております。

大手企業ではRやSPSSによる統計解析・データマイニングはすでに行われていますので、私が今更統計学を勉強したところでスキルセットの差異化は望めないでしょう。

なので、自分は現場の数値分析に統計学を持ち込みつつ、さらに統計解析に応用できそうな分野を勉強しているのです。具体的には、マセマの『解析力学』や『熱力学』の本で物理・化学を勉強しています。

冷静に考えると、ふつうは統計学解析力学や熱力学に応用されるものであって、解析力学や熱力学を統計解析に応用するというのは話が逆なように思われるかもしれません。僕がやろうとしているのは単に物理・化学の研究ではなくて、熱力学に出てくる分子の振る舞いを表現する数式や分析の仕方を学ぶことで、それをリアルな販売の現場で人々の購買行動や意思決定の分析に応用することです。上手くいくのにしばらく時間がかかるかもしれません。

あと最近は仕事で自分で数値を拾ってデータ分析をしています。特に誰に言われたわけでもなく、自主的にやっております。 

Googleスプレッドシートに数値を入力し、試しに「ピアソンの積率相関係数r」を出しています。コードは「=CORREL(A2 : A100, B2 : B100 )」です。「ピアソンの積率相関係数rの二乗」を算出する場合には「=RSQ(A2 : A100, B2 : B100)」を用います。

「ピアソンの積率相関係数r」とは、2つの要素間の相関関係の強さを示す数値(0〜1)のことです。2つの変数の相関が強ければ数値は1に近づき、両者の相関が弱ければ0に近づきます。

ただ相関係数を算出したはいいけれども、そのデータの活用法はまだ見いだせていません。