ウェブ解析

GA4、ユニバーサル アナリティクス

回帰分析 決定係数 統計学 重回帰分析

Excelでお気楽「重回帰分析」(サンプルデータ、ダウンロードできます)

投稿日:

Excelを使えば「重回帰分析」は楽にできる

一緒にやってみましょう。

統計学の代表的な分析手法と言えば、「重回帰分析」「ロジスティック回帰分析」「主成分分析」などがありますが、最初に手を付けるなら、私は「重回帰分析」をおすすめします。

重回帰分析のためのサンプルデータ(Excel)

サンプルデータ:56社のコンテンツマーケティングサイトの以下のデータがあるとします。

各社サイトの
「記事本数(本)= (x1) 」
「更新間隔(日) = (x2) 」
「独自ドメインかどうか= (x3) 」(2値のカテゴリカルデータ)
「サイトからの売上高(円) = (y) 」

(x1) (x2) (x3)を「因果」の「因」、(y)を因果の「果」として「重回帰分析」を行います。

上記のサンプルデータ(Excel形式)は下記からダウンロードできます。

https://yoshihiko-nakata.com/box/fuji/kenshu_data_20201114.xlsx

=短縮URL: https://bit.ly/3kvllP9

Excelで「重回帰分析」を行う手順

ここからは、Excelを使って重回帰分析をする手順をご説明します。

まず「データ」をクリック。

「分析」欄の「データ分析」を選ぶ。

もしも「データ分析」が無かったら:「ファイル」タブ選択⇒「オプション」を選択⇒「アドイン」を選択。次に「管理」欄で「Excelアドイン」を選択し、「設定」をクリック。 そして、チェックボックスの「分析ツール」をオンにし、「OK」をクリック。

「回帰分析」を選ぶ。(「重回帰分析」という選択肢は無いので「回帰分析」を選択。)

カーソルで「入力Y範囲」「入力X範囲」をそれぞれ指定。

「入力Y範囲」「入力X範囲」の選択が終わったら、「OK」をクリック。

一瞬で結果が出ます。ここから、y=a1x1+a2x2+a3x3+bに必要な値を入れると、

y=351.9x1 –3114.7x2+31732.0x3+495788.1  となります。

y=351.9x1 –3114.7x2+31732.0x3+495788.1 の式の意味は上記のようになります。

「重回帰式」  y=351.9x1 –3114.7x2+31732.0x3+495788.1 で作った「予測値」と「実測値」をグラフにすると上記の通りとなります。「予測値」が「実測値」(元データ)から、かなり外れています。これは、どういうことでしょうか?

「決定係数」

「重回帰式」の精度を端的に示す指標があります。「決定係数」(Excelでは「重決定」)というもので、R2という記号であらわすのが一般的です。0から1までの値をとり、1に近いほど、「重回帰式」が実際のデータに当てはまっていることを表します。

「決定係数」R2の値がこれくらいなら重回帰式の精度が高いといった統計学的な基準はありません。ただ、たとえばの目安として、0.5を超えていれば、実測値が予測値に近づくといった、ざっくりとした目安はあります。

「決定係数」が0.5から遠かったらどうするか?

「決定係数」R2の値がもっと大きくなりそうな変数を探し出して再分析することになるでしょう。たとえば、今回の例のように記事であればTwitterのリツイート数、いいね数など。

しかし、いい変数が見つからない、または変数があっても入手できないことも多々あり、それが「重回帰分析」の限界です。しかし、変数を変えて分析していくうちに、知見が得られる可能性は高いですし、入手可能な範囲の変数で予想することにも意義はあるはずです

-回帰分析, 決定係数, 統計学, 重回帰分析

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

関連記事はありませんでした