【データ分析】代表値〜平均値、中央値、最頻値〜【前編】

未分類

今回のテーマは「代表値」です。

代表値ってなに、、、。

よく使う代表値は、「平均値」ですね。

実は「代表値」は「平均値」の他にもあります。

それぞれの代表値の定義、求め方など基本を解説していきます。

代表値とは

代表値

代表値・・・データ全体の特徴を表した1つの値

代表値には、平均値、中央値、最頻値がある

代表地の中で有名なのは、平均値ですが、その他にも、中央値や最頻値といった代表値があります。それでは、代表値を1つ1つみてきます。

平均値

平均値

$$(平均値)=\frac{(データの値の合計)}{(全体の度数)}$$

データの値の合計を全体の度数で割った値を平均値と言います。

平均点、平均身長、平均気温、平均年収、・・・様々な場面でこの平均値を代表値として利用しています。

それでは平均値の求め方をみていきましょう。

例題

次のデータは、5人の数学テストの結果である。このデータの平均値を求める。

\begin{array}{|c|c|c|} \hline A & B & C&D&E \\ \hline 58 & 82 & 77&65&93 \\ \hline \end{array}

$$(平均値)=\frac{58+82+77+65+93}{5}$$

$$=\frac{375}{5}=75$$

とにかく全て足して、度数(人数)で割ればいいわけです。

中央値(メジアン)

中央値

中央値・・・データを小さい順に並べたとき、中央にある値

※データが偶数個のときは、中央に並ぶ2つの平均値をそのデータの中央値とする。

データを小さい順に並べて、ど真ん中にある値を中央値(メジアン)と言います。

中央値の求め方をみていきましょう。

例題

(1)データ5個のとき

$$5、2、7、9、4$$

小さい順に並び替えると

$$2、4、\color{red}{5}、7、9$$

中央値 5

(2)データ6個のとき

$$5、2、7、3、9、8$$

小さい順に並び替えると

$$2、3、5\color{red}{|}7、8、9$$

中央値は、5と7の平均値である\(\displaystyle{\frac{5+7}{2}=6}\)

「小さい方から」と「大きい方から」の中央にある数字です。

最頻値(モード)

最頻値

最頻値・・・度数の最も大きいデータの階級値

次の例で、最頻値を見ていきましょう。

例題

靴のサイズの最頻値を求める。

\begin{array}{|c|c|c|} \hline \tiny{サイズ (cm)}& 22.0 &22.5&23.0&23.5&24.0&24.5&25.0&25.5&26.0&\color{red}{26.5}&27.0&27.5 &28.0&合計\\ \hline \tiny{個数(足)} &1&4&5&6&7&10&13&16&20&35&21&17&5&160 \\ \hline \end{array}

度数(個数)が一番大きのは、35足。

その階級値である26.5が最頻値となります。

度数(今回で言えば個数)が一番大きい階級値を最頻値といいます。

今回のように、仕入れを考える場合など、一番売れているサイズである最頻値という値は参考になる値です。

まとめ

まとめは以下の通りです。

・代表値はデータ全体の特徴を表した一つの値で、平均値、中央値、最頻値などがある。

・平均値は、データの合計を全体の度数で割った値。よく使われる代表値。

・中央値は、データを小さい順に並べたときの、真ん中の値。

・最頻値は、最も度数の大きい階級値。

今回は、代表値について解説しました。

代表値で有名なのは「平均値」ですが、それ以外にも、「中央値」や「最頻値」があります。

それでは、平均値、中央値、最頻値のどれが代表値として適しているか次回考えていきたいと思います。

後編はこちら

少しでも参考になれば幸いです。

コメント

タイトルとURLをコピーしました