中央値(メディアン)とは、数字データの小さいものから大きいものの順に並べたときに、ちょうど中央に位置する値のことを指します。データの個数が奇数の場合、中央値は中央に位置するデータの値そのものですが、一方で、データの個数が偶数の場合には、中央に位置する2つの数値の平均値が中央値となります。
統計学的に使われることがあり、エクセルでデータをペって貼り付けたら、中央値がどれか教えてくれる関数があったら便利ですよね。というわけで、エクセルで中央値を調べる方法についてまとめていきます。
興味ある方、是非最後まで御覧ください!
こんにちは。当ブログの管理人の『くろん』です。
30代サラリーマン、新規事業推進室に所属。ブラック企業勤め時代に身に着けた業務効率化ノウハウをアウトプットしていきます。
読んでくれた方の業務が一秒でも早く終わりますように!と願いながら記事書いていきます!
エクセルで中央値を調べるには?
中央値は、データが奇数個の場合は、小さい順に並び替えたときに中央の数(11個データがあったら、6個目)。データが偶数個の場合は、中央の2つ(10個データがあったら、5個目と6個目)の平均値で算出します。
ってことは、COUNT関数でデータの個数を数えて、IFで偶数か奇数で分岐して、SMALL関数で中央の順番の数字を抽出して。。。。。ややこしそー。。。大丈夫です。
安心してください、『MEDIAN関数』がありますよ!!!
エクセルで中央値を求めるには、MEDIAN関数を用いる
実際にMEDIAN関数を用いて、中央値を算出してみました。
=MEDIAN(A2:A12)
MEDIAN関数は、引数に範囲を設定するだけで簡単に中央値を計算してくれる関数です。データの個数が偶数だったり奇数だったりの複雑な計算は不要です。
データ個数が奇数の場合
上の画像の左側部分が、データ個数が11個で奇数だった場合です。
E列にデータの値が小さい順に並び替えたのを表示しているのですが、11個あるので、序列が真ん中なのは6番目、つまり『31』なのですが、MEDIAN関数でも『31』を示していることがわかります。
データ個数が偶数の場合
上の画像の右側部分が、データ個数が10個で偶数だった場合です。
E列の小さい順に並び替えたデータにおいて、10個データがあるので序列真ん中は、5番目と6番目、つまり『25』と『31』の平均値である『28』が中央値となります。MEDIAN関数も『28』を示していることがわかります。
エクセルで中央値を求めるときに条件を追加したいとき
データがいい感じでまとまっていればいいですが、なかにはデータがイケてないときがあります。そうしたときに考えられる処理の仕方について、まとめていきたいと思います。
値が0のデータを除いた中央値を求める
画像左側は、0も含んだ中央値の算出になっています。11個データがあるので、その真中の序列6番目の『31』がMEDIAN関数で算出されていることがわかります。
一方、画像右側は、0を除いたデータでの中央値の算出となっています。11個データがありますが、真ん中の序列6番目『31』ではなく、2つの0を除いた真ん中の序列7番目『33』がMEDIAN関数で算出されていることがわかるかと思います。
=MEDIAN(IF(G3:G13>0,G3:G13))
このように、MEDIAN関数とIF関数を組み合わせることで、0を除いたデータにおける中央値を求めることが出来ます。
空白のセルのデータを除いた中央値を求める
空白のデータが、MEDIAN関数の指定範囲に含まれている場合はどうでしょう?
これは『0』扱いとなるわけではなく、空白としてデータから除外されて、中央値の判定がされるので、IF関数を用いた判定式をMEDIAN関数に混ぜ込む必要はありません。
データに文字が含まれている場合の中央値算出
そもそも、データに文字が含まれているデータ自体が問題といえば問題なので、そうならないように、もともとのデータを作成しておくことが望ましいです。
文字がMEDIAN関数の参照範囲に含まれていた場合はどのようになるでしょう。
まず、画像左側は、数字が文字になっているパターンです。このケースの場合は、セルの書式設定→文字列となっていたとしても、数字として認識され、中央値を算出する元データに含まれます。
また、画像右側は、『あ』という数字ではない文字が含まれているパターンです。このケースの場合は、エラーにはならずに、数字ではないものとして(なかったものとして)、中央値が算出されます。
このようにイレギュラーな文字が含まれていたとしても、エラーにならない点は逆に注意が必要と言えそうです。
エクセルで中央値を調べるまとめ
この記事をまとめると!
- MEDIAN関数を用いれば中央値が一発で分かるよ!
-
- 中央値はデータの個数が偶数か奇数かによって、処理の仕方が異なる。
- MEDIAN関数であれば、そのめんどくさい処理も一発で、中央値を算出してくれる。
- MEDIAN関数の引数に、中央値を求めたいデータの範囲を指定すればOK
- MEDIAN関数の挙動について
-
- 値が0のデータを含む場合で、除外したい場合は、IF関数とMEDIAN関数を組み合わせる
- 空白のデータは、中央値の判定からは外される
- 文字列のデータは、数字であれば含まれ、数字以外であれば含まれない。エラーにならないことに逆に注意
エクセルは表計算ソフトなだけあって、統計学的な数字の処理などは、豊富に関数が用意されているイメージです。統計学の数字で調べてみたいものがあったら、まず関数がないかどうか調べてみてください!