中央値

いわゆるメディアン(median)についてなんとなくしか理解していなかったので復習.

中央値(ちゅうおうち)(median) とは、代表値の一つで、有限個のデータをソートしたとき、中央に位置する値。ただし、データが偶数個の場合は、中央に近い2つの値の算術平均をとる。

http://ja.wikipedia.org/wiki/中央値

有限個の場合よりも確率分布における定義の方がわかりやすい.

一歩進めると, 四分位値(quartile)が理解できる. すなわち中央値の考えを1/2ではなく, 1/4ずつにとったものだ. 小さい方から第1, 第2, 第3となる. 第2四分位値とは中央値のことだ.

さらに, これを用いて箱ひげ図(box plot)が書ける. 髭は四分位範囲の1.5倍以内にあるデータの一番大きな値,一番小さな値で描くらしい. ゆがみや外れ値を判別しやすい.

http://case.f7.ems.okayama-u.ac.jp/statedu/lispstat-book/node30.html