「統計」#2 データのばらつきの記述
放送大学-情報コース‐
基礎科目:身近な統計 #2
「講義の概要」
・データの特徴とまとめ方
・ばらつきのあるデータの利用方法
・データから表やグラフの作成、読み方
■データのばらつき
ばらつき方にある種の「確率的なパターン(確率分布)」を探る
■時系列データ
時系列に沿ってデータのばらつきを分析
例:過去5年間の月間売上高データ
■クロスセクションデータ
データの値に応じた起こりやすさ、起こりにくさを分析
例:身長の割合
■質的変数(データ)と量的変数(データ)
●質的変数
小数値のカテゴリのどれかが応答値となる観測項目
例:性別(男性・女性)、職種
・名義尺度:区別あり、順序はない
・順序柵度:区別・順序あり、差は取れない
●量的変数
数量値(数値線上の値)として記録される観測項目
例:売上高、生産指数、給与総額、在庫率
・間隔尺度:差の大きさに意味がある、比に意味はない
・比率尺度:差も比も意味がある(絶対ゼロがある)
■分布(データで大事)
データのばらつきの確率的なパターン
or
パターンを数量的に把握したもの
具体例:
・データが集中している範囲
・ばらつきの大きさ
・値や範囲が全体の何%か
など
↓
現状の把握、予測、管理、マネジメント
●個々のデータの値の意味
全体のばらつきの中で相対的に評価
例:90点以上はクラスの何%
●度数分布表
カテゴリ応じて、その値が生じたケースの数(度数)をデータから数え上げ
割合などを求めた表
●パレート表とパレート図(解釈の仕方)
度数分布表やパレート図を解釈する2つの視点
・多数(過半数以上)が従う平均的な傾向をつかむ
・多数と異なる動きをする少数のケースの正体を探る
●パレード分析(ABC分析)
販売や顧客の管理などで重点項目を絞る時によく使われる
むずかしいね。