memo

通信制大学-情報コース‐で勉強している事

「統計」#2 データのばらつきの記述

放送大学-情報コース‐

基礎科目:身近な統計 #2

「講義の概要」

・データの特徴とまとめ方

・ばらつきのあるデータの利用方法

・データから表やグラフの作成、読み方

 

■データのばらつき

ばらつき方にある種の「確率的なパターン(確率分布)」を探る

 

■時系列データ

時系列に沿ってデータのばらつきを分析

例:過去5年間の月間売上高データ

 

■クロスセクションデータ

データの値に応じた起こりやすさ、起こりにくさを分析

例:身長の割合

 

■質的変数(データ)と量的変数(データ)

●質的変数

小数値のカテゴリのどれかが応答値となる観測項目

例:性別(男性・女性)、職種

・名義尺度:区別あり、順序はない

・順序柵度:区別・順序あり、差は取れない

 

●量的変数

数量値(数値線上の値)として記録される観測項目

例:売上高、生産指数、給与総額、在庫率

・間隔尺度:差の大きさに意味がある、比に意味はない

・比率尺度:差も比も意味がある(絶対ゼロがある)

 

■分布(データで大事)

データのばらつきの確率的なパターン

or

パターンを数量的に把握したもの

 

具体例:

・データが集中している範囲

・ばらつきの大きさ

・値や範囲が全体の何%か

など

現状の把握、予測、管理、マネジメント

 

●個々のデータの値の意味

全体のばらつきの中で相対的に評価

例:90点以上はクラスの何%

 

●度数分布表

カテゴリ応じて、その値が生じたケースの数(度数)をデータから数え上げ

割合などを求めた表

 

●パレート表とパレート図(解釈の仕方)

度数分布表やパレート図を解釈する2つの視点

・多数(過半数以上)が従う平均的な傾向をつかむ

・多数と異なる動きをする少数のケースの正体を探る

 

●パレード分析(ABC分析)

販売や顧客の管理などで重点項目を絞る時によく使われる

 

むずかしいね。