ほげほげけびんの日記

日々の出来事や感じたこと、考えたことを綴っています。

測定尺度

データを統計的に整理する場合、データにはいくつかの種類があることを理解しておく必要がある。

統計ソフトを利用する場合、データの種類により可能な処理が異なることがあるからである。

ある種類のデータに適用できる処理が、別の種類のデータには適用できないことがある。

だから、これを理解していないと、統計ソフトを利用していて、なぜこのデータにこの処理が適用できないのか、なんてことが起こりうる。

 

データを種類分けすることを分類するという。

分類するには、なんらかの基準が必要になる。

この基準のことを、測定尺度または測定水準という。

具体的には、データの表現方法を指す。

分かりやすいのは、数字で表される測定値だろう。

 

温度で例えてみよう。

数字で表す場合、摂氏/華氏□℃と表現する。

この表現方法が尺度だ。

摂氏50℃と表現すれば、この表現を見た誰もが、温度計が50℃を指す温度のことだと理解する。

すなわち、誰に対しても、ある一点を示すことができることから、データとしての信頼性は高い。

 

尺度は、数字で表すことができるものばかりではない。

言葉も尺度になる。

温度を5段階で示してみよう。

1は冷たい、2は少し冷たい、3はぬるい、4は少し熱い、5は熱い。

こんな評価を見たことはないだろうか。

こういう示し方も、尺度になる。

しかし、順序は分かるものの、データとしての信頼度は、数値で表す場合よりも劣る。

冷たいと言われても、何度を指しているのか、わからないからだ。

 

もっと単純化してみよう。

1は熱い、0は熱くない。

もはや、順序もなく、1と0の数をカウントすることしかできない。

データとしての信頼度は最も劣るといえる。

 

このように、データの表し方には種類があることが分かってもらえたと思う。。

実際には、種類ごとに名称があるので、名称とその意味するところを理解することが、統計学を学ぶ第一歩となる。