關於資料測量層次的一點看法

資料分析中,常常需針對資料去劃分測量層級,基本的測量層級主要為四種:

測定 定

測定 定

測定

測定

如下是我對這四種測量層級的

歸納總結

關於資料測量層次的一點看法

四種測量層級的歸納總結

測定

其特徵為分類,具有計算的功能,例如事物的分類,針對離散資料樣本;

測定

其特徵為分類排序,具有計算與排序雙重功能,例如事物的等級,針對離散資料樣本;

測定:

其特徵為分類排序,且具有基本的測量單位,具有計算、排序與加減的功能,例如商品質量的差異,針對連續資料樣本:

測定:

其特徵為分類排序,且具有基本的測量單位與絕對零點,具有計算、排序、加減與乘除的多功能,例如零食的銷售額,針對連續資料樣本。

定序測定的“序”不好衡量

定序資料中主觀感受居多,這種測定方式營銷場景使用居多,例如外賣騎手滿意度指標的衡量,非常滿意5分、一般滿意4分、不滿意2分、非常不滿意0分。定序資料一般透過調研來收集,但由於主觀資料不太好被人接納、易於受外界干擾,故定序測定中的“

”難於設定。

“質”的區分很重要

定距測定(僅僅具有加減功能)和定比測定(具有加減乘除)運算較多,且兩者間不好區分,實際的工作中資料分析師不太願意去使用,實際工作中,我更願意用定類測定與定序測定去衡量資料,因為定類測定與定序測定具有強大的區分事物

的能力,何謂質?例如性別變數!或男或女。

定質離散化處理是關鍵

實際的工作中,連續資料處理起來比較麻煩,因為連續資料在處理事物質的能力上嚴重不足,所以實際資料分析時需要將連續變數

定質離散化

的處理。例如北京的工資收入為連續資料變數,多少算高收入這個問題並不好回答,需要結合消費檔次等等多方面綜合衡量、定位,所以一個較成熟的資料分析師回答這個問題時絕不會提供給你一個具體的數值。