道德淪喪!為什麼總分第 1 卻不是優秀員工?| 《簡單統計學》讀書筆記

道德淪喪!為什麼總分第 1 卻不是優秀員工?| 《簡單統計學》讀書筆記

我部門有一個客服叫飛飛。飛飛是一個聰明伶俐的小姑娘,在客服團隊裡面,她的績效總是最好的。

但是有一次,人資找我說,上個月飛飛的績效大幅下降,認為飛飛狀態不穩定。

我很詫異,因為我每個月都會和手底下的小朋友們進行溝通,在我看來飛飛的狀態很穩定,績效也沒什麼問題。

人資給我看了績效表,我發現了問題所在。

從總體看,飛飛的績效確實不是最好的,比第一名的轉化率差了很多。

道德淪喪!為什麼總分第 1 卻不是優秀員工?| 《簡單統計學》讀書筆記

但是,從單項看,飛飛每一項的績效都超過第一名,為什麼呢?

道德淪喪!為什麼總分第 1 卻不是優秀員工?| 《簡單統計學》讀書筆記

這其實是辛普森悖論:

當聚合資料被分解時其中的模式發生逆轉的現象

這句話反過來也成立:

在分組比較中都佔優勢的一方,在總評中有時反而是失勢的一方

《簡單統計學》裡面說,產生辛普森悖論的原因,是存在混雜因素:

混雜因素常常出現在使用觀測性資料的研究中,因為人們無法透過現實的方法使這些因素維持恆定。

在飛飛的案例中,混雜因素就是不同溝通型別的數量。

一般情況下,電話和線上溝通工具的轉化率相差很大,電話轉化率高,IM轉化率低。

道德淪喪!為什麼總分第 1 卻不是優秀員工?| 《簡單統計學》讀書筆記

雖然飛飛的各項轉化率都超過第一名,但是因為上個月接入了太多的IM諮詢,拉低了整體的轉化率。

道德淪喪!為什麼總分第 1 卻不是優秀員工?| 《簡單統計學》讀書筆記

而IM諮詢太多的原因,是我上個月對投放渠道和策略進行了調整,然後給飛飛分配了更多的IM諮詢。

所以,即使整體的轉化率沒那麼高,飛飛依舊是我最好的客服。

對於資料的統計分析,辛普森悖論是個常見的現象。《簡單統計學》裡面舉了幾個有趣的例子:

1。 阿拉斯加航空公司在五個機場的準點記錄都超過競爭對手,但總體準點記錄卻不如競爭對手,為什麼呢?

2。 瑞典各個年齡段的女性死亡率都要低於哥斯大黎加,但瑞典女性總體死亡率卻高於哥斯大黎加,為什麼呢?

3。 一種手術對於小型和大型腎結石的治療成功率都高於另一種手術,但總體成功率卻更低,為什麼呢 ?

因為這些例子裡面,都有某種混雜因素對聚合資料產生了影響,導致結論反轉。

如果你對這些例子的原因感興趣,可以看下《簡單統計學》這本書。

辛普森悖論的這種

結論反轉

的特性,特別容易誤導人,比如開頭的飛飛案例。

當然,你也可以利用這種反轉特性去誤導別人。

傑拉爾德·福特擔任美國總統期間,推行減稅政策,各個收入群體的稅率都是下降的。

道德淪喪!為什麼總分第 1 卻不是優秀員工?| 《簡單統計學》讀書筆記

但是從整體看,稅率卻是提高的。

道德淪喪!為什麼總分第 1 卻不是優秀員工?| 《簡單統計學》讀書筆記

因為繳稅的主力是高收入人群,但他們的稅率降低的很少,而且在1978年,高收入人群的稅收佔比大幅提高了,最終拉高了整體的稅率。

道德淪喪!為什麼總分第 1 卻不是優秀員工?| 《簡單統計學》讀書筆記

如果你打算競選下一期的美國總統,或許就可以拿著整體稅率提高的資料,去打擊福特,說他是表裡不一的騙子。

既然辛普森悖論這麼容易誤導人,我們該怎麼避免辛普森悖論呢?

一個比較有效的方法,是

對資料進行合理的細分

。關注細分資料,而不是聚合資料。

很多時候整體聚合的資料並沒有太多的應用價值。

比如客服的轉化率、產品的續費率、使用者的留存率、廣告的點選率等等。

一個客服的整體轉化率差,並不能說明這個客服的能力不行,把溝通型別細分之後,可能發現是她進行了太多難以轉化的溝通。

一個產品的整體留存率不高,未必需要全盤放棄,把裝置型別、使用者型別進行細分之後,說不定能找到有很高忠誠度的使用者。

一個廣告的點選率不高,未必是創意、著陸頁的原因,把流量細分之後,可能發現是引入了太多的非目標使用者。

所以,看到資料之後彆著急下結論,先細分一下,說不定會發生結論反轉。

—·

End

·—

讀書,思考,學以致用。

最近讀了什麼書?有什麼想法?

把你的想法,以

的形式留言

和我們一起分享吧