每天一點統計學——雙變數的克萊姆相關係數的計算

克萊姆相關係數是衡量兩個分類數據變數之間關聯性強弱的指標,數值介於0和1之間。數值越大,關聯性越強。克萊姆相關係數的計算公式如下:

克萊姆相關係數的計算公式

結合例子講解這個公式:

我們想要調查「性別」與「常用溝通方式」的關聯關係,以下是調查的數據:

觀測次數

這次的調查數據中,無論是性別還是溝通方式,都屬於分類數據。要研究它們之間的關聯關係,需要使用克萊姆相關係數。這裡的34、61、53等就是觀測次數。

首先,需要求出期望次數,期望次數 = 交叉合計數的乘積 / 總數。

期望次數

比如,要求出女性與打電話之間的期望次數,則應該是打電話的合計數乘以女性的合計數再除以整數,即(148 * 72)/300。原則上,再求解的過程中用分數表示求解結果,不要出現四捨五入的情況以免對最終結果產生影響。

Advertisements

其次,求出差異值,差異值的計算公式為:差異值 = (觀測次數 - 期望次數)^2 /觀測次數

克萊姆相關係數

觀測次數和期望次數的差異值越大,即「性別」和「常用溝通方式」之間的關聯程度越強。

最後,將所有計算出來的差異值結果相加,即可得出整體的統計量(皮爾森的卡方統計量),最終結果為8.0091。現在再來看看那個計算公式。

其中X0^2 為皮爾森的卡方統計量,即8.0091,數據個數為300。在這次的調查數據中,交叉資料表的函數為2(男、女),交叉資料表的列數為3(打電話、發簡訊、當面),min表述行、列取最小值。所以最後求解克萊姆相關係數的結果為:

克萊姆相關係數

最後總結一下:克萊姆相關係數的值介於0和1之間,兩個分類數據的關聯性越強,則克萊姆係數就會越接近1,反之,則會越接近0。

Advertisements

Advertisements

你可能會喜歡