logo
Loading...

常見的相關係數有哪些? - 【教材專區】學習AI有困難? 讓Cupoy助教來幫你! - Cupoy

目前生活中常見的相關係數有以下四種 1.皮爾森相關係數(Pearson correlation coefficient) 2.斯皮爾曼相關係數(Spearsan correlation coeffic...

目前生活中常見的相關係數有以下四種 1.皮爾森相關係數(Pearson correlation coefficient) 2.斯皮爾曼相關係數(Spearsan correlation coefficient) 3.重複測量相關係數(Repeat measure correlation) 4.xi correlation 以下針對四種的相關係數做更加詳細的介紹 皮爾森相關係數(Pearson correlation coefficient) 皮爾森相關係數主要是探討兩個連續性特徵的線性相關程度,他是兩個變數的共變異數與標準差乘積之比,那共變異數是什麼呢?共變異數主要是表現兩個變數一同變化的程度,就是當A變數離均值越遠時,B變數是否也會跟著變遠,接著讓我們來看看皮爾森相關係數的公式: 式子中的CovXY代表X跟Y的共變異數,SX、SY則代表X跟Y的標準差,那得到的數值r會介於-1~1之間,r如果是正的代表正相關,負的就代表負相關,數值越高代表相關性也越高,不過皮爾森相關係數也有個缺點,就是在判斷中會容易有偏誤,當r很低有時並不代表兩個變數之間沒有相關性,可能是因為兩變數呈現非線性相關,這用皮爾森相關係數就無法察覺,於是需要多方的查證與參考來確認。 斯皮爾曼相關係數(Spearsan correlation coefficient) 斯皮爾曼相關係數主要是探討兩序列特徵(可以依照等級做排序的特徵,如排名、年紀)之間的相關性,他與皮爾森相關係數的差別是不容易受線性相關或離群值影響,接著讓我們來看斯皮爾曼相關係數的公式: 其中di指的是第i個配對等級的差值,也就是第i個第一個變項的等級減去第i個第二個變項的等級,n則為樣本總個數 與皮爾森相關係數相同的是,斯皮爾曼係數得到的數值p也是介於-1~1之間,且正號為正相關,負號為負相關。 重複測量相關係數(Repeat measure correlation) Repeat measure correlation主要是應用在時間序列或是需要長期追蹤資料分析的相關係數,可以去探討兩個特徵在相同樣本下隨著時間變化的線性相關性,藉由不斷的重複測量,來探索兩特徵是否會隨著時間而有相同的變化。如果想在python中做使用,可以透過pingouin套件來操作。 xi correlation xi correlation是一個非常新的相關係數,在2020才被提出,主要是探討兩特徵之間”可以形成一個function"的程度,即使兩個特徵相關性再多麼高,也不一定能透過一個funtion來表示,那xi correlation的優點就是不管兩個特徵相關性是線性、非線性、二次項等等,都可以使用xi correlation來做檢測。如果想在python中使用,可以透過xicor套件來操作xi correlation。