大哥,您好,我想知道協方差,相關係數的一些相關知識,看不懂協方差的那個計算公式哦

題目:

大哥,您好,我想知道協方差,相關係數的一些相關知識,看不懂協方差的那個計算公式哦

解答:

兩個不同參數之間的方差就是協方差
若兩個隨機變量X和Y相互獨立,則E[(X-E(X))(Y-E(Y))]=0,因而若上述數學期望不爲零,則X和Y必不是相互獨立的,亦即它們之間存在著一定的關係.
定義
E[(X-E(X))(Y-E(Y))]稱爲隨機變量X和Y的協方差,記作COV(X,Y),即COV(X,Y)=E[(X-E(X))(Y-E(Y))].
協方差與方差之間有如下關係:
D(X+Y)=D(X)+D(Y)+2COV(X,Y)
D(X-Y)=D(X)+D(Y)-2COV(X,Y)
因此,COV(X,Y)=E(XY)-E(X)E(Y).
[編輯本段]
協方差的性質
(1)COV(X,Y)=COV(Y,X);
(2)COV(aX,bY)=abCOV(X,Y),(a,b是常數);
(3)COV(X1+X2,Y)=COV(X1,Y)+COV(X2,Y).
由協方差定義,可以看出COV(X,X)=D(X),COV(Y,Y)=D(Y).
協方差作爲描述X和Y相關程度的量,在同一物理量綱之下有一定的作用,但同樣的兩個量採用不同的量綱使它們的協方差在數值上表現出很大的差異.爲此引入如下概念:
定義
ρXY=COV(X,Y)/√D(X)√D(Y),稱爲隨機變量X和Y的相關係數.
定義
若ρXY=0,則稱X與Y不相關.
即ρXY=0的充分必要條件是COV(X,Y)=0,亦即不相關和協方差爲零是等價的.
定理
設ρXY是隨機變量X和Y的相關係數,則有
(1)∣ρXY∣≤1;
(2)∣ρXY∣=1充分必要條件爲P{Y=aX+b}=1,(a,b爲常數,a≠0)
定義
設X和Y是隨機變量,若E(X^k),k=1,2,...存在,則稱它爲X的k階原點矩,簡稱k階矩.
若E{[X-E(X)]^k},k=1,2,...存在,則稱它爲X的k階中心矩.
若E(X^kY^l),k、l=1,2,...存在,則稱它爲X和Y的k+l階混合原點矩.
若E{[X-E(X)]^k[Y-E(Y)]^l},k、l=1,2,...存在,則稱它爲X和Y的k+l階混合中心矩.
顯然,X的數學期望E(X)是X的一階原點矩,方差D(X)是X的二階中心矩,協方差COV(X,Y)是X和Y的二階混合中心矩.
[編輯本段]
協方差在農業上的應用
農業科學實驗中,經常會出現可以控制的質量因子和不可以控制的數量因子同時影響實驗結果的情況,這時就需要採用協方差分析的統計處理方法,將質量因子與數量因子(也稱協變量)綜合起來加以考慮.
比如,要研究3種肥料對蘋果產量的實際效應,而各棵蘋果樹頭年的「基礎產量」不一致,但對試驗結果又有一定的影響.要消除這一因素帶來的影響,就需將各棵蘋果樹第1年年產量這一因素作爲協變量進行協方差分析,才能得到正確的實驗結果.
a =
-1 1 2
-2 3 1
4 0 3
for i=1:size(a,2)
for j=1:size(a,2)
c(i,j)=sum((a(:,i)-mean(a(:,i))).*(a(:,j)-mean(a(:,j))))/(size(a,1)-1);
end
end
c =
10.3333 -4.1667 3.0000
-4.1667 2.3333 -1.5000
3.0000 -1.5000 1.0000
c爲求得的協方差矩陣,在matlab以矩陣a的每一列爲變量,對應的每一行爲樣本.這樣在矩陣a中就有3個列變量分別爲a(:,1),a(:,2),a(:,3).
在協方差矩陣c中,每一個元素c(i,j)爲對第i列與第j列的協方差,例如c(1,2) = -4.1667爲第一列與第二列的協方差.
拿c(1,
c(1,2)=sum((a(:,1)-mean(a(:,1))).*(a(:,2)-mean(a(:,2))))/(size(a,1)-1);
1.a(:,1)-mean(a(:,1)),第一列的元素減去該列的均值得到
-1.3333
-2.3333
3.6667
2,a(:,2)-mean(a(:,2)),第二列的元素減去該列的均值得到
-0.3333
1.6667
-1.3333
3,再將第一步與第二部的結果相乘
-1.3333 -0.3333 0.4444
-2.3333 .* 1.6667 = -3.8889
3.6667 -1.3333 -4.8889
4,再將結果求和/size(a,1)-1 得 -4.1667,該值即爲c(1,2)的值.
再細看一下是不是與協方差公式:Cov(X,Y) = E{ [ (X-E(X) ] [ (Y-E(Y) ] } 過程基本一致呢,只是在第4步的時候matlab做了稍微的調整,自由度爲n-1,減少了一行的樣本值個數.
已知協方差求其特徵值:
先寫出協方差矩陣s,再調用eig(s)這個庫函數,調用方法:[ev,ed]=eig(s).ed爲特徵值矩陣,ev特徵向量矩陣,排列順序:從低階到高階.》s=[2291.333 1340 1934 2523.333 1245.333 2482; 1340 956.6667 1596 1401.333 883.3333 1480;1934 1596 4281.667 1436.667 1663 1945.667;2523.333 1401.333 1436.667 2984.667 1236 2800.667; 1245.333 883.333 1663 1236 843 1343;2482 1480 1945.667 2800.667 1343 2729.667]》[ev,ed]=eig(s) 先寫出協方差矩陣s,再調用eig(s)這個庫函數,調用方法:[ev,ed]=eig(s).ed爲特徵值矩陣,ev特徵向量矩陣,排列順序:從低階到高階.》s=[2291.333 1340 1934 2523.333 1245.333 2482; 1340 956.6667 1596 1401.333 883.3333 1480;1934 1596 4281.667 1436.667 1663 1945.667;2523.333 1401.333 1436.667 2984.667 1236 2800.667; 1245.333 883.333 1663 1236 843 1343;2482 1480 1945.667 2800.667 1343 2729.667]》[ev,ed]=eig(s)

添加新評論

暱稱
郵箱
網站