logo

Matricea de covarianță

Matricea de covarianță este un tip de matrice utilizată pentru a descrie valorile de covarianță între doi elemente dintr-un vector aleator. Este cunoscută și sub denumirea de matrice varianță-covarianță deoarece varianța fiecărui element este reprezentată de-a lungul diagonalei majore a matricei, iar covarianța este reprezentată printre elementele non-diagonale. O matrice de covarianță este de obicei o matrice pătrată. Este, de asemenea, semidefinită pozitivă și simetrică. Această matrice este utilă atunci când vine vorba de modelarea stocastică și analiza componentelor principale.

Ce este matricea de covarianță?

The varianţă -matricea de covarianta este a matrice pătrată cu elemente diagonale care reprezintă varianța și componentele nediagonale care exprimă covarianța. Covarianța unei variabile poate lua orice valoare reală - pozitivă, negativă sau zero. O covarianță pozitivă sugerează că cele două variabile au o relație pozitivă, în timp ce o covarianță negativă indică faptul că nu. Dacă două elemente nu variază împreună, ele au o covarianță zero.



Află mai multe, Matricea diagonală

Exemplu de matrice de covarianță

Să presupunem că există 2 seturi de date X = [10, 5] și Y = [3, 9]. Varianta multimii X = 12,5 si varianta multimii Y = 18. Covarianta intre ambele variabile este -15. Matricea de covarianță este următoarea:

egin{bmatrix} Variance~of~Set~X & Coorelation~of~Both~Sets Coorelation~of~Both~Sets& Variance~of~Set~Y end{bmatrix}=egin{bmatrix} 12.5 & -15 -15& 18 end{bmatrix}

Formula matricei de covarianță

Forma generală a unei matrice de covarianță este dată după cum urmează:

Matricea de covarianță

Unde,

  • Varianta eșantionului: unde (x1) =frac{sum_{1}^{n}left ( x_{i} -overline{x} ight )^{2} }{n-1}
  • Eșantion de covarinace: cel (x1, și1) =frac{sum_{1}^{n}left (x_{i} -overline{x} ight )left(y_{i}-overline{y} ight)}{n-1}
  • Varianta populației: unde (xn) =frac{sum_{1}^{n}left ( x_{i} -mu ight )^{2} }{n}
  • Covarianța populației: cel (xn, șin) =frac{sum_{1}^{n}left ( x_{i} -mu_{x} ight )left ( y_{i}-mu_{y} ight ) }{n}

Aici, m este Media Populației

overline x este media eșantionului

n este numărul de observații

X i este observația din setul de date x

Să vedem formatul matricei de covarianță a 2 ⨯ 2 și 3 ⨯ 3

2 2 Matricea de covarianță

Știm că într-un 2 ⨯ 2 matrice sunt două rânduri și două coloane. Prin urmare, matricea de covarianță 2 ⨯ 2 poate fi exprimată caegin{bmatrix}mathrm{var(x)}& mathrm{cov(x,y)} \mathrm{cov(x,y)} &mathrm{var(y)}end{bmatrix}

3 3 Matricea de covarianță

Într-o matrice 3⨯3 există 3 rânduri și 3 coloane. Știm că într-o matrice de covarianță elementele diagonale sunt varianță și elementele nediagonale sunt covarianță. Prin urmare, o matrice de covarianță 3⨯3 poate fi dată caegin{bmatrix}mathrm{var(x)}&mathrm{cov(x,y)} &mathrm{cov(x,z)} \mathrm{cov(x,y)} &mathrm{var(y)} &mathrm{cov(y,z)} \mathrm{cov(x,z)} &mathrm{cov(y,z)} &mathrm{var(z)} \end{bmatrix}

Cum să găsiți matricea de covarianță?

Dimensiunile unei matrice de covarianță sunt determinate de numărul de variabile dintr-un set de date dat. Dacă există doar două variabile într-o mulțime, atunci matricea de covarianță ar avea două rânduri și două coloane. În mod similar, dacă un set de date are trei variabile, atunci matricea sa de covarianță ar avea trei rânduri și trei coloane.

Datele se referă la notele obținute de Anna, Caroline și Laura în psihologie și istorie. Faceți o matrice de covarianță.

Student Psihologie(X) Istorie (Y)
Anna 80 70
Caroline 63 douăzeci
Laura 100 cincizeci

Trebuie urmați următorii pași:

cel mai frumos zâmbet

Pasul 1: Aflați media variabilei X. Însumați toate observațiile din variabila X și împărțiți suma obținută cu numărul de termeni. Astfel, (80 + 63 + 100)/3 = 81.

Pasul 2: Scădeți media din toate observațiile. (80 – 81), (63 – 81), (100 – 81).

Pasul 3: Luați pătratele diferențelor obținute mai sus și apoi adunați-le. Astfel, (80 – 81)2+ (63 – 81)2+ (100 – 81)2.

Pasul 4: Aflați varianța lui X împărțind valoarea obținută la pasul 3 la 1 mai puțin decât numărul total de observații. var(X) = [(80 – 81)2+ (63 – 81)2+ (100 – 81)2] / (3 – 1) = 343.

Pasul 5: În mod similar, repetați pașii de la 1 la 4 pentru a calcula varianța lui Y. Var(Y) = 633.

Pasul 6: Alegeți o pereche de variabile.

Pasul 7: Scădeți media primei variabile (X) din toate observațiile; (80 – 81), (63 – 81), (100 – 81).

Pasul 8: Repetați același lucru pentru variabila Y; (70 – 47), (20 – 47), (50 – 47).

Pasul 9: Înmulțiți termenii corespunzători: (80 – 81)(70 – 47), (63 – 81)(20 – 47), (100 – 81)(50 – 47).

Pasul 10: Găsiți covarianța adunând aceste valori și împărțindu-le la (n – 1). Cov(X, Y) = (80 – 81)(70 – 47) + (63 – 81)(20 – 47) + (100 – 81)(50 – 47)/3-1 = 481.

Pasul 11: Utilizați formula generală pentru matricea de covarianță pentru a aranja termenii. Matricea devine:egin{bmatrix} 343 & 481 481& 633 end{bmatrix}

Proprietățile matricei de covarianță

Proprietățile matricei de covarianță sunt menționate mai jos:

  • O matrice de covarianță este întotdeauna pătrată, ceea ce implică faptul că numărul de rânduri dintr-o matrice de covarianță este întotdeauna egal cu numărul de coloane din ea.
  • O matrice de covarianță este întotdeauna simetrică, ceea ce implică faptul că transpune a unei matrice de covarianță este întotdeauna egală cu matricea originală.
  • O matrice de covarianță este întotdeauna pozitivă și semidefinită.
  • The valori proprii ale unei matrice de covarianță sunt întotdeauna reale și nenegative.

Citeşte mai mult,

  • Tipuri de Matrici
  • Înmulțirea matriceală
  • Varianta si abaterea standard

Exemple rezolvate pe matricea de covarianță

Exemplul 1: Notele obținute de 3 studenți la Fizică și Biologie sunt prezentate mai jos:

StudentFizica(X)Biologie (Y)
A 92 80
B 60 30
C 100 70

Calculați matricea de covarianță din datele de mai sus.

Soluţie:

Matricea de covarianță eșantion este dată defrac{sum_{1}^{n}left ( x_{i} -overline{x} ight )^{2} }{n-1} .

Aici, μX= 84, n = 3

var(x) = [(92 – 84)2+ (60 – 84)2+ (100 – 84)2] / (3 – 1) = 448

Deci, μși= 60, n = 3

javascript

var(y) = [(80 – 60)2+ (30 – 60)2+ (70 – 60)2] / (3 – 1) = 700

Acum, cov(x, y) = cov(y, x) = [(92 – 84)(80 – 60) + (60 – 84)(30 – 60) + (100 – 84)(70 – 60)] / (3 – 1) = 520.

Matricea de covarianță a populației este dată astfel:egin{bmatrix} 448 & 520 520& 700 end{bmatrix}

Exemplul 2. Pregătiți matricea de covarianță a populației din următorul tabel:

VârstăNumărul de persoane
29 68
26 60
30 58
35 40

Soluţie:

Varianta populatiei este data defrac{sum_{1}^{n}left ( x_{i} -mu ight )^{2} }{n} .

Aici, μX= 56,5, n = 4

var(x) = [(68 – 56,5)2+ (60 – 56,5)2+ (58 – 56,5)2+ (40 – 56,5)2]/4 = 104,75

Deci, μși= 30, n = 4

var(y) = [(29 – 30)2+ (26 – 30)2+ (30 – 30)2+ (35 – 30)2] / 4 = 10,5

Acum, cov(x, y) =frac{sum_{1}^{4}left ( x_{i} -mu_{x} ight )left ( y_{i}-mu_{y} ight ) }{4}

cov(x, y) = -27

Matricea de covarianță a populației este dată astfel: egin{bmatrix} 104.7 &-27 -27& 10.5 end{bmatrix}

Exemplul 3. Interpretați următoarea matrice de covarianță:

egin{bmatrix} & X & Y & Z X & 60 & 32 & -4 Y & 32 & 30 & 0 Z & -4 & 0 & 80 end{bmatrix}

Soluţie:

  1. Elementele diagonale 60, 30 și 80 indică variația în seturile de date X, Y și respectiv Z. Y arată cea mai mică varianță, în timp ce Z afișează cea mai mare varianță.
  2. Covarianța pentru X și Y este 32. Deoarece acesta este un număr pozitiv, înseamnă că atunci când X crește (sau scade) și Y crește (sau scade)
  3. Covarianța pentru X și Z este -4. Fiind un număr negativ, înseamnă că atunci când X crește, Z scade și invers.
  4. Covarianța pentru Y și Z este 0. Aceasta înseamnă că nu există o relație predictibilă între cele două seturi de date.

Exemplul 4. Găsiți matricea de covarianță eșantion pentru următoarele date:

XȘICU
75 10.5 Patru cinci
65 12.8 65
22 7.3 74
cincisprezece 2.1 76
18 9.2 56

Soluţie:

Matricea de covarianță eșantion este dată defrac{sum_{1}^{n}left ( x_{i} -overline{x} ight )^{2} }{n-1} .

n = 5, mX= 22,4, var(X) = 321,2 / (5 – 1) = 80,3

mși= 12,58, var(Y) = 132,148 / 4 = 33,037

mCu= 64, var(Z) = 570 / 4 = 142,5

cov(X, Y) =frac{sum_{1}^{5}left ( x_{i} -22.4 ight )left ( y_{i}-12.58 ight ) }{5-1} = -11.76

cov(X, Z) =frac{sum_{1}^{5}left ( x_{i} -22.4 ight )left ( z_{i}-64 ight ) }{5-1} = 34.97

cov(Y, Z) = frac{sum_{1}^{5}left ( y_{i} -12.58 ight )left ( z_{i}-64 ight ) }{5-1} = -40.87

Matricea de covarianță este dată astfel:

egin{bmatrix} 80.3 & -13.865 &14.25 -13.865 & 33.037 & -39.5250 14.25 & -39.5250 & 142.5 end{bmatrix}

Întrebări frecvente despre Covariance Matrix

1. Definiți matricea de covarianță

O matrice de covarianță este un tip de matrice utilizată pentru a descrie valorile de covarianță între doi elemente dintr-un vector aleator.

2. Care este formula pentru matricea de covarianță?

Formula pentru matricea de covarianță este dată ca

left[egin{array}{ccc} operatorname{Var}left(x_1 ight) & ldots ldots & operatorname{Cov}left(x_n, x_1 ight) vdots & ldots & vdots vdots & ldots & vdots operatorname{Cov}left(x_n, x_1 ight) & ldots ldots & operatorname{Var}left(x_n ight) end{array} ight]

Unde, Varianta eșantionului: unde (x1) =frac{sum_{1}^{n}left ( x_{i} -overline{x} ight )^{2} }{n-1}

  • Eșantion de covarinace: cel (x1, și1) =frac{sum_{1}^{n}left (x_{i} -overline{x} ight )left(y_{i}-overline{y} ight)}{n-1}
  • Varianta populației: unde (xn) =frac{sum_{1}^{n}left ( x_{i} -mu ight )^{2} }{n}
  • Covarianța populației: cel (xn, șin) =frac{sum_{1}^{n}left ( x_{i} -mu_{x} ight )left ( y_{i}-mu_{y} ight ) }{n}

3. Care este forma generală a unei matrice de covarianță 3 ⨯ 3?

Forma generală a unei matrice de covarianță 3 ⨯ 3 este dată după cum urmează:

egin{bmatrix}mathrm{var(x)}&mathrm{cov(x,y)} &mathrm{cov(x,z)} \mathrm{cov(x,y)} &mathrm{var(y)} &mathrm{cov(y,z)} \mathrm{cov(x,z)} &mathrm{cov(y,z)} &mathrm{var(z)} \end{bmatrix}

4. Care sunt proprietățile matricei de covarianță?

Matricea de covarianță este o matrice pătrată și este, de asemenea, de natură simetrică, adică transpunerea matricei originale dă matricea originală în sine.

5. Care sunt sectoarele în care poate fi utilizată Matricea de covarianță?

Covariance Matrix este utilizată în domeniul matematicii, învățării automate, finanțelor și economiei. Matricea de covarianță este utilizată în descompunerea Cholskey pentru a efectua simularea Monte Carlo, care este utilizată pentru a crea modele matematice.