{"id":281,"date":"2021-01-05T15:52:13","date_gmt":"2021-01-05T14:52:13","guid":{"rendered":"https:\/\/intsight.com\/?p=281"},"modified":"2023-03-01T13:23:47","modified_gmt":"2023-03-01T12:23:47","slug":"covarianza","status":"publish","type":"post","link":"https:\/\/intsight.com\/index.php\/2021\/01\/05\/covarianza\/","title":{"rendered":"Covarianza"},"content":{"rendered":"<p><span style=\"font-variant: small-caps;\">Recordemos c\u00f3mo<\/span> se define la <a href=\"https:\/\/intsight.com\/index.php\/2020\/06\/29\/varianza\/\">varianza<\/a> de una variable aleatoria <em>X<\/em>:<br \/>\n$$<br \/>\nVar(X) = \\mathbb{E}[(X &#8211; \\mathbb{E}[X])^2]<br \/>\n$$Vamos a suponer que tenemos, en vez de una, dos variables aleatorias, $X$ e $Y$. Si manipulamos un poco la definici\u00f3n de varianza, obtendremos la definici\u00f3n de la <em>covarianza<\/em> entre dos variables:<br \/>\n$$<br \/>\nCov(X, Y) = \\mathbb{E}[(X &#8211; \\mathbb{E}[X])*(Y &#8211; \\mathbb{E}[Y])]<br \/>\n$$Seg\u00fan esta definici\u00f3n, la varianza de una variable es la covarianza de la variable consigo misma, por lo que la definici\u00f3n parece tener sentido:<br \/>\n$$<br \/>\nVar(X) = Cov(X, X)<br \/>\n$$Adem\u00e1s, la covarianza es sim\u00e9trica respecto a los argumentos:<br \/>\n$$Cov(X,Y)=Cov(Y,X)<br \/>\n$$La interpretaci\u00f3n de la covarianza no es del todo inmediata. En este caso sencillo, si la covarianza es positiva, cuando la $X$ aumenta, tambi\u00e9n aumenta la $Y$: las variaciones van coordinadas en la misma direcci\u00f3n. Si la covarianza es negativa, cuando $X$ aumenta, la $Y$ disminuye. Si la covarianza es cero, son variables independientes. Sin embargo, para medir el grado de relaci\u00f3n entre dos variables aleatorias, existe una medida mejor, llamada precisamente <em>correlaci\u00f3n<\/em>. Dedicar\u00e9, en otro momento, una entrada a la correlaci\u00f3n. De momento, puedo adelantar que la correlaci\u00f3n es una forma de covarianza \u00abnormalizada\u00bb para que sus valores vayan siempre entre menos uno y uno.<\/p>\n<h4>Matrices de covarianza<\/h4>\n<p>Los valores de las varianzas y la covarianza de dos variables se pueden organizar en una tabla o matriz:<br \/>\n$$\\pmatrix{Cov(X,X)&amp;Cov(X,Y)\\cr Cov(Y,X)&amp;Cov(Y,Y)}<br \/>\n$$<br \/>\nEsto nos interesa porque el siguiente paso es extender la definici\u00f3n de covarianza a cualquier n\u00famero de variables aleatorias. Por ejemplo, con tres variables aleatorias:<br \/>\n$$<br \/>\n\\pmatrix{c_{1,1}&amp;c_{1,2}&amp;c_{1,3} \\cr c_{2,1}&amp;c_{2,2}&amp;c_{2,3} \\cr c_{3,1}&amp;c_{3,2}&amp;c_{2,3}}<br \/>\n$$Como es f\u00e1cil de entender, una matriz de covarianza es una matriz sim\u00e9trica, por definici\u00f3n.<\/p>\n<h4>Matrices semidefinidas positivas<\/h4>\n<p>Una matriz de covarianza tiene siempre la interesante propiedad de ser <em>semidefinida positiva<\/em>. Para todo vector <em>x<\/em> se debe cumplir lo siguiente:<br \/>\n$$<br \/>\n\\forall x : x^T \\cdot \\Sigma \\cdot x \\ge 0<br \/>\n$$Vamos a interpretar geom\u00e9tricamente la propiedad en cuesti\u00f3n. Lo que estamos haciendo es transformar el vector <em>x<\/em> con la matriz de covarianza. Luego calculamos el producto escalar del vector respecto al vector transformado. Si decimos que ese producto escalar es mayor o igual a cero, estamos diciendo que, sin importar el n\u00famero de dimensiones del vector y la matriz, el \u00e1ngulo entre el vector y el vector transformado est\u00e1 siempre entre -\u03c0\/2 y +\u03c0\/2. En otras palabras, la matriz nunca \u00abretuerce\u00bb demasiado los vectores que transforma.<\/p>\n<p>\u00bfNos sirve de algo esta imagen visual? Pues no lo s\u00e9. Pero me gusta tener presente este tipo de interpretaciones gr\u00e1ficas. Por experiencia, terminas encontr\u00e1ndole un uso m\u00e1s tarde o m\u00e1s temprano.<\/p>\n<p>Esto s\u00ed es importante: una matriz semidefinida positiva tiene, obligatoriamente, un determinante mayor o igual que cero. Este criterio puede servir para descartar r\u00e1pidamente matrices de covarianza mal construidas. De hecho, si el determinante es cero, es porque existen variables aleatorias redundantes.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Recordemos c\u00f3mo se define la varianza de una variable aleatoria X: $$ Var(X) = \\mathbb{E}[(X &#8211; \\mathbb{E}[X])^2] $$Vamos a suponer que tenemos, en vez de una, dos variables aleatorias, $X$ e $Y$. Si manipulamos un poco la definici\u00f3n de varianza, obtendremos la definici\u00f3n de la covarianza entre dos variables: $$ Cov(X, Y) = \\mathbb{E}[(X &#8211; [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":282,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"jetpack_post_was_ever_published":false,"_jetpack_newsletter_access":"","_jetpack_dont_email_post_to_subs":false,"_jetpack_newsletter_tier_id":0,"_jetpack_memberships_contains_paywalled_content":false,"_jetpack_memberships_contains_paid_content":false,"footnotes":""},"categories":[7],"tags":[18,20,30,29],"class_list":["post-281","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-fintech","tag-covariance","tag-matrices","tag-statistics","tag-variance"],"jetpack_featured_media_url":"https:\/\/i0.wp.com\/intsight.com\/wp-content\/uploads\/2020\/07\/light.png?fit=350%2C350&ssl=1","jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/intsight.com\/index.php\/wp-json\/wp\/v2\/posts\/281","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/intsight.com\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/intsight.com\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/intsight.com\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/intsight.com\/index.php\/wp-json\/wp\/v2\/comments?post=281"}],"version-history":[{"count":43,"href":"https:\/\/intsight.com\/index.php\/wp-json\/wp\/v2\/posts\/281\/revisions"}],"predecessor-version":[{"id":1147,"href":"https:\/\/intsight.com\/index.php\/wp-json\/wp\/v2\/posts\/281\/revisions\/1147"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/intsight.com\/index.php\/wp-json\/wp\/v2\/media\/282"}],"wp:attachment":[{"href":"https:\/\/intsight.com\/index.php\/wp-json\/wp\/v2\/media?parent=281"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/intsight.com\/index.php\/wp-json\/wp\/v2\/categories?post=281"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/intsight.com\/index.php\/wp-json\/wp\/v2\/tags?post=281"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}