Arthur Charpentier

Aller au contenu | Aller au menu | Aller à la recherche

Keyword - correlation

Fil des billets

jeudi 18 mars 2010

Exchange rates and correlation matrices

http://blogperso.univ-rennes1.fr/arthur.charpentier/public/perso2/.euro_dollar_yen_s.jpg I wanted to upload here a small problem I started to work on.... unfortunatley, I could not find (yet) a proper answer. Any comments and suggestions are welcomed. The problem is simple: consider 3 random variables that can be interpreted as exchange rates. Thus X is the exchange rate USD versus EUR, Y is the exchange rate EUR versus YEN, while Z is the exchange rate USD versus YEN. We then have the following constraint XY=Z. Given that constraint, what are the implied constraints on the correlation matrix of random vector (X,Y,Z) ?

  • Bounds on correlation
There are classically standard constraints on correlation. For instance, from Cauchy-Schwarz’s inequality
http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-01.png
but those bounds are not necessarily sharp, given distributions of http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-02.png and http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-03.png. From Fréchet-Hoeffding bounds, we know that
http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-04.png
where http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-05.png. Further, correlation matrices are necessarily positive-semidefinite matrices.
To go further to find possible bounds, recall that
http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-06.png
and therefore
http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-07.png
i.e.
http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-08.png
Similarity, http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-09.png will be a function of http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-10.png.
Thus, given marginal distributions of http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-02.png and http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-03.png, covariances (and also correlations http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-11.png and http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-12.png) are functions of L'image “http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-13.png” ne peut être affichée car elle contient des erreurs.,http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-14.png and http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-15.png.
Somehow, we have obtained 2 degrees of freedom: if there are no additional constraints on those two coefficients, there should be no other constraints than having positive-semidefinite matrices.
I guess that http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-14.png and http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-15.png should not be connected. Those quantities are related to the co-skewness* and they should be different when dependence is asymmetric.
Given a 3 parameter copula for pair http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-16.png, respectively describing global dependence (that can be related to L'image “http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-13.png” ne peut être affichée car elle contient des erreurs. and tail asymmetry (that should be related either to http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-14.png and http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-15.png depending on the corner) it should be possible to derive any kind of triplets.
  • Running simulations

I have tried to generate a lot of samples. The idea is to draw pairs from mixtures of Marshall-Olkins’ copula (wich are asymmetric), where parameters where generated randomly. I draw 250 values according to that copula. Then, the third variable is obtained taking the product of normalized pairs (or Studentized). And then calculate the associated correlation matrix.

  1.  draw http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-17.png from http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-18.png (but actually any positive distribution should work) and http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-19.png
  2. do 250 times the following (index http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-20.png)
  • draw http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-21.png with a Bernoulli http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-22.png distribution
  • draw http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-23.png from copula http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-24.png if http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-25.png and http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-27.png if http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-26.png
  • set http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-28.png and http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-29.png, and http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-30.png
  1. estimate the correlation of sample http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-31.png
In dimension 3, I have the following graph, 

In order to get a better understanding, I look at slices, for instance when http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-32.png. On the graph on the right, to dark area are values that can not be obtained since correlation have to be positive-semidefinite. Dots are points that have been obtained in a particular scenario. I have also included the convex hull if the points obtained with all the scenarios (here 50,000 scenarios), since I assume that the set of positive correlation is necessarily convex. Graphs below have been obtained when http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-33.png and http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-34.png
So far I have not been able to obtain all possible correlations, I guess...  If anyone has suggestions...
* Recall that the co-skewness matrix, in dimension 2, for a pair http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-35.png is simply
http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-36.png
where http://perso.univ-rennes1.fr/arthur.charpentier/latex/change-corr-37.png.

samedi 3 octobre 2009

ECO550, Economics of uncertainty and finance (2)

Troisième PC à l’X, avec les exercices disponibles bientôt ici.  Pour poursuivre sur la représentation "moyenne-variance", la figure ci-dessous montre l’evolution de la frontière d’efficience en fonction de l’évolution de la corrélation entre les rendements, dans le cas où l’on dispose de 2 titres risqués (exercice 1),On peut aussi rajouter un actif sans risque, ce qui permet, classiquement, de construire la frontière d’efficience comme une combinaison linéaire entre l’actif sans risque et le portefeuille tangent. Sur l’animation suivante (où l’on fait évoluer la corrélation entre les actifs), on peut voir évoluer la frontière d’efficience pour différents niveaux de taux sans risques,En particulier, sur l’exemple en bas, le taux sans risque correspond au rendement espéré de l’actif risqué ayant le plus faible rendement (espéré)... Ceci correspond à une des questions de la PC: oui, on peut éventuellement être intéressé par un actif, même si son rendement espéré n’excède pas le rendement sans risque (null excess return).

Sur les figures suivante, on regarde toujours l’évolution de la frontière d’efficience en fonction de corrélations dans le cas où l’on peut investir sur un marché composé de trois actifs risqués.Sur la figure ci-dessus, seule la corrélation entre les actifs les moins risqués évolue, et sur la figure ci-dessous,  c’est la corrélation entre les actifs les plus risqués qui change.

jeudi 10 septembre 2009

(nouveau) petit retour sur la corrélation (1)

Ce qui me surprendra toujours dans mon boulot de prof’, c’est que le temps passe, mais les questions sont souvent toujours les mêmes (c’est d’ailleurs sur la base de ce constat que j’avais commencé ce blog, en espérant donner des réponses une fois pour toutes). J’ai été surpris par une question qui m’a été posée par un étudiant ce soir, suite au cours de rappels de probas, car c’était presque mot pour mot une question qui m’avait été posée durant l’été 98, quand j’effectuais mon stage de fin de 2ème année à l’ensae (c’est à dire de M1)1 en salle de marché "peut-on interpréter la corrélation (linéaire, au sens de Pearson) comme une probabilité ?". En effet, si tel était le cas, il aurait été plus simple (?) d’intégrer des matrices de corrélation dans le modèle que nous considérions à l’époque.
  • une vieille réponse, avec des simulations
Il y a 11 ans, j’avais quand même passé une ou deux journées pour essayer de faire une réponse intelligente2, et j’ai eu envie de reprendre ce que j’avais alors répondu à mon directeur de stage. Considérons pour cela un vecteur Gaussien, centré et réduit,
http://perso.univ-rennes1.fr/arthur.charpentier/eqn5336.gif

 http://perso.univ-rennes1.fr/arthur.charpentier/eqn5337.gif
La question peut être retraduite sous la forme suivante: peut-on relier http://perso.univ-rennes1.fr/arthur.charpentier/eqn5338.gif (la corrélation) et
qui était la seule probabilité exprimant une certaine forme de dépendance à laquelle je pensais alors, à savoir la probabilité que les deux varient dans le même sens. C’est ce qu’on retrouve visuellement sur les dessins ci-dessous avec une corrélation négative, puis nulle, puis deux positives,
En fait, je ne le savais pas à l’époque, mais cette probabilité est ce qu’on appelle une probabilité de "concordance" qui est une notion étroitement liée à celle de dépendance et donc de corrélationÉtant nul en calculs (ça n’a pas changé en 11 ans là non plus) j’ai fait du MonteCarlo pour tenter de répondre à la question3.
>  library(mnormt)
>  R=seq(-.99,.99,by=.01); n=length(R)
>  P=rep(NA,n); nsimul=500
>  for(i in 1:n){
>  Z=rmnorm(nsimul,mu=c(0,0),sigma=matrix(c(0,R[i],R[i],0),2,2))
>  P=mean( Z[,1]*Z[,2]>0 )}
>  plot(R,P)
En faisant alors un peu d’économétrie, j’avais alors trouvé cette belle courbe, liant corrélation et probabilité....En fait, maintenant que j’ai lu des livres savants, je sais que la vraie relation est que
soit graphiquement
> u=seq(-1,1,by=.01)
> v=asin(u)/pi+.5 

La vraie courbe est en vert sur le graphique ci-dessous,Avec le recul, je me rends compte que là non plus je n’ai pas beaucoup changé car la philosophie proposée ici pour résoudre mon problème est la même que celle que j’avais développée là.
  • une réponse un peu actualisée
A l’époque, j’avais répondu que je ne pensais pas qu’il existait de lien "simple" entre un coefficient de corrélation et une quelconque probabilité. La seule différence entre maintenant et il y a 11 ans est que je suis maintenant prof’, et que donc "on" attend de moi une réponse plus détaillée sur le sujet4. Qu’à cela ne tienne.... je vais continuer à y réfléchir.... à suivre donc....

1 pour remettre dans le contexte - car lui non plus n’a pas beaucoup changé (11 ans après, j’ai des étudiants qui travaillent toujours sur les choses que j’avais un peu défiché alors) - j’étais alors en salle de marché, et pour un modèle de risque de crédit, on s’était inspiré de CreditMetrics de JPMorgan, c’est à dire - fondamentalement - un gros modèle probit (on disait un modèle de Merton pour faire savant). Or cela suppose que le défaut d’un émetteur obligataire survenait quand sa "valeur" devenait trop faible, et que cette "valeur"  suivait une loi normale. Avec plusieurs émetteurs, on avait alors un vecteur de "valeurs" que l’on supposait Gaussien (comme le notait alors la critique fort juste de David Li, cf ici). Bref, les émetteurs étaient corrélés via une matrice de corrélation entre émetteurs (la corrélation étant supposée forte pour les émetteurs dans un même pays, ou dans un même secteur d’activité), autrement dit, on construisait un joli modèle hiérarchique. Et lors de la construction de la matrice de corrélation, pour attribuer des valeurs ad-hoc, mon maitre de stage m’avait alors posé cette question.
La question qui avait suivi était "si on construit une matrice à la main, comment teste-t-on que l’on construit une matrice de corrélation ?". Je n’avais pas trouvé de réponse satisfaisante, et j’ai découvert depuis que ça pouvait être une question complexe, en grande dimension....
2 là aussi pour la petite histoire (ou pour expliquer ma réponse d’alors) le livre de Roger Nelsen n’était par sorti, et je n’ai découvert le livre de Harry Joe que fin 98, lorsqu’Alexander McNeil est venu faire un short course à l’ensae.
3 pour être honnête, à l’époque je n’avais pas fait sur R mais du Gauss, grâce à Thierry Roncalli qui m’avait alors fait découvrir ce langage fabuleux. J’en profite pour te remercier ici.
4 j’avais fait ici un billet pour montrer que sur des questions aussi simples, il n’existait pas forcément, a priori, de réponses simples et toutes faites. De plus ce blog est avant tout un espace de discussion, et pas de cours magistral.

Causalité et corrélation, Cum hoc ergo propter hoc

Voilà quelque temps que je promets un billet sur la causalité et la corrélation, il serait temps que je m’y colle1....

Pour ceux qui ont séché les cours de latin au collège (ou de philo au lycée), "cum hoc ergo propter hoc" signifie littéralement "avec ceci, donc à cause de ceci", qui est un sophisme bien connu consistant à défendre une conclusion de nature causale simplement en invoquant le fait qu’il y a corrélation entre deux phénomènes. (comme le note le dictionnaire de philosophie, ici). Par exemple, fut un temps (disons au Moyen Age) où l’on croyait dur comme fer qu’avoir des poux permettait de rester en bonne santé car les malades n’en avaient pas.
Il existe toutefois beaucoup d’autres exemples (connus) de fausse causalité, où d’évènements pensés de manière causale, alors qu’il n’en est rien. Un exemple assez classique en économétrie est la "regression fallacy" correspondant à l’explication d’une variable par un bruit blanc (une autre variable complètement indépendante, a priori). De manière plus littéraire, prenons l’exemple où je me suis endormis hier avec un mal de crâne, ce matin j’ai pris une tartine avec une confiture à la rhubarbe, et toute la journée, je n’ai pas eu mal à la tête: manger de la rhubarbe évite le mal de crâne !
Il existe aussi un autre exemple plus classique pour les amateurs de jeux de hasard, parfois appelé "gambler’s fallacy" (ou que tous les parents qui ont joué avec leurs enfants aux petits cheveaux connaissent aussi très bien). Si je lance deux dés et que je tombe sur un double 6 du premier coup, c’est que les dés sont pipés ! C’est tout simplement croire qu’un événement de faible probabilité ne peut apparaître qu’après de nombreux essais.... Les actuaires connaissent ça avec la notion de période de retour: en 1999 on a eu des tempêtes centennaires en France, mais il aurait parfaitement possible d’en ravoir dès 2000.... C’est la même chose que l’émerveillement face au tirage du loto: « Ce type à la télé a gagné le gros lot. Incroyable! Il y avait une chance sur un million » Effectivement, il fallait un vainqueur: prévoir a priori qui sera vainqueur est très difficile, mais constater a posteriori qu’il y a un vainqueur (et trouver ça incroyable) est normal.
Je donne des exemples assez triviaux, mais on tombe rapidement sur des perles en se baladant un peu sur le net, par exemple "Intelligent Children More Likely To Become Vegetarian" (ici, ou comme le dit l’introduction "Intelligent children may be more likely to be vegetarian as adults, suggests a study published online by the British Medical Journal"), "Eating pizza cuts cancer risk’" (ici, ou "Italian researchers say eating pizza could protect against cancer"), "Luckiest people born in summer’" (ici, ou "People born in summer have a sunnier outlook than those born in colder months, the results of a survey show"), ou enfin "People who sleep 6 hours a night live longer then eight or more" (ici, ce qui devrait m’inciter à dormir moins la nuit). J’en passe et des (probablement) meilleures.
Pour être tout à fait honnête, je ne prétendrais pas qu’il est toujours facile de distinguer causalité et corrélation, loin de là. Un exemple classique est celui du lien entre la concentration en CO2 et le réchauffement climatique

Avant d’aller un peu plus loin dans la réflexion (je ne sais pas si c’est un hoax ou pas, mais en l’état je vais prendre ça au second degré), l’institut de sondage Gallup aux Etats-Unis a posé la question suivante: "Do you believe correlation implies causation ?" (l’article en question se trouve ici). Il semble que ce soit le cas pour 2/3 des personnes interrogées, "An overwhelming 64% of American’s answered "YES", while only 38% replied "NO"". Comme le note un des analystes du sondage, "Now, with the results of the latest poll, we are able to determine that people’s lack of belief in correlation not being causal has caused correlation to now become causal. It is a real advance in the field of meta-epistemology."
En fait, cette histoire a été abondament traité en logique, et donc en philosophie...
Plusieurs grands philosophes se sont penchés sur le problème de la causalité (qui est un problème central en espistémologie). Parmi les philosophes les plus importants sur cette question, on notera tout d’abord Emmanuel Kant, pour qui la causalité fait parti des concepts a priori de l’entendement: on ne peut pas penser sans le principe de causalité, il existe avant même toute connaissance empirique.
Plusieurs grands philosophes se sont penchés sur le problème de la causalité (qui est un problème central en espistémologie). Parmi les philosophes les plus importants sur cette question, on notera tout d’abord Emmanuel Kant, pour qui la causalité fait parti des concepts a priori de l’entendement: on ne peut pas penser sans le principe de causalité, il existe avant même toute connaissance empirique.
Sur ce point, il s’appose à David Hume, qui pense le contraire: c’est parce que l’on s’habitue à voir deux phénomènes se succéder que l’on induit qu’ils sont liés par un lien de causalité. Pour reprendre l’analyse de Hume dans Enquête sur l’entendement humain, "Les hommes, en général, ne trouvent jamais de difficulté à expliquer les opérations les plus communes et les plus familières de la nature - telles que la chute des graves, la croissance des plantes, la génération des animaux ou la nutrition des corps par les aliments; et ils admettent que, dans tous les cas, ils perçoivent la force même ou l’énergie de la cause, qui la met en connexion avec son effet et qui est constamment infaillible dans son action". Il y a ainsi une "causalité nécessaire".
On peut aussi retenir les réflexions de Karl Popper pour qui la connaissance est un processus hypothético-déductif, autrement dit, ce n’est pas en observant les faits que l’on peut faire des prédictions.
Je reviendrais sur l’aspect statistique de ce problème dans un prochain billet.
1 j’ai un peu la pression car pas mal de monde a écrit sur le sujet... il y a même un blog (ici) intitulé correlation-causality.blogspot.com ! Sinon Greg Mankin en parle aussi sur son blog (de manière plus humoristique, ici).

vendredi 19 juin 2009

Paradoxe de Simpson et corrélations entre variables explicatives

Suite au commentaire de Jean-Edouard (ici), et à la réponse que j’ai tenté de faire, j’ai voulu faire un tout petit complément sur le paradoxe de Simpson, que j’aime interpréter comme un problème de multicolinéarité (et de variables explicatives corrélées, et qui ne peuvent donc être traitées indépendamment*). Prenons un exemple simple pour comprendre le problème. On a deux hopitaux dans une ville; avec les statistiques suivantes,
hôpital total survivantsdécèstaux de
survie

hopital A 1000 80020080%
hopital B 1000 90010090% x

Le jour où on tombe malade, on a tout intérêt à aller dans l’hopital B, non ?
En fait, on a un peu plus d’information. Certaines personnes vont à l’hopital pour un contrôle et peuvent être considérées comme "en bonne santé". D’autres non. On a en fait les statistiques suivante. Pour les personnes "saines",

hôpital total survivantsdécèstaux de
survie

hopital A 600 5901098% x
hopital B 900 8703097% 

Et pour les personnes "malades" (on suppose vraiment que le critère est identique pour les deux hopitaux)

hôpital total survivantsdécèstaux de
survie

hopital A 400 21019053% x
hopital B 100 307030% 

Autrement dit, peu importe son état de santé, on a toujours intérêt à choisir l’hopital A. D’où le paradoxe.
En fait, la réponse est simple: l’état de santé et le choix de l’hopital ne sont pas du tout des variables indépendantes, loin de là ! Manifestement l’hopital B accepte très peu de personnes malades, afin précisément de faire gonfler artificiellement les statistiques, mais manifestement, l’hopital A est bien meilleur !
Ce paradoxe est très connu, et on remonte souvent à des admissions dans des master à Berkley pour expliquer l’idée de la discrimination positive. Considérons 4 master (notés A, B, C et D), et regardons le taux d’admission en fonction du sexe.

sexe postulants admistaux d’
admission

Hommes 2074 101848% x
Femmes 849 26130% 

Là encore, un raisonnement un peu simpliste pousserait à dire que les filles sont peu admises en Master, il faudrait alors les soutenir en mettant en place des quotas, etc. Bref, mettre en place une espèce de discrimination positive  pour aider les filles à entrer. Mais si on distingue suivant les Master, on a les résultats suivants. Pour les Hommes,

master postulants admistaux d’
admission

Master A 825 51162% 
Master B 560 35363% 
Master C41713833%
Master D272166% 

et pour les Femmes

master postulants admistaux d’
admission

Master A 108 8982% x
Master B 25 1768% x
Master C37513135% x
Master D341247% x

Damned, en fait ce sont les hommes qu’il faut soutenir par des mesures de discrimination positives ! Et là encore, la raison est la même: les variables sexe et master ne sont pas indépendantes. En particulier, les filles déposent peu de dossiers dans les master faciles, mais déposent beaucoup de dossiers dans les master les plus sélectifs !
Et un paquet d’exemples existent dans la littérature, en particulier sur les tests médicaux et les procédures de tests. Moralité, il faut vraiment faire attention aux variables cachées et aux corrélations qui existent entre les variables.

* C’est l’hypothèse fondamentale quand on interprète une valeur en terme d’élasticitié, avec le fameux "toutes choses étant égales par ailleurs": on ne peut souvent pas faire varier une variable en supposant que les autres ne bougent pas !

- page 1 de 2