Devoir 2 VF
Introduction à l’économétrie 3-806-07 – groupe AOI CLARISSE, Anne sophie – 1 1139023 GROELL, Donatien – 11140565 TP 2 décembre 2014 À DAMAS DE MATOS, Ana or 14 Sni* to View EXERCICE 1 Nous avons le modèle: lifesati a + b*healthi + c*unempi + d*longhoursi + ui Question 1 Résumé des résultats . a (constante) health unemp longhours â = 5. 459168 se(â) = 5 coefficient sur la variable explicative unempi, c’est à dire qu’en moyenne une augmentation de 1 ppt du taux de chômage de longue durée est corrélée avec une diminution de 0*2042 de la atisfaction de la population active, en gardant les autres variables constantes. -0. 0202287 représente la valeur du coefficient sur la variable explicative longhoursi, c’est à dire qu’en moyenne une augmentation de 1 ppt de la population active travaillant plus de 50 heures est corrélée avec une diminution de 0*0202 de la satisfaction de la population active, en gardant les autres variables constantes. 2 Question 2 On veut connaître les déterminants du bonheur des individus, or notre modèle ne tient pas compte de chaque individu mais d’une moyenne par pays (données agrégées par ays).
Or, la population active de chaque pays est différente (en nombre de personnes actives). En effet, on peut voir (sortie STATA) que la population active minimale est de 212. 8 (milliers de personnes) alors que le maximum est de 207 748 (milliers de personnes), on a une moyenne de 24242. 8 (milliers de personnes) par pays et un écart type de 38904. 75 (mllliers de personnes). La population active étant différente pour chaque pays, il est logique de se demander si la variance du terme d’erreur est constante ou non our chaque pays (explications plus étaillées à la question 6). étéroscédastique ou non. HO: V(ui lx) = 02 (constante) Contre Ha: V(uilx) Si nous pouvons rejeter l’hypothèse nulle à un certain seuil de significativité alors notre modèle ne sera pas homoscédastique et on aura une V(ui lx) qui ne sera pas constante. Nous posons alors le modèle suivant. ui2 = 60 + 61 *healthi + 52 *unempi + 53 *longhoursi + wi On suppose que les hypothèse 1 à 4 tiennent et que E(wi soit vérifié. Donc, on a E(wi La fonction de régression pour la population est: E(ui2 lx) = 60 + 51 *healthi + 62 *unempi + 53 *longhoursi
Tester V(uilx) = 02 (constante) à tester si E(ui2 lx) = 60 (constante) On a: D i2 = 60 + 81 *healthi + 62 *unempi + 63 *longhoursi + wi (modèle non restreint) et D i2 = 60 + wi (modèle restreint) On va donc tester: HO: 51 = 62 = 63 = O Ha: au moins un des paramètres O On fait donc un test de Fisher: Avec STATA, nous pouvon PAGF ue la statistique du test (l +3) 30 pour a = Cl -a- 1. 697 Pour a = Cl 2. 457 pour n’importe quel seuil on peut facilement rejeter HO (D > Cl- a), le coefficient b est donc statistiquement significatif, si on ne tient pas compte de Ihétéroscédasticité du odèle. Ha: d < O - -2. 3 -a=-1. 697 Pour 2. 5%, -Cl -a — - 2. 042 poura= Cl -a- - Aux seuils de 5% et 2. 5%, on peut rejeter HO (0 CI-a) mais on ne peut pas rejeter HO au delà, à 1 % par exemple (COD - Cl -a), le coefficient d est donc statistiquement significatif avec une probabilité de 97. 5% si on ne tient pas compte de l'hétéroscédasticité du modèle. Les deux variables sont donc ertinentes au modèle. À noter: quant ? la décision ou non de rejeter HO. Question 4 Résumé des résultats avec l'option robust: â 5. 459168 se(â) = 0. 6462335 b =0. 02922 Se(b) = 0*0075792 = -0. 204188 se(c) = 0. 0448431 d =-0. 202287 Se(d) - 16278 N 34 71. 12% Tableau comparatif des résultats, avec et sans option robust: Coefficient = 5. 459168 c 88 d - -0. 0202287 Constante Health Unemp PAGF s OF numérateur est constant! La légère augmentation des t-test associés à c et d est due au fait que les coefficients sont négatifs, on observe donc la relation inverse, si 00(0) augmente augmente. Mais dans ces deux cas, on remarque que la p-value a augmenté suite à l'augmentation des écarts types associés aux coefficients, il sera donc plus difficile de rejeter 'hypothèse de non significativité des coefficients dans le modèle. ? noter: la correction de White ne prédit pas systématiquement une augmentation ou une diminution des ttest, standard errors, p-values et F-tests. Cette correctlon tient juste compte que la variance des termes d'erreurs n'est pas uniformément répartie pour tout l'échantillon. 6 Question 5 6 2 Cl -a), le coefficient d est donc statistiquement significatif avec une probabilité de en tenant compte de l'hétéroscédasticité du modèle.
Donc, quand on prend compte l’hétéroscédasticité on rejette ussi facilement ‘hypothèse que mais un peu moins facilement celle que d=O, la raison est l’augmentation de l’écart type des coefficients quand on corrige avec l’option robust – Voir explications question 3. Cependant nos conclusions restent similaires, indépendamment de la prise en compte du paramètre d’hétéroscédasticité du modèle, nous remarquons ainsi que les coefficients sont toujours statistiquement 7 significatifs à un seuil de 5% que nous jugeons acceptable. Nous pouvons de cette manière affirmer que notre modèle est robust à l’heteroscedasticité.
Question 6 En faisant la moyenne sur: 7 2 sur l’hétéroscédasticité à la question 2. L’option sur STATA [aw=pop] proposée par notre collègue permet d’estimer le modèle par les MCG. Ce qui revient en fait à estlmer le modèle transformé suivant par les MCO. CIO Modèle transformé proposé: Cette transformation a comme effet de pondérer l’importance des pays en fonction de la population active. On va donc rajouter du poids aux pays ayant une population active plus importante et enlever du poids à ceux dont la population active est moins importante.
Du coup, cela revient à rajouter du poids aux observations ayant une plus petite variance et à en enlever à celles qui ont une grande variance. Le but de cette transformation est donc d’avoir une variance pour les termes résiduels qui est constante, en d’autres mots, obtenir un modèle homoscédastique, sot V ui x = 01 Quiest-ce qu’il est malin ce collègue! Par ailleurs, cette transformation est aussi pertinente car: En prenant les résultats obtenus a rès avoir estimé le modèle par les MCO, on note que la c e les augmente.
On pose: la forme de ‘hétéroscédasticité contrairement à la méthode des MCG qui suppose que l’on connaît h(x). 10 Option Robust: On estime le modèle par les MCO en prenant compte le fait que la variance des termes résiduels n’est pas constante. Si on compare le modèle estimé avec et sans la correction de White, on remarque que les coefficients restent les mêmes mais les écarts types, t-tests, F-test et p-values changent (voir question 4). Option [aw=pop]: On estime le modèle par les MCG, c’est à dire qu’on ajuste les termes du modèle par .
Le but étant d’uniformiser la variance des termes d’erreurs. On remarque que les coefficients et les standard-errors varient comparativement au modèle estimé par les MCO (avec et sans option robust). Il est logique que l’on observe une variation dans l’estimation des coefficients quand on estime le modèle transformé par les MCO, car les estimateurs sont différents. Ici, les variations des coefficients sont notables mais pas démesurées. On peut tout de même remarquer que tous les coefficients ont diminué quand on les a estimé avec les MCG, impli uant: • Le coefficient sur la varia yant diminué, une