Exercice 1 (Questions de cours) A, C, A, B, B.
Exercice 2 (Théorème 5.1) L’IC (i) découle de la propriété (i) de la proposition 5.3. La propriété (ii) donnant un IC pour découle de la loi de . Enfin, la propriété (iii) est une conséquence de la loi obtenue propriété (ii) de la proposition 5.3.
Exercice 3 (Test et ) En utilisant l’orthogonalité des sous-espaces (figure 5.3 page 99) et le théorème de Pythagore, nous avons Nous pouvons le démontrer de la manière suivante : Or , nous avons donc . De plus, , cela donne Le résultat est démontré, revenons à la statistique de test. Introduisons les différentes écritures du La statistique de test vaut nous obtenons soit le résultat annoncé. Cette dernière quantité est toujours positive car et nous avons là un moyen de tester des modèles emboîtés via le coefficient de détermination.
Exercice 4 (Test et et constante dans le modèle) à corriger ;).
Exercice 5 (Ozone)
Les résultats sont dans l’ordre
La statistique de test de nullité du paramètre se trouve dans la troisième colonne, nous conservons pour les paramètres associés à Ne9 et Ne12, et la rejetons pour les autres.
La statistique de test de nullité simultanée des paramètres autres que la constante vaut 50. Nous rejetons .
Nous connaissons et donc la prévision est . Pour l’intervalle de confiance il nous faut mais aussi la matrice (donc toutes les données) ce que nous n’avons pas ici. On ne peut donc faire d’intervalle de confiance.
Nous sommes en présence de modèles emboîtés, nous pouvons appliquer la formule adaptée (voir l’exercice précédent) : Nous conservons , c’est-à-dire le modèle le plus simple.
Exercice 6 (Équivalence du test T et du test F) Récrivons la statistique de test , en se rappelant que est la matrice privée de sa colonne, celle correspondant au coefficient que l’on teste : Récrivons maintenant le carré de la statistique en explicitant : où est le élément diagonal de la matrice . Afin de calculer ce terme, nous utilisons la formule permettant d’obtenir l’inverse d’une matrice bloc, formule donnée en annexe A.2 page 416. Pour appliquer facilement cette formule, en changeant l’ordre des variables, la matrice devient et s’écrit alors Son inverse, en utilisant la formule d’inverse de matrice bloc, est Nous avons donc . Au niveau des lois, l’égalité est aussi valable et nous avons que le carré d’un Student à ddl est une loi de Fisher à ddl. Bien entendu, le quantile d’une loi de Fisher correspond au quantile d’une loi de Student. La loi est symétrique autour de 0 et donc, lorsqu’elle est élevée au carré, les valeurs plus faibles que , qui ont une probabilité sous de d’apparaître, et celles plus fortes que , qui ont une probabilité sous de d’apparaître, deviennent toutes plus grandes que . La probabilité que ces valeurs dépassent ce seuil sous est de et correspond donc bien par définition à .
Exercice 7 (Équivalence du test F et du test de VM) Nous avons noté la vraisemblance en début du chapitre par Cette vraisemblance est maximale lorsque est l’estimateur des MC et que . Nous avons alors où .
Sous l’hypothèse nous obtenons de façon évidente le résultat suivant : où correspond à la somme des carrés résiduels sous , c’est-à-dire . On définit le test du rapport de vraisemblance maximale (VM) par la région critique suivante : La statistique du rapport de vraisemblance maximale vaut ici Le test du rapport de VM rejette lorsque la statistique est inférieure à une valeur définie de façon à avoir le niveau du test égal à . Le problème qui reste à étudier est de connaître la distribution (au moins sous ) de . Définissons, pour positif, la fonction bijective suivante : La fonction est décroissante (sa dérivée est toujours négative), donc si et seulement si . Cette fonction va nous permettre de nous ramener à des statistiques dont la loi est connue. Nous avons alors où est déterminée par avec la loi de cette statistique qui est une loi (cf.~section précédente). Le test du rapport de VM est donc équivalent au test qui rejette lorsque la statistique est supérieure à , où est la valeur du fractile de la loi de Fisher à degrés de liberté.
Exercice 8 (Test de Fisher pour une hypothèse linéaire quelconque) Nous pouvons toujours traduire l’hypothèse : en terme de sous-espace de . Lorsque , nous avons un sous-espace vectoriel de et lorsque nous avons un sous-espace affine de . Dans les deux cas, nous noterons ce sous-espace et . Cependant nous ne pourrons plus le visualiser facilement comme nous l’avons fait précédemment avec où nous avions enlevé des colonnes à la matrice . Nous allons décomposer l’espace en deux sous-espaces orthogonaux Sous , l’estimation des moindres carrés donne projection orthogonale de sur et nous appliquons la même démarche pour construire la statistique de test. La démonstration est donc la même que celle du théorème 5.2. C’est-à-dire que nous regardons si est proche de et nous avons donc Le problème du test réside dans le calcul de . Dans la partie précédente, il était facile de calculer car nous avions la forme explicite du projecteur sur . Une première façon de procéder revient à trouver la forme du projecteur sur . Une autre façon de faire est de récrire le problème de minimisation sous la contrainte . Ces deux manières d’opérer sont présentées en détail dans la correction de l’exercice 2.13. Dans tous les cas l’estimateur des MC contraints par est défini par
Exercice 9 (Généralisation de la régression ridge) Soit la fonction à minimiser avec des réels positifs ou nuls.
Sachant que (avec symétrique) et que nous avons la dérivée partielle suivante En annulant cette dérivée nous avons donc en prémultipliant par nous obtenons En régression multiple le nombre de paramètres est avec la matrice de l’endomorphisme qui permet d’obtenir à partir de . Dans cette régression ridge, nous avons que donc la matrice de l’endomorphisme est ici et le nombre équivalent de paramètres est .
Exercice 10 (IC pour la régression ridge)
Loi de : grâce au modèle et à .
Loi de $_{}() $. Comme avec qui est une matrice fixe. Avec et le modèle de régression multiple on a que .
Puisque est un vecteur gaussien, il en est de même de . Calculons son espérance et sa variance
Calculons le produit scalaire de et Or donc il appartient au sous espace vectoriel , de même que . Sauf si on a que donc est un vecteur non nul de et donc son produit scalaire avec est non nul.
Il faut pouvoir démontrer l’indépendance de et . Pour le théorème 5.1, on montre l’indépendance entre et en considérant les 2 vecteurs et . Comme nous pouvons écrire , est donc une fonction fixe (dépendante uniquement des ) de . De plus, est orthogonal à . Ces 2 vecteurs suivent des lois normales et sont donc indépendants. Il en résulte que et sont indépendants et de même pour et .
Ici, est une fonction de . Le vecteur est une fonction fixe ( est considéré comme fixé) de . Par contre, n’est pas orthogonal à , comme nous l’avons montré, nous ne pouvons donc montrer l’indépendance de et .
Une autre idée serait d’utiliser mais en général si l’on utilise la régression ridge c’est que l’on se doute que n’est pas un bon estimateur de et donc qui est une fonction de risque de ne pas être un bon estimateur de . L’estimateur peut même être nul, ce qui pratiquement peut arriver quand .
En général quand est fixe pour un bootstrap en régression on estime puis on déduit les . De cet ensemble sont tirés de manière équiprobable avec remise résidus . Ces nouveaux résidus sont additionnés à pour faire un nouveau vecteur et avoir un échantillon bootstap .
Ici l’estimation de sera mauvaise (et c’est pour cela que l’on utilise la régression ridge) et plutôt que d’estimer de mauvais résidus nous allons retirer avec remise parmi les ce qui est la procédure adaptée au aléatoire mais ici nous avons peu de choix
Entrées : fixé, fixé, choisi.
Sorties : IC, au niveau , coordonnée par coordonnée de .
- Estimer .
- En déduire .
- Pour à
- tirer avec remise résidus estimés parmi les coordonnées de ;
- on note ces résidus (réunis dans 1 vecteur) ;
- construire 1 échantillon ;
- ;
- estimer le vecteur de paramètre ;
- Pour à
- calculer les quantiles empiriques de niveau et pour la coordonnée , sur tous les vecteurs ;
L’algorithme est presque le même. Cependant comme n’est pas fixé, pour estimer il faut déterminer par une méthode choisie. Ensuite, à chaque estimation de , il est nécessaire au préalable de déterminer par la même méthode que celle utilisée pour déterminer .