© Masson, Paris, 2005. Rev Epidemiol Sante Publique, 2005, 53 : 51-68 Note péda

© Masson, Paris, 2005. Rev Epidemiol Sante Publique, 2005, 53 : 51-68 Note pédagogique Variables dépendantes du temps dans le modèle de Cox Théorie et pratique Time-dependent covariates in the Cox proportional hazards model. Theory and practice L. DESQUILBET, L. MEYER INSERM-INED U569, Service d’Épidémiologie, Hôpital de Bicêtre, 82, rue du Général-Leclerc, 94276 Le Kremlin-Bicêtre. Email : desquilbet@vjf.inserm.fr (Tirés à part : L. Desquilbet) In survival analysis, exposure that appears or changes during the follow-up of subjects must be taken into account as a time-dependent covariate in the Cox proportional hazards model. Two types of time- dependent covariates are defined: covariates with unique change, and covariates with multiple chan- ges. The way of taking into account such changes in the exposure is presented in theory and illustrated from a small sample of 5 subjects enrolled in a French HIV cohort. The problems raised by missing data as well as alternative but more sophisticated solutions are also evocated. Annexes include pro- grams for SAS software, and results from the “Log” and “Results” windows. Survival analysis. Cox proportional hazards model. Time-dependent covariate. SAS software. En analyse de survie, une exposition qui varie au cours du suivi de sujets doit être prise en compte en tant que variable dépendante du temps dans le modèle de Cox. Deux types de variables dépendantes du temps sont définis : les variables à changement unique et les variables à changements multiples. La façon dont ces deux types de variables sont pris en compte est présentée en théorie, puis illustrée à l’aide d’un exemple de 5 sujets issus d’une cohorte française de patients séropositifs. Les problèmes posés par les données manquantes ainsi que les solutions alternatives plus sophistiquées sont égale- ment évoquées. En annexes figurent les fichiers de données, la programmation commentée des varia- bles dépendantes du temps avec le logiciel SAS, ainsi que les différents résultats qui apparaissent dans les fenêtres du logiciel. Analyse de survie. Modèle de Cox. Variables dépendantes du temps. Logiciel SAS. INTRODUCTION Le modèle de Cox [1] est l’un des modèles les plus fréquemment utilisés pour les analyses de survie dans le domaine biomédical. Ce modèle semi-paramétrique permet d’étudier le risque de survenue d’un événement en tenant compte de facteurs de confusion potentiels et de quantifier, grâce au risque relatif (rapport des risques instan- tanés), l’association entre une exposition et le ris- que de survenue de l’événement étudié. Une des hypothèses sur lesquelles ce modèle repose est celle de la proportionnalité des risques entre les groupes comparés. Des tests permettent de véri- fier l’acceptabilité de cette hypothèse [2-4]. Dans les enquêtes de cohortes, les expositions dont on veut étudier l’effet sont classiquement des variables fixes, définies à la date d’origine du suivi (t0). Elles concernent les caractéristiques intrinsèques des sujets (par exemple, le sexe ou le niveau d’études), les expositions passées (par Texte reçu le 11 décembre 2003. Acceptation définitive le 31 août 2004. 52 L. DESQUILBET, L. MEYER exemple, les antécédents de pathologies), ou les expositions présentes à t0 (par exemple, la consommation de tabac). Il peut être intéressant, lorsque le protocole le permet, d’étudier l’effet d’une exposition susceptible de survenir ou de varier après t0. La prise en compte d’une telle exposition en tant que variable « fixe » à t0 peut conduire à des erreurs d’interprétation, comme par exemple dans l’analyse des données du Stan- ford Heart Transplantation Program [5]. Les auteurs avaient étudié en analyse de survie l’effet de la survenue d’une transplantation cardiaque au cours du suivi sur le risque de décès en l’introdui- sant comme variable « fixe ». L’effet très protec- teur de la transplantation cardiaque trouvé par les auteurs a été remis en cause par Gail qui a invo- qué un biais de sélection majeur : les patients en « bonne » santé à l’inclusion dans l’étude pou- vaient davantage bénéficier d’une transplantation cardiaque que les autres, ces derniers décédant plus rapidement [6]. Par la suite, Crowley et Hu ont repris les analyses avec un modèle de Cox en prenant en compte la transplantation cardiaque en tant que variable dépendante du temps, et ont confirmé les critiques énoncées par Gail [7]. Dans la littérature, on trouve de multiples exemples de traitement de variables dépendantes du temps : on peut citer l’étude du rôle de la transplantation du foie dans la progression d’une maladie inflammatoire de l’intestin [8], ou de celui de l’albumine sérique, du taux de CD4, et de la charge virale comme marqueur de progres- sion de la maladie VIH [9, 10]. Bien que la théo- rie des variables dépendantes du temps ait déjà été décrite dans la littérature [11, 12], la manière dont elles sont prises en compte dans le modèle de Cox est rarement abordée. Cet article a pour objectif d’expliciter de façon pédagogique le traitement des variables dépen- dantes du temps dans les logiciels statistiques courants. Après un bref rappel concernant le modèle de Cox et la définition des variables dépendantes du temps à changements unique et multiples, nous utiliserons un exemple issu d’une étude épidémiologique. Le problème des données manquantes sera ensuite abordé, pour terminer par un dernier chapitre concernant les limites de l’utilisation des variables dépendantes du temps et la présentation de solutions alternatives. Les annexes comportent les fichiers de données de l’exemple, les programmes commentés et réa- lisés avec le logiciel SAS (version 8.2 ; SAS Ins- titute, Inc., Cary, North Carolina), ainsi que les résultats qui apparaissent dans les fenêtres « Jour- nal » et « Sortie » du logiciel SAS. D’autres logi- ciels tels que Stata ou S-Plus sont capables de traiter des expositions en tant que variables dépendantes du temps et donnent les mêmes résultats que SAS [11], mais semblent actuelle- ment moins répandus parmi les épidémiologistes francophones. Notons également que le logiciel R (logiciel « open-source », dérivé du logiciel S- Plus, librement accessible à partir du site Internet http://www.r-project.org/) est aussi capable de traiter des expositions en tant que variables dépendantes du temps. QUELQUES RAPPELS À PROPOS DU MODÈLE DE COX Le modèle de Cox est un modèle semi-para- métrique qui exprime le risque instantané de survenue d’un événement en fonction du temps : h(t) = λ0 (t) exp( βX) où λ0 (t) est une fonction de risque de base, X un vecteur colonne de p varia- bles, et β le vecteur ligne associé de p paramètres inconnus. Le principe du calcul de l’estimation du vecteur β a été largement décrit dans la litté- rature [13]. Rappelons qu’il réside dans la maxi- misation de la vraisemblance partielle, produit des vraisemblances Vj calculées pour chaque évé- nement j s’exprimant de la façon suivante : où tj est le temps de survenue du jème événe- ment, i l’indice du sujet qui présente l’événement au temps tj, et hi (tj) le risque instantané pour le sujet i au temps tj. Les sujets d’indices i jusqu’à n sont les sujets considérés comme à risque de présenter l’événement à tj. Il est important de remarquer dans l’expression de Vj que seuls les temps de survie des sujets ayant présenté l’évé- nement sont pris en compte pour estimer le vec- teur β. Lorsque deux sujets présentent l’événement au même temps (ex-aequo), trois principales métho- des de maximisation de la vraisemblance partielle sont proposées par les logiciels : l’approximation de Breslow [14] (méthode utilisée par défaut pour Vj hi tj ( ) hi tj ( ) hi 1 + tj ( ) … hn tj ( ) + + + - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - = VARIABLES DÉPENDANTES DU TEMPS DANS COX 53 les logiciels SAS et Stata), l’approximation d’Efron [15] (méthode utilisée par défaut pour les logiciels R et S-Plus), ainsi qu’une méthode de calcul exact de la vraisemblance partielle [16]. La procédure SAS à utiliser pour analyser les don- nées de survie avec le modèle de Cox est la pro- cédure PROC PHREG, décrite en Annexe 1. LES VARIABLES DÉPENDANTES DU TEMPS DÉFINITION GÉNÉRALE Une variable dépendante du temps dans le modèle de Cox est une variable qui prend en compte la modification de l’exposition d’un sujet au cours de son suivi dans une enquête de cohorte : si Xi (t) est l’exposition du sujet i à un temps t, le risque instantané pour le sujet i au temps t s’écrit hi (t) = λ0 (t) exp( βXi (t)). Le rap- port des risques instantanés hi (t) et hj (t) de deux sujets i et j dont l’exposition respective au temps t vaut Xi (t) et Xj (t) : ne peut plus être supposé proportionnel, dans la mesure où il dépend du temps. Cependant, l’inter- prétation du risque relatif reste valable [12, uploads/s3/ 1-s2-0-s0398762005845729-main.pdf

  • 36
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager