Estimation de la force d’infection d’une maladie à partir de plusieurs enquêtes épidémiologiques transversales application à l’hépatite c parmi les usagers de drogues en france

  • 40 trang
  • file .pdf
Estimation de la force d’infection d’une maladie à
partir de plusieurs enquêtes épidémiologiques
transversales : Application à l’hépatite C parmi les
usagers de drogues en France.
Master 2 de recherche en Systèmes intelligents et Multimédia (SIM)
Selain KASEREKA KABUNGA
Maitre de stage : Yann LE STRAT, PhD
Collaboratrice : Lucie LEON, Thésarde
Saint-Maurice, France - Octobre 2014
Il y a trois sortes de mensonges : les mensonges, les sacrés mensonges et les statistiques.
Twain, Mark 1835-1910
Table des matières
1 Introduction 2
2 Généralités sur l’hépatite C 4
3 Enquêtes épidémiologiques transversales 8
4 Matériels 9
4.1 Population d’étude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
4.2 Enquêtes Coquelicot 2004 et 2011 . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
4.2.1 Coquelicot 2004 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
4.2.2 Coquelicot 2011 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
4.3 Données simulées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
5 Méthodes 12
5.1 Génération de la population . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
5.2 Modèles de régression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
5.3 Modèle compartimental pour le VHC . . . . . . . . . . . . . . . . . . . . . . . . . 16
5.4 Paramètres du modèle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
5.5 Estimation de la force d’infection (FOI) . . . . . . . . . . . . . . . . . . . . . . . 18
5.5.1 Modélisation de la force d’infection en fonction de l’âge . . . . . . . . . . 18
5.5.2 Choix du modèle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
6 Résultats 21
6.1 Données simulées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
6.2 Données réelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
6.3 Validation du modèle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
7 Discussion 31
Remerciements
Je tiens à remercier toutes les personnes qui ont, de prêt ou de loin, contribué à la réussite
de mes recherches. Mes remerciements s’adressent à :
– l’équipe DMI pour son accueil chaleureux et sa sympathie ;
– Yann LE STRAT de m’avoir accepté comme stagiaire et superviser mes recherches ;
– Lucie LEON pour ses remarques et orientations constructives ;
– Ghislain NZEZA et Olivia HOTIN de m’avoir accueilli chez eux durant mon séjour en
France ;
– Toutes les autorités de l’Institut de la Francophonie pour l’Informatique (IFI) pour cette
formation de grande valeur ;
– Tous mes camarades de la promotion 17 de l’IFI pour les bons moments passés ensemble.
Au bon Dieu, je rends grâce.
Liste des abréviations
1. AIC : Akaike Information Criterion
2. ARN : Acide ribonucléique
3. ARS : Agence Régionale de Santé
4. CAARUD : Centres d’Accueil et d’Accompagnement à la Réduction de risques pour Usa-
gers de Drogues
5. CSAPA : Centre de Soins d’Accompagnement et de Prévention en Addictologie
6. DMI : Département des Maladies Infectieuses
7. EPEUS : Établissement de Préparation de Réponse aux Urgences Sanitaires
8. FOI : Force Of Infection
9. INPS : Institut Nationale de Prévention et d’éducation pour la Santé
10. InVS : Institut de Veille Sanitaire
11. LSD : Lysergic acid diethylamide
12. MGPP : Méthode Généralisée du Partage des Poids
13. SIS : Susceptible - Infecté - Susceptible
14. UD : Usagers de Drogues
15. UDI : Usagers de Drogues par Injection/Usagers de Drogues Injecteurs
16. VHC : Virus de l’hépatite C
17. VIH : Virus de l’Immunodéficience Humaine
Table des figures
1 Evolution des marqueurs de l’ARN du VHC et des anti-VHC . . . . . . . . . . . 6
2 Modèle compartimental SIS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3 Prévalence et FOI de la population total pour les données simulées . . . . . . . . 22
4 Prévalence et FOI chez les UD non injecteurs pour les données simulées . . . . . 23
5 Prévalence et FOI chez les UDI pour les données simulées . . . . . . . . . . . . . 23
6 Prévalence et FOI chez les UD non infectés par le VIH pour les données simulées 24
7 Prévalence et FOI chez les UD infectés par le VIH pour les données simulées . . 24
8 Prévalence et FOI de la population totale pour les données réelles . . . . . . . . . 25
9 Prévalence et FOI chez les UD non injecteurs pour les données réelles . . . . . . 26
10 Prévalence et FOI chez les UDI pour les données réelles . . . . . . . . . . . . . . 26
11 Prévalence et FOI chez les UD non infectés par le VIH pour les données réelles . 27
12 Prévalence et FOI chez les UD infectés par le VIH pour les données réelles . . . . 27
13 Prévalence et FOI de la population totale pour les échantillons générés . . . . . . 28
14 Prévalence et FOI chez les UD non injecteurs pour les les échantillons générés . . 29
15 Prévalence et FOI chez les UDI pour les les échantillons générés . . . . . . . . . . 29
16 Prévalence et FOI chez les UD non infectés par le VIH pour les échantillons générés 30
17 Prévalence et FOI chez les UD infectés par le VIH pour les échantillons générés . 30
Liste des tableaux
1 Détection (oui/non) des marqueurs pour le VHC . . . . . . . . . . . . . . . . . . 5
2 Différentes variables de la population d’étude . . . . . . . . . . . . . . . . . . . . 12
3 Choix du modèle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
Résumé
L’objectif principal de ce travail a été d’estimer la force d’infection de l’hépatite C à partir
de deux enquêtes épidémiologiques transversales nommées Coquelicot, menées en 2004 et 2011
par l’InVS et ses partenaires dans une population d’usagers de drogues (UD) en France. Pour
effectuer nos estimations sur ces enquêtes, nous les avons fusionnées en tenant compte de leurs
tailles et de leurs poids de sondage. La force d’infection a ensuite été modélisée suivant un
modèle compartimental de type SIS, et exprimée comme étant une fonction de la dérivée de
la prévalence en fonction de l’âge, du temps, de la séropositivité VIH et le fait d’être injecteur
ou non, de 2000 à 2020. La prévalence selon l’âge a été modélisée en utilisant les polynômes
fractionnaires. Les modèles ont été appliqués sur des enquêtes réelles et simulées en utilisant les
logiciels R et Stata. Nos résultats montrent que la prévalence et la force d’infection du VHC
sont associées à l’âge et au temps, et sont très élevées pour les UD par injection et les UD
co-infectés par le VHC et le VIH. Ce travail permet d’orienter les chercheurs sur la comparaison
des enquêtes transversales auprès des UD.
Mots clés : VHC, Prévalence, Force d’infection, Usagers de drogues, Simulation, Modélisation.
Abstract
The aim of this work was to estimate the force of infection of hepatitis C from two cross-
sectional epidemiological surveys conducted in 2004 and 2011 by InVS and its partners in a
drug users population in France. We merged the cross-sectional surveys taking into account
their sampling weights and their sizes. The force of infection was modeled according to a SIS
compartimental model and as being a functionn of the derivative function of the prevalence
depending on age, time, HIV serological status and having injected at least once in their life or
not, from 2000 to 2020. The prevalence according to age was modeled using fractional polyno-
mials. Ours models were applied on real and simulated surveys using R and Stata software. Our
results show that HCV prevalence and the force of infection are associated to age and time, and
are very high for the drug users who injected at least once in their life and who are HCV and
HIV infected simultaneously. This work provides guidance for researchers to compare several
cross-sectional epidemiological surveys among drug users.
Keywords : HCV, prevalence, Force of infection, Drug users, Simulation, Modeling.
Structure d’accueil
Mon stage s’est déroulé à l’Institut de Veille Sanitaire (InVS), un établissement public Fran-
cais placé sous la tutelle du ministère chargé de la Santé et réunissant les missions de surveillance,
de vigilance et d’alerte dans tous les domaines de la santé publique. Il a été créé par la loi du 1er
juillet 1998 relative au renforcement de la veille sanitaire et au contrôle de la sécurité sanitaire
des produits destinés à l’homme. L’InVS a vu ses missions complétées et renforcées par la loi
du 9 août 2004 relative à la politique de santé publique, afin de répondre aux nouveaux défis
révélés par les crises sanitaires récentes et les risques émergents.
Les missions confiées à l’InVS recouvrent :
• La surveillance et l’observation permanentes de l’état de santé de la population ;
• La veille et la vigilance sanitaires ;
• L’alerte sanitaire ;
• Une contribution à la gestion des situations de crise sanitaire.
L’InVS participe, dans le cadre de ses missions, à l’action européenne et internationale de la
France, notamment à des réseaux internationaux de santé publique. Ce rôle de veille est partagé
avec d’autres agences françaises de sécurité sanitaire.
L’InVS dispose d’antennes régionales, les Cellules de l’InVS en Région (Cire), capables de
décliner localement son savoir-faire et de relayer son action. Le dispositif compte dix-sept Cire,
dont deux ultra-marines.
A partir de 2016, l’InVS sera fusionné à l’Inpes (Institut national de prévention et d’éducation
pour la santé) et à l’Epeus (Établissement de Préparation et de Réponse aux Urgences Sanitaires)
pour créer un nouvel institut. Cette fusion devra permettre une bonne intervention en santé
publique en France.
J’ai effectué mon stage au département des maladies infectieuses (DMI) et j’ai travaillé sous
la supervision de Yann LE STRAT et Lucie LEON, statisticiens à l’InVS. Ce stage a duré 6
mois, du 24 mars au 23 septembre 2014.
1 INTRODUCTION
1 Introduction
La modélisation mathématique et la simulation informatique des épidémies/endémies sont
une clé en main pour bien comprendre la propagation des maladies infectieuses en vue de les
éradiquer dans la population. D’une manière générale, l’idée est de chercher à connaı̂tre le flux
de personnes qui deviennent infectées à un temps t donné. Ces démarches deviennent encore
plus réalistes lorsqu’on utilise des données issues d’enquêtes épidémiologiques. Une enquête
épidémiologiques a pour but la découverte de faits, l’amélioration des connaissances ou la
résolution de doutes et de problèmes. En épidémiologie on distingue classiquement les études
descriptives qui étudient la fréquence et la répartition de paramètres de santé et/ou de facteurs
de risque dans les populations et les études étiologiques qui consistent à comparer des groupes
de sujets pour mettre en évidence une association entre une exposition et une pathologie.
Dans ces études étiologiques on trouve les enquêtes de cohortes qui sont les plus intéressantes
mais très coûteuses et difficiles à mettre en oeuvre à grande échelle. Les enquêtes transversales,
celles qui sont traitées dans le cadre de nos recherches, sont caractérisées par leur facilité d’orga-
nisation et leur coût plus raisonnable mais souffrent de la difficulté d’établir la relation tempo-
relle entre le facteur de risque et la pathologie. Les enquêtes cas-temoins consistent à comparer
l’exposition antérieure chez des sujets malades (les cas) à l’exposition des témoins. Elles sont
particulièrement intéressantes pour étudier une pathologie rare.
Lorsque l’on dispose des données issues de plusieurs enquêtes transversales, la question de
l’estimation d’un indicateur d’intérêt en fonction du temps se pose naturellement. Cette estima-
tion n’est pas simple car elle nécessite de prendre en compte les plans de sondages utilisés pour
constituer les échantillons, la taille des enquêtes et la composition de la population qui peuvent
ne pas être identiques d’une enquête à l’autre.
Pour répondre à ce défit nous avons organisé ce travail en deux parties distinctes. Dans
la première partie nous avons généré une population des usagers de drogues au cours d’une
période de 7 ans dans laquelle le virus de l’hépatite C se propage et se diffuse suivant un modèle
compartimental de type SIS. Dans la seconde partie nous avons estimé la force d’infection
(FOI) comme étant fonction de la dérivée de la prévalence en fonction de l’âge, du temps, de la
séropositivité VIH et le fait d’être injecteur ou non. La prévalence selon l’âge a été modélisée en
utilisant des polynômes fractionnaires. Nous avons travaillé à la fois sur des enquêtes réelles et
simulées.
2
1 INTRODUCTION
Ce travail comporte six chapitres. Nous introduisons des notions générales sur l’hépatite
C dans le chapitre premier avant de parler des généralités sur les enquêtes épidémiologiques
transversales dans le second. Le troisième et le quatrième chapitres présentent respectivement
les matériels et les méthodes que nous avons utilisés, et le cinquième montre les résultats obtenus
avant de les discuter dans le sixième chapitre.
3
2 GÉNÉRALITÉS SUR L’HÉPATITE C
2 Généralités sur l’hépatite C
L’hépatite C est une maladie contagieuse du foie, qui résulte d’une infection par le virus
de cette maladie (VHC). Elle se manifeste avec une gravité qui peut aller d’une forme bénigne
qui dure quelques semaines à une maladie grave qui s’installe à vie. Le VHC est l’un des virus
infectant le plus fréquemment le foie. L’infection par le VHC est un problème de santé publique
majeur à travers le monde. Les pays ayant un taux élevé d’infection chronique sont l’Égypte
(15%), le Pakistan (4,8%) et la Chine (3,2%). Chaque année, 3 à 4 millions de personnes sont
infectées par le VHC dans le monde. Environ 150 millions d’individus sont porteurs chroniques
et encourent le risque que leur atteinte hépatique évolue vers la cirrhose et/ou le cancer du foie.
chaque année 350 000 à 500 000 personnes meurent de pathologies hépatiques liées à l’hépatite C
dans le monde [18]. En France environ 600 000 personnes étaient porteuses du virus de l’hépatite
C (1% de la population) en 2004 dont plus du tiers ignoraient leur statut. On estime qu’entre
200 000 et 300 000 personnes ont été infectées par transfusion sanguine [17].
La transmission du virus de l’hépatite C s’effectue le plus souvent par exposition à du sang
infectieux par exemple lors d’une transfusion sanguine, de produits sanguins ou d’un greffon
contaminés, d’injections réalisées avec des seringues contaminées ou blessures par piqûre d’ai-
guille en milieu de soins, d’utilisation de drogues injectables ou lors d’une naissance chez une
mère infectée par l’hépatite C.
L’histoire naturelle de l’infection par le VHC se déroule en trois étapes : (1) la contamination
par le VHC entraı̂ne une hépatite aigüe (infection très récente), le plus souvent inapparente. Envi-
ron 80% des individus infectés par le VHC sont asymptomatiques, c’est-à-dire qu’ils ne présentent
pas de symptômes. On observe chez les personnes présentant des symptômes une fièvre, de la
fatigue, une baisse d’appétit, des nausées, des vomissements, des douleurs abdominales, une
coloration sombre des urines, une coloration grisâtre des fèces, des douleurs articulaires et/ou
un ictère (jaunissement de la peau et du blanc des yeux). La plupart des sujets infectés restent
porteurs chroniques de ce virus ; (2) la persistance de l’infection virale entraı̂ne l’apparition de
lésions d’hépatite chronique et le développement d’une fibrose, pouvant aboutir à une cirrhose
plusieurs décennies après la date de contamination ; (3) les complications cliniques (carcinome
hépatocellulaire notamment) surviennent essentiellement au stade de cirrhose et sont respon-
sables de la mortalité liée à cette infection.
4
2 GÉNÉRALITÉS SUR L’HÉPATITE C
Détection de l’ARN du VHC Non détection de l’ARN du
VHC
Détection des anticorps Infection chronique Guérison (spontanée ou après
anti-VHC traitement)
Non détection des anti- Infection très récente Non contaminé
corps anti-VHC
Tab. 1 – Classification selon la détection ou non des marqueurs ARN du VHC et anticorps
anti-VHC
Infection très récente
Comme illustré en Figure 1(a), le déroulement de l’infection très récente débute par la
détection dans le sérum d’un marqueur, l’ARN du VHC, 7 à 21 jours après la date de contamina-
tion. L’augmentation des transaminases sériques, souvent supérieur à 10 fois la limite supérieure
de la normale survient au-delà du 15ème jour, souvent au-delà de 4 semaines. Des symptômes
cliniques (souvent un ictère), s’ils sont observés, apparaissent 2 à 12 semaines après la date de
contamination et disparaissent rapidement. Les anticorps anti-VHC apparaissent dans le sérum
20 à 150 jours après la contamination. Cette séroconversion est majeure pour diagnostiquer une
infection très récente, la positivité de l’ARN ne permettant pas de différencier une infection
très récente d’une infection chronique. La guérison de l’infection très récente est définie par la
disparition spontanée de détection de l’ARN du VHC dans le sérum. Dans ce cas, l’ARN du
VHC devient indétectable, au bout de 19 mois dans un cas sur deux, et le demeure par la suite.
A l’inverse, la positivité persistante de l’ARN du VHC dans le sérum marque l’évolution vers
une infection chronique [1].
Infection chronique
L’infection chronique est attestée par la présence d’ARN du VHC dans le sérum longtemps
après l’infection comme illustré en Figure 1(b). L’ARN du VHC reste constamment détectable
tout au long de l’évolution. Les malades ayant une sérologie positive (détection d’anticorps
anti-VHC) et une recherche d’ARN du VHC constamment négative sont probablement guéris.
L’absence d’ARN du VHC détectable dans le foie est en faveur d’une élimination virale complète.
Le tableau 1 présente, selon la détection ou non des deux marqueurs biologiques ARN du
VHC et anticorps anti-VHC, quatre situations distinctes : infection chronique, infection très
récente, guérison ou absence de contamination (la personne n’a jamais été en contact avec le
virus).
5
2 GÉNÉRALITÉS SUR L’HÉPATITE C
Fig. 1 – Evolution des marqueurs de l’ARN du VHC et des anticorps anti-VHC (Ac Anti VHC)
en cas d’infection très récente (a) ou d’infection chronique (b). [8]
Environ 75-85% des personnes nouvellement infectées contractent une maladie chronique et
chez les porteurs chroniques, 60-70% souffriront d’une maladie hépatique chronique ; 5-20%, au-
ront une cirrhose et 1-5% mourront d’une cirrhose ou d’un cancer du foie. Pour 25% des cas de
cancer du foie, la cause sous-jacente du cancer est l’hépatite C [8].
Diagnostic
Les méthodes courantes de détection des anticorps ne peuvent différencier les infections chro-
niques des infections récentes. La présence d’anticorps contre le virus de l’hépatite C indique
qu’une personne est ou a été infectée. On a recours au test RIBA (recombinant immunoblot
assay) et à la détection de l’ARN viral pour confirmer le diagnostic. On pose le diagnostic
d’infection chronique lorsque les anticorps anti-VHC sont présents dans le sang pendant plus
de six mois. Comme pour les infections récentes, le diagnostic doit être confirmé par un test
complémentaire. On utilise souvent des tests spécialisés pour évaluer si les patients sont atteints
d’une maladie hépatique comme la cirrhose ou le cancer du foie.
6
2 GÉNÉRALITÉS SUR L’HÉPATITE C
Traitement
Le traitement de personnes infectées par le VHC s’étend de 24 à 48 semaines selon les
génotypes :
• Si génotype 2 ou 3 : 24 semaines avec une bonne réponse au traitement (70% de succès)
• Si génotype 1 : 48 semaines avec une bonne réponse au traitement (moins de 1 personne
sur 2).
Le traitement des personnes infectieuses permet une non-réplication virale du virus [5]. Six mois
après le traitement, les personnes sont à nouveau testées pour vérifier l’absence de virémie.
Notons aussi que les personnes plus âgées répondent moins bien à la guérison de l’hépatite C [8].
La guérison des personnes infectées peut se traduire par une guérison spontanée : le sujet
infecté évacue le virus et guérit spontanément de son infection (autrement dit, sans traitement).
Ceci peut être dû aux gènes de la personne. C’est ce que nous appellerons la séroréversion
dans la suite de ce travail. Ces cas sont très rares [13]. La guérison peut être également post-
thérapeutique [9] : le sujet n’a plus de virus après avoir suivi un traitement de 24 à 48 semaines.
Transmission de l’hépatite C chez les usagers de drogues injecteurs
Le risque de transmission du VHC est plus important en cas de blessure profonde, de piqûre
avec une aiguille creuse et notamment avec une aiguille ayant servi à un geste en intraveineux
ou en intraartériel. Le VHC se transmet par voie sanguine (transfusion, utilisation de drogues
par voie intraveineuse, transplantation d’organes). Les usagers de drogues par injection sont
une population particulièrement à risque pour la transmission de l’hépatite C [2]. La seringue
empruntée, le matériel de préparation partagé sont des facteurs de risque majeur de transmission
de ce virus. Les aiguilles et les seringues ont le plus grand potentiel de contamination du VHC
en raison de leur contact direct avec le sang pendant l’injection veineuse.
Un sujet contaminé produit l’ARN du VHC qui devient détectable après environ 6 à 10 jours.
Il faudra alors compter quelques semaines (une soixantaine de jours) pour que des anticorps
anti-VHC produits par la personne soient détectés. Pour repérer les cas, un test de dépistage est
indispensable. Ce dernier se base sur la présence d’anticorps anti-VHC. Si ce test est positif, un
test de la charge virale est réalisé afin de quantifier le taux d’ARN contenu dans le sang [8].
7
3 ENQUÊTES ÉPIDÉMIOLOGIQUES TRANSVERSALES
3 Enquêtes épidémiologiques transversales
Schématiquement, deux grands types d’études épidémiologiques sont habituellement dis-
tingués et le plus souvent réalisés : les enquêtes descriptives et les enquêtes étiologiques (ana-
lytiques). Dans la plupart des cas, il s’agit d’enquêtes d’observation. Contrairement aux essais
thérapeutiques ou aux études évaluant des actions de santé publique, la répartition de l’exposi-
tion à un facteur dans la population d’étude n’est ni contrôlée par l’investigateur ni randomisée.
Les enquêtes descriptives ont pour objectif principal de fournir des statistiques sanitaires dans
les populations. Elles étudient la fréquence et la répartition des indicateurs de santé ou des fac-
teurs de risque et leurs variations en fonction du temps, des zones géographiques et des groupes
de population. Elles permettent de soulever, à partir de ces observations, des hypothèses sur
les facteurs de risque des maladies. Les enquêtes étiologiques, celles qui nous intéressent dans le
cadre de ce travail, analysent les relations entre l’exposition à un ou plusieurs facteurs de risque
et un état de santé. Les enquêtes étiologiques sont toujours comparatives (elles comparent deux
groupes différents, soit sur la présence de la maladie, soit sur la présence du facteur de risque).
Un facteur de risque est une caractéristique associée à une probabilité plus élevée de maladie.
Ces enquêtes peuvent être mises en oeuvre pour vérifier et préciser les hypothèses formulées
notamment à partir des résultats des études descriptives ou d’autres types d’études (animales
ou toxicologiques . . . ), concernant les relations entre facteurs d’exposition et maladies. Elles sont
parfois réalisées à titre exploratoire pour identifier les effets d’un facteur d’exposition ou bien
les facteurs de risque d’une maladie. Dans nos recherches nous nous intéressons aux enquêtes
épidémiologiques transversales.
Dans les enquêtes transversales, l’échantillon est issu de la population sans être nécessairement
sélectionné sur l’exposition ni sur la maladie. L’information est recueillie au même moment sur la
maladie et l’exposition. Il est fréquent, dans les enquêtes transversales que l’information soit re-
cueillie également sur l’exposition passée, ou d’autres événements de santé passés. Lorsque dans
une enquête transversale, l’information sur l’exposition est recueillie de façon rétrospective, on
parlera d’enquête transversale rétrospective.
Les enquêtes transversales ont l’avantage de permettre de recueillir, au même moment, l’in-
formation sur divers facteurs d’exposition et sur divers événements de santé. Leur mise en oeuvre
est relativement facile et leur coût est moindre par rapport à d’autres enquêtes. Ces enquêtes
ont cependant des inconvénients méthodologiques. Elles sont sujettes, comme les cohortes, aux
8
4 MATÉRIELS
biais de participation car elles reposent sur le volontariat. Elles sont aussi sujettes aux biais de
mémoire classiquement décrits pour les études cas-témoins, lorsque l’exposition est reconstituée
de façon rétrospective.
4 Matériels
4.1 Population d’étude
Les usagers de drogues sont la population la plus touchée par l’hépatite C de part leur
pratique à risque, notamment l’échange de matériels (seringue, aiguille, . . . ). En France, la
consommation de drogues est le principal mode de contamination. Chaque année, parmi les
nouvelles contaminations, 70% sont associées à l’usage de drogues [14, 15, 17]. Pour les usagers
de drogues, les contaminations interviennent tôt, lors des premières injections : dès l’initiation à
l’injection, les usagers prennent des risques, ils n’ont que peu d’informations et celles-ci peuvent
être erronées [17]. La consommation de drogues étant une pratique illégale en France, cette
population généralement en situation de précarité et qui se cache est particulièrement difficile
d’accès pour les enquêteurs.
4.2 Enquêtes Coquelicot 2004 et 2011
L’enquête Coquelicot est une enquête multicentrique réalisée dans cinq agglomérations (Lille,
Strasbourg, Paris, Bordeaux, Marseille) et deux départements (Seine-et-Marne, Seine-Saint-
Denis). Un échantillon aléatoire d’UD a été constitué dans la quasi-totalité des services spécialisés
pour UD dans ces agglomérations et départements, selon un plan de sondage à deux degrés. Une
liste de tous les services ouverts par demi-journées, constituant ainsi une base de sondage, a été
construite afin de tirer au sort des couples services/demi-journées, selon un sondage aléatoire
simple. Dans les services, les enquêteurs ont recruté de manière aléatoire le premier UD qui se
présentait. Les autres UD ont été interrogés selon un pas de sondage adapté à la taille des struc-
tures, afin d’éviter que l’enquêteur ou les professionnels des structures ne choisissent les UD à
enquêter, ce qui introduirait des biais de sélection. Des poids de sondage ont été calculés selon un
sondage à deux degrés. La méthode généralisée du partage des poids (MGPP) a permis de tenir
compte de l’hétérogénéité des UD pour ce qui concerne leur fréquentation des structures [10,11].
9
4.2 Enquêtes Coquelicot 2004 et 2011 4 MATÉRIELS
4.2.1 Coquelicot 2004
En 2004, 1462 personnes ayant eu recours à des drogues injectables et/ou par inhalation
au moins une fois dans leur vie ont accepté de participer à l’enquête Coquelicot. L’objectif
de cette enquête était d’estimer la séroprévalence du VIH et du virus de l’hépatite C (VHC)
chez les usagers de drogues et de décrire les comportements et les pratiques à risque de ces
derniers. Les participants ont accepté de répondre à un questionnaire portant sur des aspects
socio-comportementaux et des échantillons biologiques ont été recueillis par auto-prélèvement
de sang au niveau du doigt pour 79% d’entre eux [10].
Les usagers de drogues sont essentiellement masculins (74%) et leur âge moyen est de 35,6
ans pour les hommes et de 34,5 ans pour les femmes. Il s’agit de personnes souvent inactives (au
moment de l’enquête, 65% ont déclaré ne pas travailler) et ayant des conditions de vie précaires
(seuls 45% ont un logement stable et 19% vivent dans la rue ou dans un squat).
Parmi les 1462 participants, 10,8% sont séropositifs vis-à-vis du VIH et 59,8% vis-à-vis du
VHC, 10,2% sont co-infectés par le VIH et le VHC. Alors que la séroprévalence du VIH est quasi-
nulle chez les usagers de drogues de moins de 30 ans, elle est de 28% pour le VHC chez ces mêmes
personnes (moins de 30 ans) pour atteindre 71% pour les 40 ans et plus. La séroprévalence du
VIH varie selon les villes (1% à Lille, 10,9% à Paris, 31,5% à Marseille). En revanche, il n’existe
pas de différence significative pour le VHC [10].
71% des personnes interrogées ont reçu un traitement de substitution aux opiacés dans les six
derniers mois (57% par Subutex et 36% par méthadone). Les principaux produits psychoactifs
illicites consommés par les usagers de drogues (dans le dernier mois) sont le crack (30%), la
cocaı̈ne (27%), l’héroı̈ne (20%) et l’ecstasy (12%). Les moins de 30 ans ont une consommation
plus fréquente de substances hallucinogènes et ont recours plus souvent à de la cocaı̈ne (40%),
de l’ecstasy (26%), des amphétamines (14%), du LSD (12%) et d’autres hallucinogènes (11%).
L’injection par voie intraveineuse a été pratiquée par 70% des usagers de drogues ayant participé
à l’enquête, à un âge moyen de 20,4 ans [10].
4.2.2 Coquelicot 2011
Cette seconde édition a été réalisée en 2011 auprès d’un échantillon de 1568 UD recrutés
dans 122 services spécialisés. La quasi-totalité des structures contactées a accepté de participer
à l’enquête. Au total, 25% des UD ont été recrutés dans des services appartenant à des CAARUD
10
4.3 Données simulées 4 MATÉRIELS
(Centres d’Accueil et d’Accompagnement à la Réduction de risques pour Usagers de Drogues),
70% dans des services appartenant à des CSAPA (Centre de Soins d’Accompagnement et de
Prévention en Addictologie), 1,5% dans des centres d’hébergements et 3,7% dans d’autres types
de structures de type associatif.
Le taux de participation à l’enquête a été de 75% et, parmi les répondants, 92% ont accepté
l’auto-prélèvement de sang. Pour l’analyse des séroprévalences, un total de 1418 sujets testés
a été retenu. L’échantillon des non-répondants est similaire à l’échantillon des répondants, en
termes d’âge et de sexe [11].
La population des UD est essentiellement masculine (79% d’hommes) et âgée en moyenne
de 39 ans (16% des UD ont moins de 30 ans). Plus des deux tiers (70%) déclarent un niveau
d’études secondaires, 6% déclarent un niveau primaire et 24% sont allés au-delà du baccalauréat.
Plus des trois-quarts (79%) des UD ne travaillent pas au moment de l’enquête. Près de la moitié
des UD vivent dans une situation d’insécurité vis-à-vis du logement : ils ne vivent ni chez eux,
ni chez un conjoint, ni chez leurs parents. Parmi eux, 18% sont confrontés à une très grande
précarité car ils vivent dans un squat ou dans la rue. La majorité des UD (57%) ont connu un
antécédent d’incarcération au cours de leur vie [11].
4.3 Données simulées
Nous basant sur les données réelles issues de Coquelicot 2004 et 2011, nous avons généré
des populations ayant une même distribution d’âge que ces dernières. Cette population nommée
”pop0” avait une taille de 21300 individus et la prévalence globale du VHC était de 62%. La
population générée a alors constitué notre population simulée pour l’année 2004.
Une fois la population ”pop0” obtenue, nous l’avons fait évoluer par des simulations, en tenant
compte de plusieurs facteurs expliqués un peu plus loin, suivant un modèle compartimental de
type SIS (introduit plus loin) où le virus de l’hépatite C se propage et se diffuse au cours d’une
période de 7 ans en considérant que la taille de la population varie peu. Une nouvelle population
”pop1” de taille 21996 a été obtenue 7 ans plus tard, avec une prévalence globale du VHC de
53%.
Le tableau 2 répertorie les variables que nous avons utilisées dans le cadre de nos recherches :
11
5 MÉTHODES
Variables Libellé
id identifiant de chaque individu dans la population
vhc statut VHC pour chaque individu (oui/non)
age l’âge de chaque individu
vih statut VIH pour chaque individu (oui/non)
injvie statut de l’état d’être injecteur (oui/non)
Tab. 2 – Différentes variables de la population d’étude
5 Méthodes
5.1 Génération de la population
Pour générer la population initiale d’usagers de drogues, nommée ”pop0”, de taille n et ayant
les mêmes caractéristiques que celles de l’enquête en termes de distribution d’âge, de statut VHC,
de statut VIH, du fait d’être injecteur ou d’avoir des pratiques à risque, nous nous sommes servis
des résultats de l’enquête Coquelicot 2004. Les étapes suivantes ont été respectées :
– les individus ont été dupliqués selon leur poids de sondage multiplié par 50, un nombre
choisi arbitrairement pour avoir une très grande population ;
– un nombre aléatoire a ensuite été affecté à chaque individu ;
– puis, les individus ont été ordonnés selon ce nombre aléatoire ;
– enfin, les n premiers individus ont été sélectionnés pour constituer notre population nou-
vellement générée ”pop0”.
La population des usagers de drogue bénéficie de prestations proposées à différents moments
de la journée par différentes structures d’accueil dédiées à leur usage. En se basant sur le design
de l’enquête Coquelicot, on suppose que :
– 80 structures ont proposé 10 prestations par demi-journée d’ouverture ;
– Les structures étaient ouvertes du lundi au vendredi, soit 5 jours par semaine ;
– L’enquête a duré 8 semaines ;
– Le nombre de fréquentations des UD suit une distribution binomiale négative de moyenne
µ = 3 et de variance θ = 10.
A chaque individu est associée au moins une prestation durant une demi-journée donnée
dans une structure donnée. 1000 échantillons de taille 2000 ont été générés selon un sondage à
trois degrés appelé échantillonnage lieux-moments :
– Au premier degré : 20 structures ont été tirées au sort selon un sondage aléatoire simple ;
12
5.2 Modèles de régression 5 MÉTHODES
– Au second degré : 25 demi-journées d’ouverture ont été tirées au sort selon un sondage
aléatoire simple dans chaque structure échantillonnée ;
– Au troisième degré : 4 prestations ont été tirées au sort selon un sondage aléatoire simple
dans chaque demi-journée d’ouverture échantillonnée.
5.2 Modèles de régression
En épidémiologie, plusieurs modèles d’analyse par régression sont couramment utilisés :
régression linéaire, régression logistique, régression de Poisson, modèle de Cox, etc. Effectuer une
régression, c’est tenter de réduire les données d’un phénomène complexe en une loi mathématique
simplificatrice. Un modèle d’analyse par régression permet d’exprimer la distribution conjointe
de plusieurs variables. Ce modèle vise à expliquer une ou des variables dites « dépendantes
» (variable(s) à expliquer) par un ensemble de variables dites « indépendantes » (variables
explicatives). Une variable Y peut donc être exprimée en fonction de plusieurs variables Xi .
En épidémiologie, Y caractérise la maladie (ou sa distribution dans la population). Les Xi ca-
ractérisent les facteurs de risque de la maladie ou des variables d’ajustements. Ils peuvent être
qualitatifs ou quantitatifs. Ces modèles sont donc intéressants car ils supposent une certaine
modélisation de la réalité. Par exemple, on peut modéliser (représenter) la relation entre Y
et les Xi sous forme linéaire. Les conclusions tirées des analyses par régression sont en partie
conditionnées par le bien-fondé des hypothèses faites (par exemple linéarité). En épidémiologie
deux modèles de régression sont particulièrement utilisés, la régression linéaire et la régression
logistique.
Régression linéaire
Considérant Y comme étant une variable continue à expliquer et Xi un ensemble de variables
explicatives, on a :
p
X
g [E (Y | X1 , . . . , Xp )] = α + β1 X1 + . . . + βp Xp = α + βi Xi (1)
l=1
où g désigne une fonction de lien, E l’espérance de Y connaissant X1 , . . . , Xp , et α et β sont des
coefficients de régression. L’équation 1 peut être notée :
13