Focus sur : un projet Soladis

Soladis a eu l’occasion de travailler récemment sur une problématique de classification de patients atteints d’une maladie rarela sclérodermie avec hypertension artérielle pulmonaire.

Afin de vous partager notre expérience statistique et médicale, nous vous ouvrons la porte de nos travaux avec une petite présentation du sujet.

 

Objectif de l’étude

L’objectif de l’étude était de distinguer différents sous-groupes homogènes au sein d’une population de patients sclérodermiques présentant une HTAP, et de vérifier la validité de cette classification au regard du pronostic du patient.

 

Le regard du médecin, présentation de la pathologie

La sclérodermie est une maladie auto-immune rare qui touche environ 4000 personnes en France, principalement les adultes entre 40 et 50 ans, à raison de 4 femmes pour un homme. C’est une maladie systémique, c’est-à-dire qu’elle peut toucher un grand nombre d’organes. Elle se caractérise par une atteinte des artérioles – les vaisseaux les plus fins qui amènent le sang oxygéné aux organes –  des microvaisseaux et du tissu conjonctif. Ses traits dominants sont la fibrose et les oblitérations vasculaires dans la peau et d’autres organes, en particulier les poumons, le cœur, l’appareil digestif et le rein.

La sclérodermie se complique d’une hypertension artérielle pulmonaire (HTAP) dans environ 10% des cas. Il s’agit d’une complication très grave, entraînant le décès dans 50% des cas, dans les 5 ans suivant son diagnostic. L’HTAP est liée à la rigidité des artérioles, au rétrécissement de la lumière des vaisseaux lié à une hypertrophie de leur paroi et aux thromboses en relation avec un ralentissement circulatoire. L’HTAP est une affection très complexe qui complique bien d’autres maladies que la sclérodermie et qui peut même apparaître sans cause retrouvée (HTAP idiopathique). Le pronostic de l’HTAP dépend beaucoup de la maladie sous-jacente. L’HTAP a été longtemps considérée comme une maladie orpheline mais depuis une vingtaine d’années, des traitements efficaces sont apparus et la recherche se poursuit. Le pronostic de l’HTAP idiopathique a été transformé par ces médicaments mais les résultats dans l’HTAP associée à une sclérodermie sont encore décevants.

L’HTAP de la sclérodermie est multifactorielle : l’épaississement de la paroi des microvaisseaux artériels pulmonaires diminue la lumière de ces vaisseaux et entraîne une élévation de la pression de perfusion et des résistances vasculaires pulmonaires ; la fibrose pulmonaire est responsable d’une diminution des échanges gazeux au niveau des alvéoles pulmonaires et d’une hypertension pulmonaire (très difficile à distinguer d’une hypertension artérielle pulmonaire, d’autant que les mécanismes sont souvent intriqués) ; il existe des thromboses dans les veines pulmonaires et cette maladie veino-occlusive peut être responsable d’une hypertension artérielle pulmonaire.

 

Le regard du statisticien, présentation de la méthodologie

Le problème posé était celui d’une classification non supervisée. L’objectif d’une telle classification est de constituer des groupes d’objets. Les caractéristiques des objets d’un même groupe sont les plus proches possibles alors que celles d’objets appartenant à différents groupes sont les plus dissemblables possibles. Nous avons choisi d’utiliser la méthode des k-means. Cette méthode est assez complexe à utiliser. Il faut en effet franchir plusieurs obstacles : choix des variables de classification sachant que toute donnée manquante entraîne l’élimination de l’observation ; nécessité ou non de standardiser les variables ; utilisation de métriques différentes (variables continues, catégorielles ou binaires) ; choix du nombre de groupes (clusters) ; vérification de la taille et des caractéristiques des groupes. Ces difficultés sont communes à toutes les méthodes de classification non supervisée mais la méthode des k-means en ajoute encore une : la classification proposée est tributaire de l’ordre des observations ! En effet, l’algorithme utilise comme « semence » pour chacun des k clusters, les k premières observations. Ces semences sont donc dépendantes de l’ordre des observations. A l’étape suivante, l’algorithme classe la k+1ème observation au sein d’un des k clusters constitué. Il examine la validité de la nouvelle classification et  peut choisir de modifier les caractéristiques de l’un des clusters. Le processus est répété jusqu’à épuisement des observations.

 

La solution mise en place

Les variables de classification ont été choisies sur des critères cliniques et pratiques, puis ont été standardisées. Nous avons testé les 11 méthodes de classification non supervisée disponibles dans SAS. Les résultats les plus intéressants ont été obtenus avec la méthode des k-means. Nous avons mis en évidence 5 groupes de patients dont le pronostic –qui n’était pas une variable de classification- s’est avéré très différent (allant de 0% à 80% de mortalité à 5 ans). Restait un problème difficile : critiquer la classification obtenue et tester sa robustesse vis-à-vis de l’ordre des observations.

 

L’originalité

Nous avons créé une macro SAS qui fait 500 tris aléatoires, opère une classification en clusters pour chaque dataset obtenu et calcule le nombre de fois où chaque paire d’observations est classée dans le même cluster. Notre idée était que si le patient 1 et le patient 5 étaient toujours classés dans le même cluster, et ce quel que soit l’ordre des observations, les patients 1 et 5 étaient réellement très proches. A contrario des patients qui ne sont jamais classés dans le même cluster sont réellement très dissemblables. Notre intuition a été vérifiée. Nous avons également testé la méthode de Ward qui n’est pas sensible à l’ordre des observations et les résultats se sont avérés très proches.

 

Conclusion

Grâce à notre expertise analyse de données, nous avons pu mettre en évidence au sein d’une population de patients sclérodermiques présentant une HTAP, 5 profils cliniques différents répondant à des mécanismes spécifiques. C’est le premier travail de ce genre mené dans cette population. Une publication est en cours de rédaction.

Logo Soladis Group by EFOR transparent 45

Soladis - France (siège)
6-8 rue Bellecombe
69006 LYON - FRANCE
Tél: +33(0)4.72.83.86.70

Soladis GmbH - Suisse
Lange Gasse 15
CH-4052 Basel
Phone: +41(0)58.258.15.80

Soladis Inc. - USA
185 Alewife Brook Pkwy, Unit 210
Cambridge, MA 02138-1100
Phone: (+1)347.417.4008

Soladis Canada
545 King Street West, Suite 309,
TORONTO, ON M5V 1M1
Phone: (+1)437.970.6462


    Avant de valider, merci de recopier ce code captcha

    dans le champ suivant :

      NOUS CONTACTER


      Avant de valider, merci de recopier ce code captcha

      dans le champ suivant :

      RECHERCHER

      MENU

      MENU

      Suscribe to our newsletter

      En cliquant sur le lien ci-dessous, vous allez être redirigé vers LinkedIn. Des cookies tiers peuvent alors être installés sur votre navigateur. Ces cookies ne sont pas implémentés directement par le site Soladis mais par le site de réseau social auquel vous vous connectez.
      Ces cookies sont soumis à leurs propres politiques de confidentialité et ne relèvent en aucun cas de la responsabilité de Soladis.
      Vous pouvez consulter la politique de LinkedIn en matière de cookies en cliquant sur le lien suivant : LinkedIn – Politique relative aux cookies

        Suivre Soladis sur LinkedIn

      En cliquant sur le lien ci-dessous, vous allez être redirigé vers Youtube. Des cookies tiers peuvent alors être installés sur votre navigateur. Ces cookies ne sont pas implémentés directement par le site Soladis mais par le site auquel vous vous connectez.
      Important : ces cookies sont soumis à leurs propres politiques de confidentialité et ne relèvent en aucun cas de la responsabilité de Soladis.
      Vous pouvez consulter la politique de Youtube en matière de cookies en cliquant sur le lien suivant : Google – Règles de confidentialité et conditions d’utilisation

        Suivre Soladis sur Youtube

      By clicking on the link below, you will be redirected to LinkedIn. Third-party cookies may then be installed on your browser. These cookies are not implemented directly by the Soladis site but by the social network site to which you connect.
      These cookies are subject to their own privacy policies and are in no way the responsibility of Soladis.
      You can view LinkedIn's cookie policy by clicking on the following link :  LinkedIn – Cookie Policy

      Follow Soladis on LinkedIn

      By clicking on the link below, you will be redirected to Youtube. Third-party cookies may then be installed on your browser. These cookies are not implemented directly by the Soladis site but by the site to which you connect.
      Important: these cookies are subject to their own privacy policies and are in no way the responsibility of Soladis.
      You can view Youtube's cookie policy by clicking on the following link: Google – Privacy & terms

        Follow Soladis on Youtube