28.9.13

L'analyse statistique : point critique dans une étude.

   S'il y a bien un paragraphe dans une étude scientifique qui peut poser problème en termes de compréhension pour la suite de l'article, c'est bien souvent la partie des biostatistiques. Dans la littérature scientifique, les biostatistiques possèdent un rôle central. Les conclusions statistiques valident ou non, les hypothèses de départ énoncées par les chercheurs. Dans un article cette partie n'est pas facile à analyser et à critiquer, cependant « il n'est pas nécessaire de savoir construire une voiture pour pouvoir la conduire » (traduction libre) [1].


   Mais pourquoi des biostatistiques ? Cette question peut paraître bizarre pour les défenseurs de l'objectivation et de l'Evidence-Based dans le domaine de la rééducation, mais les biostatistiques rapportées aux sciences du vivant n'ont et ne sont pas toujours bien accueillies. Ce constat s’appuie sur deux principales critiques. Pour certains les analyses biostatistiques sont manipulables, prétextant que les résultats ne veulent pas dire grand ou que c'est un domaine trop difficile à comprendre. Pour d'autres, cette science ne peut pas s'appliquer à tous les champs des sciences de la vie comme la médecine, surtout lorsqu'il s'agit de cas cliniques [2].
   Se basant sur une prise en charge individuelle, le praticien oublie que cet individu fait partie de groupes et que celui-ci est soumis à la variabilité biologique. En ce sens, le fait qu’une thérapeutique (X) soit meilleure qu’une autre (Y), ne veut pas dire que X soit la plus favorable pour tous les individus, mais forcé de constater que X assure un plus grand nombre de succès. Cette conclusion établie pour un groupe peut préciser une thérapeutique pour un individu donné à un moment donné. Une méthodologie statistique adéquate peut être l'occasion de prendre conscience de la variabilité des paramètres, et des mesures rencontrées lors de nos pratiques et surtout d’en tenir compte.

   Les travaux du début du siècle dernier par Fisher RA et Pearson K ont été le point de départ de la statistique fréquentiste telle que nous l'utilisons dans le domaine de la réhabilitation. Depuis, l’être vivant est transformé en une suite infinie de mesures, de nombres, dont l'analyse et l'interprétation posent souvent quelques problèmes. Conscient que les biostatistiques avaient un rôle de validation d'étude, certains auteurs se sont emparés du concept d'inférence statistique : interprétation et principes d'analyses des résultats via les données recueillies. Par méconnaissance de cette discipline ou par fraude, ces cliniciens ont fait jouer les analyses statistiques en leur faveur [3]. Résultat : dans les années 1980 [3], plus de la moitié des études utilisent des tests inappropriés ou des méthodes statistiques incorrectes.

   Du fait de la grande variabilité des valeurs dans le domaine de la santé, les thérapeutes doivent savoir si les variations des paramètres observés ont évolué grâce à leur prise en charge ou, si cette variation est seulement due au hasard. Dans une démarche scientifique qui s’oppose à une approche dogmatique et empirique, les biostatistiques permettent de rassembler des données et de décrire les phénomènes observés. Les tests statistiques quantifient alors les relations existantes entre les paramètres étudiés provenant de diverses observations selon un degré d'incertitude et des risques d’erreurs.[4,5].
   Porté par la vague de l'Evidence-Based et des principes d'objectivation des pratiques, il n'est plus concevable de mettre en place une étude clinique, de lire un article scientifique ou de créer un protocole de recherche sans faire appel aux biostatistiques [4,5]. Le GERAR se proposera plus tard de détailler les différences entre les nombreuses études qui peuvent exister dans la littérature scientifique.

   Les nombres seuls ne sont que des nombres, la statistique descriptive place ces nombres au milieu de leur contexte, permettant ainsi des prises de décisions en rapport avec les analyses effectuées. Par où commencer dans ce cas ? Comment faire pour traduire les nombres ? L'interprétation causale des résultats cliniques n'est pas toujours facile pour l'investigateur de la recherche et l'analyse statistique n'est pas tout le temps lisible pour le néophyte [6].
   La méthodologie et l'analyse statistique, par l'exploitation rigoureuse des données et l'interprétation des résultats, ainsi que par la qualité du protocole mis en place sont une étape clé dans une étude.

   Ne remettant pas en cause la qualité des logiciels de biostatistiques, certains auteurs sont assez sceptiques quant à leur utilisation [7]. Les logiciels n'expliquent pas leur raisonnement, ils calculent ce que vous leur demandez, en aucun cas ils ne vous renseignent sur la bonne application du test que vous venez de choisir. Certes, ils sont très faciles d'utilisation mais leur maîtrise est souvent approximative par un public non averti. Pourtant des connaissances simples en biostatistiques permettent d'appréhender les problèmes fréquents et d'éloigner le recours à un professionnel de la biostatistique [7].

   C'est en analysant les critères de lecture d'une étude scientifique que la notion de validation statistique prend tout son sens. Les lecteurs des revues spécialisées assument souvent que tout article validé pour publication a été vérifié scrupuleusement par des relecteurs compétents dans toute la structure de l'article, y compris la partie statistique. Mais ce n'est pas toujours le cas car peu de chercheurs ont eu une formation sur les analyses statistiques [6,8]. Ce qui poussent souvent les lecteurs avertis à vérifier l'adéquation entre les variables étudiées et les tests statistiques employés [8]. C’est pour cela que certains rédacteurs en chef de nombreux journaux nationaux et internationaux ont mis au point des articles d'éclaircissements et des recommandations pour les auteurs afin d'homogénéiser la qualité des analyses statistiques [1].
             
   Le lecteur averti doit s'en remettre à différents indices afin de démasquer certaines contrefaçons et erreurs dans l'analyse statistique [8]. Le tableau suivant explicite ces points de révision lors de la lecture d’un article scientifique.



   Un travail de recherche vise presque toujours à comparer 2 ou plusieurs groupes, en vérifiant si l'existence d'une différence est liée à divers signes diagnostic ou à certains traitements thérapeutiques. Le clinicien examine alors si la différence observée est également due aux fluctuations du hasard [1]
   Le raisonnement statistique veut qu'à la suite de diverses observations, une ou plusieurs hypothèses soient énoncées et que celles-ci soient vérifiées grâce à des tests statistiques. Au lieu d'essayer de démontrer qu'un événement est probablement arrivé, les analyses statistiques tentent de démontrer que c'est improbable que cet événement ne se passe pas [4].
            Toute analyse statistique fréquentiste se base sur le test d'hypothèse. Pour départager deux distributions, le chercheur formule une hypothèse principale, appelée hypothèse nulle ou H0. Celle-ci assume qu'il n'existe pas de différence entre les échantillons testés, autrement dit que rien ne permet de les différencier. Rejeter l'hypothèse nulle, c'est donc accepter l'existence d'une différence entre les deux échantillons analysés. La deuxième hypothèse, appelée l'hypothèse alternative ou H1, est alors considérée. Celle-ci consiste à dire qu'il existe une différence entre ces échantillons [4]

   Les tests d’hypothèses :
  Le but de la démarche statistique est donc de permettre une conclusion via les tests d'hypothèses formulées a priori à partir d'un échantillon. L'action de rejeter ou d'accepter l'hypothèse nulle, et de considérer qu'il existe une différence ou non, est soumis à deux types d'erreur [9]. L'erreur α ou risque de première espèce ou encore de type I, se retrouve lorsque le clinicien considère qu'une différence existe entre les échantillons alors que celle-ci est le simple fruit du hasard. L'erreur β ou risque de deuxième espèce ou encore risque de type II, est le fait de conclure à tort qu'il n'existe pas de différence alors qu'en réalité, cette différence existe. La plupart des études fixe le risque α à 5%, libre à vous de diminuer ce risque si voulez augmenter le degré de chance de ne pas commettre cette erreur [4,9]. Le risque β quant à lui, est estimé arbitrairement à 20%.
   L’H0 est acceptée selon le contexte de l’étude, mais en aucun cas elle est vraie. Les biostatistiques quantifient l'incertitude qui se retrouve obligatoirement lors de comparaison d'échantillons, mais ne quantifie en aucun cas un traitement ou une thérapeutique. La quantification d'une incertitude ne lève pas l'incertitude des décisions que le chercheur prend lorsqu'il accepte ou non l'hypothèse nulle [4,9].

MV

Bibliographie :
[1] Greenhalgh T. How to Read a Paper: The Basics of Evidence-Based Medicine. 4th Ed. Blackwell Publishing, BMJ Books. 2010  Ouvrage
[2] Advenier F. Le raisonnement pratique : entre casuistique et statistique. Ann M Psych. 2010 168:152-5.  Accès restreint
[3] Limb M. Misuse of statistics continues to plague healthcare, conference hears. Br Med J. 2012 344:e1526.  Accès restreint
[4] Ancelle T. Statistique épidémiologie. 3rd Ed. MALOINE, Collection « sciences fondamentales »; 2007. Ouvrage
[5] Coutant C. Introduction à l’analyse critique statistique d’un article. Tribune des internes/ Gynécologie Obstétrique & Fertilité. 2009. 37:765-8. Accès restreint
[6] Hupertan V, Rouprêt M. Plaidoyer pour une formation statistique médicale de qualité (éditorial). Presse Med. 2004 33:149-50. Accès restreint
[7] Maisonneuve H. Guide du thésard. 7th Ed. Editions Scientifiques L&C. 2010. Ouvrage numérique d'accès libre
[8] Glantz SA. Biostatistics: how to detect, correct and prevent errors in the medical literature. Circulation 1980 61:1-7 Accès libre
[9] Huguier M, Flahault. Biostastiques au quotidien. Elsevier; 2000. Ouvrage


NB : Cet article ainsi que les suivants traitant de l’analyse statistique, sont librement inspirés du dossier spécial « biostatistiques : la dimension collective de nos individualités », paru dans la revue Kinésithérapie La Revue numéro 138, auquel le GERAR a participé. Il est bien évident que vous retrouverez de plus amples détails (contenu et bilbiographie) dans les articles originaux.  
Vergnault M. Place des biostatistiques dans la littérature scientifique. Kinesither Rev 2013;13(138):16–19 Accès restreint. 
Vergnault M. Principes et raisonnement en biostatistiques. Kinesither Rev 2013;13(138):20–24 Accès restreint. 
Vergnault M. Quelles biostatistiques pour quelles études? Kinesither Rev 2013;13(138):25–30 Accès restreint

2 commentaires:

  1. Bonjour,

    Il y a tant d'approximations et d'erreurs dans ce billet que je renonce à le commenter. Le lecteur néophyte désireux de découvrir les statistiques pourra consulter la référence [4] de Th. Ancelle.

    Cdt

    RépondreSupprimer
    Réponses
    1. Anonyme, il est dommage de renoncer à commenter ce billet.
      Le but est de cet article est de donner envie de lire les références. C'est d'ailleurs le but du GERAR, faire lire des articles. Content de voir que ça marche, vous proposez un bon livre.
      Cdt.
      MV.

      Supprimer

Printfriendly



Related Posts Plugin for WordPress, Blogger...