S'il y a bien un paragraphe dans une étude scientifique qui
peut poser problème en termes de compréhension pour la suite de l'article,
c'est bien souvent la partie des biostatistiques. Dans la littérature
scientifique, les biostatistiques possèdent un rôle central. Les conclusions
statistiques valident ou non, les hypothèses de départ énoncées par les
chercheurs. Dans un article cette partie n'est pas facile à analyser et à
critiquer, cependant « il n'est pas nécessaire de savoir construire une
voiture pour pouvoir la conduire » (traduction libre) [1].
Mais pourquoi des biostatistiques ? Cette question peut
paraître bizarre pour les défenseurs de l'objectivation et de l'Evidence-Based
dans le domaine de la rééducation, mais les biostatistiques rapportées aux
sciences du vivant n'ont et ne sont pas toujours bien accueillies. Ce constat
s’appuie sur deux principales critiques. Pour certains les analyses
biostatistiques sont manipulables, prétextant que les résultats ne veulent pas
dire grand ou que c'est un domaine trop difficile à comprendre. Pour d'autres,
cette science ne peut pas s'appliquer à tous les champs des sciences de la vie
comme la médecine, surtout lorsqu'il s'agit de cas cliniques [2].
Se basant
sur une prise en charge individuelle, le praticien oublie que cet individu fait
partie de groupes et que celui-ci est soumis à la variabilité biologique. En ce
sens, le fait qu’une thérapeutique (X) soit meilleure qu’une autre (Y), ne veut
pas dire que X soit la plus favorable pour tous les individus, mais forcé de
constater que X assure un plus grand nombre de succès. Cette conclusion établie
pour un groupe peut préciser une thérapeutique pour un individu donné à un moment
donné. Une méthodologie statistique adéquate peut être l'occasion de prendre
conscience de la variabilité des paramètres, et des mesures rencontrées lors de
nos pratiques et surtout d’en tenir compte.
Les travaux
du début du siècle dernier par Fisher RA et Pearson K ont été le point de
départ de la
statistique fréquentiste telle que nous l'utilisons dans le domaine de la
réhabilitation. Depuis, l’être vivant est transformé en une suite infinie de
mesures, de nombres, dont l'analyse et l'interprétation posent souvent quelques
problèmes. Conscient que les biostatistiques avaient un rôle de validation
d'étude, certains auteurs se sont emparés du concept d'inférence
statistique : interprétation et principes d'analyses des résultats via les
données recueillies. Par méconnaissance de cette discipline ou par fraude, ces
cliniciens ont fait jouer les analyses statistiques en leur faveur [3]. Résultat :
dans les années 1980 [3], plus de la moitié des études utilisent des tests
inappropriés ou des méthodes statistiques incorrectes.
Du fait de
la grande variabilité des valeurs dans le domaine de la santé, les thérapeutes
doivent savoir si les variations des paramètres observés ont évolué grâce à
leur prise en charge ou, si cette variation est seulement due au hasard. Dans
une démarche scientifique qui s’oppose à une approche dogmatique et empirique,
les biostatistiques permettent de rassembler des données et de décrire les
phénomènes observés. Les tests statistiques quantifient alors les relations
existantes entre les paramètres étudiés provenant de diverses observations
selon un degré d'incertitude et des risques d’erreurs.[4,5].
Porté par
la vague de l'Evidence-Based et des principes d'objectivation des pratiques, il
n'est plus concevable de mettre en place une étude clinique, de lire un article
scientifique ou de créer un protocole de recherche sans faire appel aux biostatistiques
[4,5]. Le GERAR se proposera plus tard de détailler les différences entre les
nombreuses études qui peuvent exister dans la littérature scientifique.
Les nombres seuls ne sont que des nombres, la statistique
descriptive place ces nombres au milieu de leur contexte, permettant ainsi des
prises de décisions en rapport avec les analyses effectuées. Par où commencer
dans ce cas ? Comment faire pour traduire les nombres ?
L'interprétation causale des résultats cliniques n'est pas toujours facile pour
l'investigateur de la recherche et l'analyse statistique n'est pas tout le temps
lisible pour le néophyte [6].
La
méthodologie et l'analyse statistique, par l'exploitation rigoureuse des
données et l'interprétation des résultats, ainsi que par la qualité du
protocole mis en place sont une étape clé dans une étude.
Ne
remettant pas en cause la qualité des logiciels de biostatistiques, certains
auteurs sont assez sceptiques quant à leur utilisation [7]. Les logiciels
n'expliquent pas leur raisonnement, ils calculent ce que vous leur demandez, en
aucun cas ils ne vous renseignent sur la bonne application du test que vous
venez de choisir. Certes, ils sont très faciles d'utilisation mais leur
maîtrise est souvent approximative par un public non averti. Pourtant des
connaissances simples en biostatistiques permettent d'appréhender les problèmes
fréquents et d'éloigner le recours à un professionnel de la biostatistique [7].
C'est en analysant les critères de lecture d'une étude
scientifique que la notion de validation statistique prend tout son sens. Les
lecteurs des revues spécialisées assument souvent que tout article validé pour
publication a été vérifié scrupuleusement par des relecteurs compétents dans
toute la structure de l'article, y compris la partie statistique. Mais ce n'est
pas toujours le cas car peu de chercheurs ont eu une formation sur les analyses
statistiques [6,8]. Ce qui poussent souvent les lecteurs avertis à vérifier
l'adéquation entre les variables étudiées et les tests statistiques employés [8].
C’est pour cela que certains rédacteurs en chef de nombreux journaux nationaux
et internationaux ont mis au point des articles d'éclaircissements et des
recommandations pour les auteurs afin d'homogénéiser la qualité des analyses
statistiques [1].
Le lecteur
averti doit s'en remettre à différents indices afin de démasquer certaines
contrefaçons et erreurs dans l'analyse statistique [8]. Le tableau suivant explicite ces points de révision lors de
la lecture d’un article scientifique.
Un travail
de recherche vise presque toujours à comparer 2 ou plusieurs groupes, en
vérifiant si l'existence d'une différence est liée à divers signes diagnostic
ou à certains traitements thérapeutiques. Le clinicien examine alors si la
différence observée est également due aux fluctuations du hasard [1]
Le
raisonnement statistique veut qu'à la suite de diverses observations, une ou
plusieurs hypothèses soient énoncées et que celles-ci soient vérifiées grâce à
des tests statistiques. Au lieu d'essayer de démontrer qu'un événement est
probablement arrivé, les analyses statistiques tentent de démontrer que c'est
improbable que cet événement ne se passe pas [4].
Toute
analyse statistique fréquentiste se base sur le test d'hypothèse. Pour
départager deux distributions, le chercheur formule une hypothèse principale,
appelée hypothèse nulle ou H0. Celle-ci assume qu'il n'existe pas de différence
entre les échantillons testés, autrement dit que rien ne permet de les
différencier. Rejeter l'hypothèse nulle, c'est donc accepter l'existence d'une
différence entre les deux échantillons analysés. La deuxième hypothèse, appelée
l'hypothèse alternative ou H1, est alors considérée. Celle-ci consiste à dire
qu'il existe une différence entre ces échantillons [4]
Les tests d’hypothèses :
Le but de la démarche statistique est donc de permettre une
conclusion via les tests d'hypothèses formulées a priori à partir d'un
échantillon. L'action de rejeter ou d'accepter l'hypothèse nulle, et de
considérer qu'il existe une différence ou non, est soumis à deux types d'erreur
[9]. L'erreur α ou risque de première espèce ou encore de type I, se retrouve
lorsque le clinicien considère qu'une différence existe entre les échantillons
alors que celle-ci est le simple fruit du hasard. L'erreur β ou risque de
deuxième espèce ou encore risque de type II, est le fait de conclure à tort
qu'il n'existe pas de différence alors qu'en réalité, cette différence existe.
La plupart des études fixe le risque α à 5%, libre à vous de diminuer ce risque
si voulez augmenter le degré de chance de ne pas commettre cette erreur [4,9].
Le risque β quant à lui, est estimé arbitrairement à 20%.
L’H0 est
acceptée selon le contexte de l’étude, mais en aucun cas elle est vraie. Les
biostatistiques quantifient l'incertitude qui se retrouve obligatoirement lors
de comparaison d'échantillons, mais ne quantifie en aucun cas un traitement ou
une thérapeutique. La quantification d'une incertitude ne lève pas
l'incertitude des décisions que le chercheur prend lorsqu'il accepte ou non
l'hypothèse nulle [4,9].
MV
Bibliographie :
[1] Greenhalgh T. How to Read a Paper: The Basics of
Evidence-Based Medicine. 4th Ed. Blackwell Publishing, BMJ Books. 2010 Ouvrage
[2] Advenier F. Le raisonnement pratique : entre casuistique
et statistique. Ann M Psych. 2010 168:152-5. Accès restreint
[3] Limb M. Misuse of statistics continues to plague
healthcare, conference hears. Br Med J. 2012 344:e1526. Accès restreint
[4] Ancelle T. Statistique épidémiologie. 3rd Ed. MALOINE,
Collection « sciences fondamentales »; 2007. Ouvrage
[5] Coutant C. Introduction à l’analyse critique statistique
d’un article. Tribune des internes/ Gynécologie Obstétrique & Fertilité.
2009. 37:765-8. Accès restreint
[6] Hupertan V, Rouprêt M. Plaidoyer pour une formation
statistique médicale de qualité (éditorial). Presse Med. 2004 33:149-50. Accès restreint
[7] Maisonneuve H. Guide du thésard. 7th Ed. Editions
Scientifiques L&C. 2010. Ouvrage numérique d'accès libre
[8] Glantz SA. Biostatistics: how to detect, correct and
prevent errors in the medical literature. Circulation 1980 61:1-7 Accès libre
[9] Huguier M, Flahault. Biostastiques au quotidien. Elsevier;
2000. Ouvrage
NB : Cet article ainsi que les suivants traitant de
l’analyse statistique, sont librement inspirés du dossier spécial « biostatistiques
: la dimension collective de nos individualités », paru dans la revue
Kinésithérapie La Revue
numéro 138, auquel le GERAR a participé. Il est bien évident que vous
retrouverez de plus amples détails (contenu et bilbiographie) dans les articles
originaux.
Vergnault M. Place des biostatistiques dans la littérature scientifique. Kinesither Rev 2013;13(138):16–19 Accès restreint.
Vergnault M. Principes et raisonnement en biostatistiques. Kinesither Rev 2013;13(138):20–24 Accès restreint.
Vergnault M. Quelles biostatistiques pour quelles études? Kinesither Rev 2013;13(138):25–30 Accès restreint
Bonjour,
RépondreSupprimerIl y a tant d'approximations et d'erreurs dans ce billet que je renonce à le commenter. Le lecteur néophyte désireux de découvrir les statistiques pourra consulter la référence [4] de Th. Ancelle.
Cdt
Anonyme, il est dommage de renoncer à commenter ce billet.
SupprimerLe but est de cet article est de donner envie de lire les références. C'est d'ailleurs le but du GERAR, faire lire des articles. Content de voir que ça marche, vous proposez un bon livre.
Cdt.
MV.