Les articles s’intéressant à l’utilité des analyses
statistiques et aux approches explicatives des tests statistiques existent depuis
de nombreuses années [1]. Cet article se propose de développer les notions de
normalité d’un échantillon, d’appariement, de régression et de
concordance statistique.
Les analyses statistiques que vous retrouvez dans la
littérature scientifique se basent sur les propriétés des variables utilisées. En
biostatistique, une variable est une information ou une observation. Au vu du
nombre d'informations que le thérapeute rencontre sur le terrain, ces variables
peuvent être de différentes modalités.
Il existe alors des variables quantitatives (VQT) ou
qualitatives (VQL) et les variables dépendantes (VD) ou indépendantes (VI) de
l’objet de l’observation. Les VQT sont associées à un chiffre pouvant être
mesurées alors que les VQL ne possèdent pas de sens arithmétique propre [2].
Les VD sont des variables qui subissent l'influence des VI. Le phénomène
observé se traduit par la VD,
de ce fait, la VD
est fonction de la VI. Le
protocole d’une étude doit contrôler les VI afin d’éviter toute variation non
maîtriser sur les VD [3]. L'analyse statistique doit absolument passer par la
définition du type de variable [4]. Bien que ce soit au lecteur critique de
déterminer le type et la nature des variables utilisées et vérifier leurs
adéquations à l'analyse statistique employée [5].
D'après E. Brunelle |
D'après E. Brunelle |
Mon échantillon possède-t-il une distribution normale ?
La mauvaise utilisation d’un test en rapport avec la
normalité de l’échantillon est l’une des erreurs les plus courantes relevée
dans la littérature scientifique [6]. Par consensus, au dessus de 30 sujets
votre groupe assume une distribution normale ou gaussienne [7]. Mais ce n’est
pas toujours vrai, il est donc nécessaire de tester cette normalité par
différents tests statistiques qui comparent la distribution de votre
échantillon avec une distribution normale de valeurs. Cependant ces tests de
normalité sont soumis aux tests d’hypothèses. Votre résultat est alors
assujetti aux deux risques d’erreurs [8]. Une autre méthode consiste à vérifier
cette normalité de distribution en analysant l’allure générale des valeurs via
un histogramme
Les tests statistiques exigeant une distribution normale des
valeurs sont qualifiés de paramétriques, contrairement aux tests non
paramétriques utilisés lorsque la distribution des valeurs ne suit pas une
courbe gaussienne. Les tests paramétriques sont dits « plus puissants »
Ils se basent sur les valeurs elles-mêmes ou leurs différences, et non sur
leurs rangs (position de chaque valeur) comme c’est le cas lors de tests
statistiques non paramétriques [1]. Certains indices de dispersion comme
l'écart type (standard deviation - SD) sont utiles pour analyser votre
distribution si, et seulement si elle respecte une loi normale.
Appariés ou non appariés ?
L'appariement d'un groupe intervient afin de diminuer la
variabilité sur un ou plusieurs critères étudiés et de ce fait, vise à la perte
d'indépendances de certaines observations [9]. Les critères d'appariement sont
sous-jacents aux modalités d'inclusion et d'exclusion fixés au début de
l'étude. Selon le traitement statistique, deux cas de comparaisons sont
possibles. Soit l'analyse s'effectue entre deux groupes à un temps précis
(tests statistiques non appariées) soit celle-ci s'attache à évaluer un groupe
à deux temps différents (tests statistiques appariés) [9]
Corrélation et régression
Les tests de corrélation analysent l'existence d'une liaison
entre deux variables quantitatives indépendantes suivant une loi normale. Cette
relation est traduite par un coefficient « r » ou r de Pearson
compris entre -1 et 1. Plus ce coefficient est proche d'une des extrémités, plus
la
liaison est forte [10]. A partir d'un coefficient de corrélation supérieur à
0,8, la force de liaison entre les variables étudiées est considérée comme
bonne. Ce coefficient doit être accompagné de sa p-value et de son intervalle
de confiance (notions développés dans le 3ème volet sur l’analyse statistique) afin
de d'exprimer plus précisément la force de liaison. La corrélation n'implique
pas d'autres variables que celles testées et cette liaison statistique n'est
pas un critère de causalité. Le coefficient de détermination est la mise au
carré du r de Pearson. Ce coefficient de détermination permet de jauger la
qualité de la régression et très utilisé pour préciser la relation entre les
variables étudiées [10].
La régression correspond à l'équation permettant de
connaître ou prédire la valeur d’une variable (VD) grâce à une autre (VI). Par
consensus, les VI sont placées sur l'axe des abscisses et les VD sur l'axe des
ordonnées. Le plus souvent une droite est tracée via une représentation graphique
en nuage de points. En fonction de
l'équation de la droite, la régression sera alors considérée linéaire ou non
linéaire [11]. La régression décrit la façon dont la variable placée sur l'axe
des ordonnées est liée à la variable placée sur l'axe des abscisses et non
l'inverse. Ce dernier point est souvent la cause de conclusions erronées dans
la littérature scientifique lorsque les auteurs examinent l'ordre de grandeur
des coefficients de corrélations trouvés, et les relations de cause à effet vis
à vis des régressions [11].
La concordance.
La comparaison de deux méthodes différentes ou d'une seule
méthode par 2 observateurs différents est un des thèmes largement abordés dans
le domaine de la rééducation. Ces comparaisons font l'objet de diverses erreurs
d'analyse statistique à cause des différences entre les VQT et les VQL. Dans le cas des VQL, la comparaison d'un test par deux
observateurs se réalise grâce au coefficient kappa. La concordance est alors la
proportion de sujets pour lesquels les examinateurs sont d'accord entre eux.
Plus ce coefficient kappa est proche de 1, plus le degré de concordance est
excellent. Cette mesure d'accord entre 2 observateurs doit être analysée en
fonction du contexte clinique [12].
La validation d'une nouvelle méthode thérapeutique de mesure
par rapport à une autre méthode (souvent placée en tant que méthode de
référence), porte essentiellement sur des VQT. La méthode graphique de Bland et
Altman semble être la meilleure des solutions pour objectiver une concordance
entre 2 méthodes, même si cette concordance est laissée à l'appréciation du
chercheur (choix des limites). Il n'est pas rare de rencontrer l'utilisation à
tort, de la régression et du coefficient de corrélation pour justifier de la
concordance entre 2 variables, alors que ces analyses mesurent l'intensité et
l'existence d'un lien entre 2 mesures [13].
Dans le cas des études de reproductibilité (test et retest),
le coefficient de corrélation intraclasse (CCI) est privilégié. Comme tout
coefficient il est compris entre 0 et 1 et un coefficient égal ou supérieur à
0,80 est un strict minimum pour estimer que les tests réalisés sont reproductibles
[13].
Bibliographie
[1] Greenhalgh T. How to Read a Paper: The Basics of
Evidence-Based Medicine. 4th Ed. Blackwell Publishing, BMJ Books. 2010. Ouvrage [2] Bewick V, Cheek L, Ball J. Statistics review 8:
Qualitative data – tests of association. Critical Care. 2004 8:46-53. Accès libre [3] Gore SM. Assessing methods – Many variables. Br Med J.
1981 283:901-5. Accès libre [4] Couraud S. Biostatistiques avec feuilles de calcul Excel©
ou équivalent. Revue de Pneumologie Clinique. 2009 65:377-85. Accès restreint [5] Conceicao MJ. Critical reading of the statistical data
in scientific studies. Rev Bras Cir Cardiovasc 2008 23;3:396-9 Accès libre [6] Glantz SA. Biostatistics: how to detect, correct and
prevent errors in the medical literature. Circulation 1980 61:1-7 Accès libre [7] Carlin JB, Doyle LW. Statistics for Clinicians. 3: Basic
concepts of statistical reasoning: Standard errors and confidence intervals. J.
Paediatr. Child Health 2000 36:502-5 Accès restreint [8] Riou B, Landais P. Principes des tests d’hypothése en
statistique : alpha, bêta et P. Ann Fr Anesth Réanim. 1998. 17:1168-80. Accès restreint [9] Carrat F. Comparer deux groupes. Rev Méd Interne. 2000
21:118-21. Accès restreint [10] Lang T. Twenty Statistical Errors Even YOU Can Find in
Biomedical Research Articles. Croat Med J. 2004 45:361-70. Accès libre [11] Guyatt G, Walter S, Shannon H, Cook D, Jaeschke R,
Heddle N. Basic statistics for clinicians : 4. Correlation and regression. Can
Med Assoc J. 1995 Feb.15. 152;4:497-504 Accès libre [12] Fuhrman C, Chouaïd C. Concordance de deux variables :
les approches numériques. Rev Mal Respir. 2004 21:123-5. Accès libre [13] Journois D. Concordance de deux variables: l'approche
graphique. Rev Mal Respir. 2004 21:127-30. Accès libre
NB : Cet article ainsi que le précédent traitent de
l’analyse statistique et sont librement inspirés du dossier spécial « biostatistiques
: la dimension collective de nos individualités », paru dans la revue
Kinésithérapie La Revue
numéro 138, auquel le GERAR a participé. Il est bien évident que vous
retrouverez de plus amples détails (contenu et bilbiographie) dans les articles
originaux.
Vergnault M. Place des biostatistiques dans la littérature scientifique. Kinesither Rev 2013;13(138):16–19 Accès restreint. Vergnault M. Principes et raisonnement en biostatistiques. Kinesither Rev 2013;13(138):20–24 Accès restreint. Vergnault M. Quelles biostatistiques pour quelles études? Kinesither Rev 2013;13(138):25–30 Accès restreint
Bonjour,
RépondreSupprimerLaisser couler... ou pas, telle est la question. En refusant de publier mon second commentaire au sujet du dernier article sur le même sujet, j'avoue qu'une partie de moi me dit de laisser couler. Mais que les gens comprennent les stats ET leurs difficultés me tient à coeur. Alors je vais quand même commenter (ceci dit, faut-il encore que vous le publiez).
Donc, de la même façon que les hypothèses nulle et alternative portent sur les paramètres en population, l'hypothèse de normalité concerne la distribution d'échantillonnage (ou les résidus), et non pas l'échantillon. Et cette notion est fondamentale.
Concernant les paramètres de mesure de fiabilité d'une variable qualitative dichotomique, le kappa est défini par le rapport entre l'accord VÉRITABLE au-delà du hasard sur l'accord POSSIBLE au delà du hasard. La définition que vous en donnez est en fait la proportion de concordance observée : elle rentre dans le calcul du Kappa mais en est différente.
Dans le cas d'une variable quantitative, je précise que si le CCI est effectivement compris entre 0 et 1, ce n'est pas le cas d'autres coefficients comme celui de Pearson ou encore le Kappa qui peuvent tous deux être inférieurs à zéro. Quant au '<=0.8 strict minimum...', c'est faux et de toute façon bien plus compliqué que ça.
Donc encore une fois, vulgariser les stats est un exercice délicat, et l'est encore plus quand on ne les maitrise pas. En ce sens, j'encourage les néophytes à lire des ouvrages dédiés à cet apprentissage.
Cordialement
Bonjour Anonyme (serait-il temps de dévoiler votre identité?)
SupprimerMerci pour ces précisions.
J'encourage tout comme vous étudiants et professionnels à lire différents ouvrages.
Par contre, si jamais l'envie vous prends de partager vos observations, le blog du GERAR est ouvert à vos productions.
De plus, et chose importante, nous n'avons pas du tout vu passer les réponses à votre commentaire précédent. Donc pas de censure de notre part, mais surement une mauvaise manipulation ou un problème sur la plateforme google. Donc libre à vous de recommencer.
Cordialement.
MV.
Bonjour,
RépondreSupprimerToutes mes excuses si vous n'avez pas vu passer mon second commentaire.
Je disais juste que les tests d'hypothèses sont tellement contre-intuitifs que beaucoup de gens les interprètent de manière incorrecte. Malheureusement, l'approche fréquentiste a encore de beaux jours devant elle dans la littérature biomédicale.
Quant au fait de 'lever le voile sur mon identité', je ne suis pas certain qu'il y ait un intérêt à cela. C'est le contenu des propos qui importe, non ?
Rdv au 3è volet,
Cordialement,
Anonyme ;-)
Bonjour en tant que l'un des administrateurs du Gerar, je suis heureux de voir que les lecteurs commence à délier leur langue. Quant à l'identité à révéler, c'est tout d'abord une question de politesse et internet n'y est pas exempt...
RépondreSupprimerEnsuite, il y a toujours une relation entre le fond de vos propos et la forme que vous y mettez et l'interprétation des statistiques en sont un exemple notoire, ressortez les stat de leur contexte et vous n'avez plus de stat.
Donc autant dire que vos critiques perdent énormément de leur substances et c'est dommage.
En espérant que le débat puisse continuer entre les stateux...
N. Shahmaei
https://www.france-universite-numerique-mooc.fr/courses/Paris11/15001/Trimestre_2_2014/about
RépondreSupprimer