9.10.13

L'analyse statistique : des données à décortiquer

   Les articles s’intéressant à l’utilité des analyses statistiques et aux approches explicatives des tests statistiques existent depuis de nombreuses années [1]. Cet article se propose de développer les notions de normalité d’un échantillon, d’appariement, de régression et de concordance statistique.

   Les analyses statistiques que vous retrouvez dans la littérature scientifique se basent sur les propriétés des variables utilisées. En biostatistique, une variable est une information ou une observation. Au vu du nombre d'informations que le thérapeute rencontre sur le terrain, ces variables peuvent être de différentes modalités.



   Il existe alors des variables quantitatives (VQT) ou qualitatives (VQL) et les variables dépendantes (VD) ou indépendantes (VI) de l’objet de l’observation. Les VQT sont associées à un chiffre pouvant être mesurées alors que les VQL ne possèdent pas de sens arithmétique propre [2]. Les VD sont des variables qui subissent l'influence des VI. Le phénomène observé se traduit par la VD, de ce fait, la VD est fonction de la VI. Le protocole d’une étude doit contrôler les VI afin d’éviter toute variation non maîtriser sur les VD [3]. L'analyse statistique doit absolument passer par la définition du type de variable [4]. Bien que ce soit au lecteur critique de déterminer le type et la nature des variables utilisées et vérifier leurs adéquations à l'analyse statistique employée [5].
D'après E. Brunelle
D'après E. Brunelle
   Par exemple, dans l'étude de l'impact d'une activité physique sur la qualité de vie, le temps de suivi est la variable indépendante, la variable dépendante peut être le score de qualité de vie.

Mon échantillon possède-t-il une distribution normale ?
   La mauvaise utilisation d’un test en rapport avec la normalité de l’échantillon est l’une des erreurs les plus courantes relevée dans la littérature scientifique [6]. Par consensus, au dessus de 30 sujets votre groupe assume une distribution normale ou gaussienne [7]. Mais ce n’est pas toujours vrai, il est donc nécessaire de tester cette normalité par différents tests statistiques qui comparent la distribution de votre échantillon avec une distribution normale de valeurs. Cependant ces tests de normalité sont soumis aux tests d’hypothèses. Votre résultat est alors assujetti aux deux risques d’erreurs [8]. Une autre méthode consiste à vérifier cette normalité de distribution en analysant l’allure générale des valeurs via un histogramme

   Les tests statistiques exigeant une distribution normale des valeurs sont qualifiés de paramétriques, contrairement aux tests non paramétriques utilisés lorsque la distribution des valeurs ne suit pas une courbe gaussienne. Les tests paramétriques sont dits « plus puissants » Ils se basent sur les valeurs elles-mêmes ou leurs différences, et non sur leurs rangs (position de chaque valeur) comme c’est le cas lors de tests statistiques non paramétriques [1]. Certains indices de dispersion comme l'écart type (standard deviation - SD) sont utiles pour analyser votre distribution si, et seulement si elle respecte une loi normale.



   La figure précédente décrit les histogrammes d’un échantillon suivant une loi normale et sa courbe gaussienne (a) et un échantillon suivant une autre loi de distribution (b).

Appariés ou non appariés ?
   L'appariement d'un groupe intervient afin de diminuer la variabilité sur un ou plusieurs critères étudiés et de ce fait, vise à la perte d'indépendances de certaines observations [9]. Les critères d'appariement sont sous-jacents aux modalités d'inclusion et d'exclusion fixés au début de l'étude. Selon le traitement statistique, deux cas de comparaisons sont possibles. Soit l'analyse s'effectue entre deux groupes à un temps précis (tests statistiques non appariées) soit celle-ci s'attache à évaluer un groupe à deux temps différents (tests statistiques appariés) [9]

Corrélation et régression
   Les tests de corrélation analysent l'existence d'une liaison entre deux variables quantitatives indépendantes suivant une loi normale. Cette relation est traduite par un coefficient « r » ou r de Pearson compris entre -1 et 1. Plus ce coefficient est proche d'une des extrémités, plus la
liaison est forte [10]. A partir d'un coefficient de corrélation supérieur à 0,8, la force de liaison entre les variables étudiées est considérée comme bonne. Ce coefficient doit être accompagné de sa p-value et de son intervalle de confiance (notions développés dans le 3ème volet sur l’analyse statistique) afin de d'exprimer plus précisément la force de liaison. La corrélation n'implique pas d'autres variables que celles testées et cette liaison statistique n'est pas un critère de causalité. Le coefficient de détermination est la mise au carré du r de Pearson. Ce coefficient de détermination permet de jauger la qualité de la régression et très utilisé pour préciser la relation entre les variables étudiées [10].

   La régression correspond à l'équation permettant de connaître ou prédire la valeur d’une variable (VD) grâce à une autre (VI). Par consensus, les VI sont placées sur l'axe des abscisses et les VD sur l'axe des ordonnées. Le plus souvent une droite est tracée via une représentation graphique en nuage de points.  En fonction de l'équation de la droite, la régression sera alors considérée linéaire ou non linéaire [11]. La régression décrit la façon dont la variable placée sur l'axe des ordonnées est liée à la variable placée sur l'axe des abscisses et non l'inverse. Ce dernier point est souvent la cause de conclusions erronées dans la littérature scientifique lorsque les auteurs examinent l'ordre de grandeur des coefficients de corrélations trouvés, et les relations de cause à effet vis à vis des régressions [11].

La concordance.
   La comparaison de deux méthodes différentes ou d'une seule méthode par 2 observateurs différents est un des thèmes largement abordés dans le domaine de la rééducation. Ces comparaisons font l'objet de diverses erreurs d'analyse statistique à cause des différences entre les VQT et les VQL. Dans le cas des VQL, la comparaison d'un test par deux observateurs se réalise grâce au coefficient kappa. La concordance est alors la proportion de sujets pour lesquels les examinateurs sont d'accord entre eux. Plus ce coefficient kappa est proche de 1, plus le degré de concordance est excellent. Cette mesure d'accord entre 2 observateurs doit être analysée en fonction du contexte clinique [12].
   La validation d'une nouvelle méthode thérapeutique de mesure par rapport à une autre méthode (souvent placée en tant que méthode de référence), porte essentiellement sur des VQT. La méthode graphique de Bland et Altman semble être la meilleure des solutions pour objectiver une concordance entre 2 méthodes, même si cette concordance est laissée à l'appréciation du chercheur (choix des limites). Il n'est pas rare de rencontrer l'utilisation à tort, de la régression et du coefficient de corrélation pour justifier de la concordance entre 2 variables, alors que ces analyses mesurent l'intensité et l'existence d'un lien entre 2 mesures [13].
   Dans le cas des études de reproductibilité (test et retest), le coefficient de corrélation intraclasse (CCI) est privilégié. Comme tout coefficient il est compris entre 0 et 1 et un coefficient égal ou supérieur à 0,80 est un strict minimum pour estimer que les tests réalisés sont reproductibles [13].


Bibliographie

[1] Greenhalgh T. How to Read a Paper: The Basics of Evidence-Based Medicine. 4th Ed. Blackwell Publishing, BMJ Books. 2010. Ouvrage [2] Bewick V, Cheek L, Ball J. Statistics review 8: Qualitative data – tests of association. Critical Care. 2004 8:46-53. Accès libre [3] Gore SM. Assessing methods – Many variables. Br Med J. 1981 283:901-5. Accès libre [4] Couraud S. Biostatistiques avec feuilles de calcul Excel© ou équivalent. Revue de Pneumologie Clinique. 2009 65:377-85. Accès restreint [5] Conceicao MJ. Critical reading of the statistical data in scientific studies. Rev Bras Cir Cardiovasc 2008 23;3:396-9 Accès libre [6] Glantz SA. Biostatistics: how to detect, correct and prevent errors in the medical literature. Circulation 1980 61:1-7 Accès libre [7] Carlin JB, Doyle LW. Statistics for Clinicians. 3: Basic concepts of statistical reasoning: Standard errors and confidence intervals. J. Paediatr. Child Health 2000 36:502-5 Accès restreint [8] Riou B, Landais P. Principes des tests d’hypothése en statistique : alpha, bêta et P. Ann Fr Anesth Réanim. 1998. 17:1168-80. Accès restreint [9] Carrat F. Comparer deux groupes. Rev Méd Interne. 2000 21:118-21. Accès restreint [10] Lang T. Twenty Statistical Errors Even YOU Can Find in Biomedical Research Articles. Croat Med J. 2004 45:361-70. Accès libre [11] Guyatt G, Walter S, Shannon H, Cook D, Jaeschke R, Heddle N. Basic statistics for clinicians : 4. Correlation and regression. Can Med Assoc J. 1995 Feb.15. 152;4:497-504 Accès libre [12] Fuhrman C, Chouaïd C. Concordance de deux variables : les approches numériques. Rev Mal Respir. 2004 21:123-5. Accès libre [13] Journois D. Concordance de deux variables: l'approche graphique. Rev Mal Respir. 2004 21:127-30. Accès libre


NB : Cet article ainsi que le précédent traitent de l’analyse statistique et sont librement inspirés du dossier spécial « biostatistiques : la dimension collective de nos individualités », paru dans la revue Kinésithérapie La Revue numéro 138, auquel le GERAR a participé. Il est bien évident que vous retrouverez de plus amples détails (contenu et bilbiographie) dans les articles originaux.  
Vergnault M. Place des biostatistiques dans la littérature scientifique. Kinesither Rev 2013;13(138):16–19 Accès restreint. Vergnault M. Principes et raisonnement en biostatistiques. Kinesither Rev 2013;13(138):20–24 Accès restreint. Vergnault M. Quelles biostatistiques pour quelles études? Kinesither Rev 2013;13(138):25–30 Accès restreint

5 commentaires:

  1. Bonjour,

    Laisser couler... ou pas, telle est la question. En refusant de publier mon second commentaire au sujet du dernier article sur le même sujet, j'avoue qu'une partie de moi me dit de laisser couler. Mais que les gens comprennent les stats ET leurs difficultés me tient à coeur. Alors je vais quand même commenter (ceci dit, faut-il encore que vous le publiez).

    Donc, de la même façon que les hypothèses nulle et alternative portent sur les paramètres en population, l'hypothèse de normalité concerne la distribution d'échantillonnage (ou les résidus), et non pas l'échantillon. Et cette notion est fondamentale.

    Concernant les paramètres de mesure de fiabilité d'une variable qualitative dichotomique, le kappa est défini par le rapport entre l'accord VÉRITABLE au-delà du hasard sur l'accord POSSIBLE au delà du hasard. La définition que vous en donnez est en fait la proportion de concordance observée : elle rentre dans le calcul du Kappa mais en est différente.

    Dans le cas d'une variable quantitative, je précise que si le CCI est effectivement compris entre 0 et 1, ce n'est pas le cas d'autres coefficients comme celui de Pearson ou encore le Kappa qui peuvent tous deux être inférieurs à zéro. Quant au '<=0.8 strict minimum...', c'est faux et de toute façon bien plus compliqué que ça.

    Donc encore une fois, vulgariser les stats est un exercice délicat, et l'est encore plus quand on ne les maitrise pas. En ce sens, j'encourage les néophytes à lire des ouvrages dédiés à cet apprentissage.

    Cordialement

    RépondreSupprimer
    Réponses
    1. Bonjour Anonyme (serait-il temps de dévoiler votre identité?)
      Merci pour ces précisions.
      J'encourage tout comme vous étudiants et professionnels à lire différents ouvrages.
      Par contre, si jamais l'envie vous prends de partager vos observations, le blog du GERAR est ouvert à vos productions.

      De plus, et chose importante, nous n'avons pas du tout vu passer les réponses à votre commentaire précédent. Donc pas de censure de notre part, mais surement une mauvaise manipulation ou un problème sur la plateforme google. Donc libre à vous de recommencer.

      Cordialement.
      MV.

      Supprimer
  2. Bonjour,

    Toutes mes excuses si vous n'avez pas vu passer mon second commentaire.
    Je disais juste que les tests d'hypothèses sont tellement contre-intuitifs que beaucoup de gens les interprètent de manière incorrecte. Malheureusement, l'approche fréquentiste a encore de beaux jours devant elle dans la littérature biomédicale.

    Quant au fait de 'lever le voile sur mon identité', je ne suis pas certain qu'il y ait un intérêt à cela. C'est le contenu des propos qui importe, non ?

    Rdv au 3è volet,
    Cordialement,

    Anonyme ;-)

    RépondreSupprimer
  3. Bonjour en tant que l'un des administrateurs du Gerar, je suis heureux de voir que les lecteurs commence à délier leur langue. Quant à l'identité à révéler, c'est tout d'abord une question de politesse et internet n'y est pas exempt...
    Ensuite, il y a toujours une relation entre le fond de vos propos et la forme que vous y mettez et l'interprétation des statistiques en sont un exemple notoire, ressortez les stat de leur contexte et vous n'avez plus de stat.
    Donc autant dire que vos critiques perdent énormément de leur substances et c'est dommage.

    En espérant que le débat puisse continuer entre les stateux...

    N. Shahmaei

    RépondreSupprimer
  4. https://www.france-universite-numerique-mooc.fr/courses/Paris11/15001/Trimestre_2_2014/about

    RépondreSupprimer

Printfriendly



Related Posts Plugin for WordPress, Blogger...