Paramétrique vs non paramétrique
La statistique est une branche d'études qui nous permet de comprendre la dynamique des populations en utilisant des échantillons prélevés sur une certaine population d'intérêt. Il est essentiel que ces échantillons soient aléatoires. De nombreuses formules sont créées avec l'incorporation de mathématiques, pour prendre des inférences sur les paramètres de population. Naturellement, toute population peut avoir une «distribution normale» où la dispersion des données / échantillons a la forme d'une cloche dans le graphique de fréquence. Dans une distribution normale, la plupart des échantillons se concentrent autour de la moyenne et 68%, 95%, 99% des données se trouvent respectivement à 1, 2 et 3 écarts types. Les statistiques paramétriques et non paramétriques dépendent de la prise en compte ou non de la distribution normale.
Qu'est-ce que les statistiques paramétriques?
Les statistiques paramétriques sont les statistiques dans lesquelles les données / échantillons sont considérés comme tirés d'une distribution normale. La définition des statistiques paramétriques est «les statistiques qui supposent que les données proviennent d'un type de distribution de probabilité et font des inférences sur les paramètres de la distribution». La plupart des méthodes statistiques élémentaires connues appartiennent à ce groupe. En réalité, ils peuvent ne pas être distribués normalement. Par conséquent, ce type de statistiques est basé sur plus d'hypothèses. Si les données / échantillons sont normalement distribués ou presque normalement, les formules peuvent produire des résultats et des inférences précis. Cependant, si l'hypothèse d'une distribution normale est erronée, les statistiques paramétriques peuvent être assez trompeuses.
Qu'est-ce que les statistiques non paramétriques?
Les statistiques non paramétriques sont également appelées statistiques sans distribution. L'avantage de ce type de statistique est qu'il n'a pas à faire d'hypothèse comme précédemment faite avec les paramètres. Les calculs statistiques non paramétriques tiennent compte des médianes plutôt que des moyennes. Par conséquent, si un ou deux s'écartent de la valeur moyenne, leur effet est négligé. En général, les statistiques paramétriques sont préférables à celles-ci car elles ont plus de pouvoir pour rejeter une fausse hypothèse qu'une méthode non paramétrique. L'un des tests non paramétriques les plus connus est le test du chi carré. Il existe des analogues non paramétriques pour certains tests paramétriques tels que le test Wilcoxon T pour le test t pour échantillon apparié, le test U de Mann-Whitney pour le test t pour échantillons indépendants, la corrélation de Spearman pour la corrélation de Pearson, etc. test non paramétrique comparable.
Quelle est la différence entre paramétrique et non paramétrique?
• Les statistiques paramétriques dépendent de la distribution normale, mais les statistiques non paramétriques ne dépendent pas de la distribution normale.
• Les statistiques paramétriques font plus d'hypothèses que les statistiques non paramétriques.
• Les statistiques paramétriques utilisent des formules plus simples par rapport aux statistiques non paramétriques.
• Lorsqu'on pense qu'une population est normalement distribuée ou proche de la distribution normale, les statistiques paramétriques sont les meilleures à utiliser. Sinon, il est préférable d'utiliser une méthode non paramétrique.
• La plupart des méthodes statistiques élémentaires communément connues appartiennent aux statistiques paramétriques. Les statistiques non paramétriques sont utilisées avec parcimonie et appliquées pour des cas particuliers.