Skip to content

Article image
Analyse Statistique des Données en Chimie

Les mesures chimiques sont intrinsèquement sujettes à la variabilité, et les statistiques fournissent le langage et les outils pour décrire, interpréter et tirer des conclusions de cette variabilité. Les statistiques descriptives résument les ensembles de données à l’aide de mesures de tendance centrale — la moyenne et la médiane — et de mesures de dispersion telles que l’écart-type (s) et la variance (s²). La distribution normale (gaussienne) décrit de nombreuses sources naturelles d’erreur aléatoire ; environ 68 % des mesures se situent dans ±1s de la moyenne, 95 % dans ±2s et 99,7 % dans ±3s.

Les intervalles de confiance expriment la plage dans laquelle la vraie moyenne de la population est censée se situer à un niveau de probabilité donné (généralement 95 %). L’intervalle est calculé comme x̄ ± t · s / √n, où t est la valeur t de Student pour le niveau de confiance et les degrés de liberté souhaités. Le test d’hypothèse utilise le test t pour comparer une moyenne d’échantillon à une valeur de référence (test t à un échantillon) ou pour comparer deux moyennes d’échantillons (tests t à deux échantillons et appariés). Le test F compare deux variances pour déterminer si leur différence est statistiquement significative.

L’analyse de variance (ANOVA) étend le test t pour comparer simultanément trois moyennes de groupe ou plus. L’ANOVA à un facteur partitionne la variance totale en composantes inter-groupes et intra-groupes. Le rapport F (variance inter-groupes divisée par la variance intra-groupes) teste l’hypothèse nulle selon laquelle toutes les moyennes des groupes sont égales. Les tests post-hoc tels que le HSD de Tukey identifient quelles paires spécifiques diffèrent significativement.

La détection des valeurs aberrantes est essentielle car une seule valeur anormale peut fausser les conclusions statistiques. Le test de Grubbs identifie une valeur aberrante à la fois en comparant l’écart maximal par rapport à la moyenne à une valeur Z critique. Le test Q de Dixon évalue si la valeur la plus petite ou la plus grande d’un petit ensemble de données (n ≤ 30) est discordante. Les valeurs aberrantes suspectées ne doivent jamais être écartées arbitrairement — elles nécessitent une justification documentée et ne doivent être supprimées que si une cause physique ou procédurale est confirmée.

Les courbes d’étalonnage relient la réponse instrumentale y à la concentration de l’analyte x par régression linéaire basée sur le critère des moindres carrés : minimiser Σ(yᵢ − ŷᵢ)². La régression fournit la pente m, l’ordonnée à l’origine b et le coefficient de corrélation . Les concentrations inconnues sont prédites en interpolant leur réponse sur la droite de régression. La limite de détection (LOD) est la plus petite concentration distinguable du blanc, généralement calculée comme 3,3 · σ/S, où σ est l’écart-type du blanc et S est la pente. La limite de quantification (LOQ) est fixée à 10 · σ/S, représentant la mesure quantitative fiable la plus basse.