As medições químicas são inerentemente sujeitas à variabilidade, e a estatística fornece a linguagem e as ferramentas para descrever, interpretar e tirar conclusões dessa variabilidade. A estatística descritiva resume conjuntos de dados usando medidas de tendência central — a média e a mediana (valor central) — e medidas de dispersão como o desvio padrão (s) e a variância (s²). A distribuição normal (gaussiana) descreve muitas fontes naturais de erro aleatório; aproximadamente 68% das medições estão dentro de ±1s da média, 95% dentro de ±2s e 99,7% dentro de ±3s.
Os intervalos de confiança expressam a faixa dentro da qual se espera que a verdadeira média populacional se encontre em um dado nível de probabilidade (tipicamente 95%). O intervalo é calculado como x̄ ± t · s / √n, onde t é o valor t de Student para o nível de confiança e graus de liberdade desejados. O teste de hipóteses usa o teste t para comparar uma média amostral com um valor de referência (teste t de uma amostra) ou para comparar duas médias amostrais (testes t de duas amostras e pareado). O teste F compara duas variâncias para determinar se suas diferenças são estatisticamente significativas.
A análise de variância (ANOVA) estende o teste t para comparar três ou mais médias de grupos simultaneamente. A ANOVA de um fator particiona a variância total em componentes entre grupos e dentro de grupos. A razão F (variância entre grupos dividida pela variância dentro dos grupos) testa a hipótese nula de que todas as médias dos grupos são iguais. Testes post-hoc, como o HSD de Tukey, identificam quais pares específicos diferem significativamente.
A detecção de outliers é crítica porque um único valor aberrante pode distorcer conclusões estatísticas. O teste de Grubbs identifica um outlier por vez, comparando o desvio máximo da média contra um valor Z crítico. O teste Q de Dixon avalia se o menor ou o maior valor em um conjunto de dados pequeno (n ≤ 30) é discordante. Outliers suspeitos nunca devem ser descartados arbitrariamente — exigem justificativa documentada e só devem ser removidos se uma causa física ou procedural for confirmada.
As curvas de calibração relacionam a resposta do instrumento y à concentração do analito x por meio da regressão linear baseada no critério dos mínimos quadrados: minimizar Σ(yᵢ − ŷᵢ)². A regressão fornece a inclinação m, o intercepto b e o coeficiente de correlação r². Concentrações desconhecidas são previstas interpolando sua resposta na reta de regressão. O limite de detecção (LOD) é a menor concentração distinguível do branco, tipicamente calculado como 3,3 · σ/S, onde σ é o desvio padrão do branco e S é a inclinação. O limite de quantificação (LOQ) é definido como 10 · σ/S, representando a medição quantitativa confiável mais baixa.