Skip to content

Article image
Análisis Estadístico de Datos en Química

Las mediciones químicas están inherentemente sujetas a variabilidad, y la estadística proporciona el lenguaje y las herramientas para describir, interpretar y extraer conclusiones de esa variabilidad. La estadística descriptiva resume conjuntos de datos utilizando medidas de tendencia central — la media (promedio) y la mediana (valor central) — y medidas de dispersión como la desviación estándar (s) y la varianza (s²). La distribución normal (gaussiana) describe muchas fuentes naturales de error aleatorio; aproximadamente el 68% de las mediciones se encuentran dentro de ±1s de la media, el 95% dentro de ±2s y el 99,7% dentro de ±3s.

Los intervalos de confianza expresan el rango dentro del cual se espera que se encuentre la media verdadera de la población con un nivel de probabilidad dado (típicamente 95%). El intervalo se calcula como x̄ ± t · s / √n, donde t es el valor t de Student para la confianza y los grados de libertad deseados. La prueba de hipótesis utiliza la prueba t para comparar la media de una muestra con un valor de referencia (prueba t de una muestra) o para comparar dos medias muestrales (pruebas t de dos muestras y pareadas). La prueba F compara dos varianzas para determinar si su diferencia es estadísticamente significativa.

El análisis de varianza (ANOVA) extiende la prueba t para comparar tres o más medias grupales simultáneamente. El ANOVA de un factor divide la varianza total en componentes entre grupos e intragrupos. El cociente F (varianza entre grupos dividida por la varianza intragrupos) prueba la hipótesis nula de que todas las medias grupales son iguales. Las pruebas post-hoc como el HSD de Tukey identifican qué pares específicos difieren significativamente.

La detección de valores atípicos es crítica porque un solo valor aberrantes puede distorsionar las conclusiones estadísticas. La prueba de Grubbs identifica un valor atípico a la vez comparando la desviación máxima de la media con un valor Z crítico. La prueba Q de Dixon evalúa si el valor más pequeño o más grande en un conjunto de datos pequeño (n ≤ 30) es discordante. Los valores atípicos sospechosos nunca deben descartarse arbitrariamente — requieren una justificación documentada y solo deben eliminarse si se confirma una causa física o procedural.

Las curvas de calibración relacionan la respuesta del instrumento y con la concentración del analito x mediante regresión lineal basada en el criterio de mínimos cuadrados: minimizando Σ(yᵢ − ŷᵢ)². La regresión produce la pendiente m, la intersección b y el coeficiente de correlación . Las concentraciones desconocidas se predicen interpolando su respuesta en la línea de regresión. El límite de detección (LOD) es la concentración más pequeña distinguible del blanco, calculada típicamente como 3,3 · σ/S, donde σ es la desviación estándar del blanco y S es la pendiente. El límite de cuantificación (LOQ) se establece en 10 · σ/S, representando la medición cuantitativa fiable más baja.