Skip to content

Article image
化学中的统计数据分析

化学测量本质上具有变异性,而统计学提供了描述、解释和从这些变异性中得出结论的语言和工具。描述性统计使用集中趋势度量——均值(平均值)和中位数(中间值)——以及离散度量如标准差(s)和方差(s²)来总结数据集。正态(高斯)分布描述了许多自然随机误差的来源;约68%的测量值落在均值的±1s范围内,95%在±2s范围内,99.7%在±3s范围内。

置信区间表示在给定概率水平(通常为95%)下,真实总体均值预期所在的区间。该区间计算为 x̄ ± t · s / √n,其中 t 是给定置信度和自由度下的学生t值。假设检验使用 t检验 将样本均值与参考值进行比较(单样本t检验)或比较两个样本均值(双样本和配对t检验)。F检验比较两个方差,以确定它们的差异是否具有统计显著性。

**方差分析(ANOVA)**将t检验扩展到同时比较三个或更多组均值。单因素方差分析将总方差分解为组间方差和组内方差。F比(组间方差除以组内方差)检验所有组均值相等的零假设。事后检验如Tukey HSD识别哪些特定配对存在显著差异。

异常值检测至关重要,因为单个异常值可能扭曲统计结论。Grubbs检验通过比较与均值的最大偏差与临界Z值,一次识别一个异常值。Dixon Q检验评估小数据集(n ≤ 30)中最小或最大值是否为离群值。疑似异常值绝不应随意丢弃——需要有记录的正当理由,且只有在确认物理或程序原因后才能移除。

校准曲线通过基于最小二乘准则的线性回归将仪器响应 y 与分析物浓度 x 关联:最小化 Σ(yᵢ − ŷᵢ)²。回归得出斜率 m、截距 b 和相关系数 。未知浓度通过在其回归线上插值响应来预测。**检测限(LOD)**是与空白可区分的最小浓度,通常计算为3.3·σ/S,其中σ是空白的标准差,S是斜率。**定量限(LOQ)**设定为10·σ/S,代表最低可靠的定量测量值。