临床试验中的生物统计学

**生物统计学为设计临床试验、分析其结果以及得出有关治疗效果的有效结论提供了数学框架。**如果没有严格的统计方法，临床数据就无法可靠地区分真正的治疗效果与随机变异或系统偏差。从最早的规划阶段到最终的监管提交，统计学家都是临床开发团队不可或缺的成员。

假设检验

临床试验分析的基础是假设检验，其中原假设（H0）表明治疗组和对照组之间没有差异，备择假设（H1）表明存在差异。如果零假设为真，统计检验计算观察到所获得结果或更极端结果的概率。该概率就是 p 值。 p 值低于预先指定的显着性水平（通常为 0.05）会导致拒绝原假设并支持替代方案。重要的是要理解 p 值并不是原假设为真的概率；而是原假设成立的概率。相反，它衡量数据与零假设的兼容性。

P 值和置信区间

虽然 p 值表明治疗效果是否具有统计显着性，但置信区间提供有关效果大小和精度的信息。 95% 置信区间定义了一个值范围，在该范围内，真实的治疗效果具有 95% 的置信度。置信区间比单独的 p 值提供更多信息，因为它们传达了效应大小的方向和合理范围。例如，风险比为 0.75，95% 置信区间为 0.62 到 0.91，不仅表明该效应具有统计显着性（区间不超过 1.0），而且表明真正的收益可能小至 9%，大至 38%。

优越性、非劣效性、等效性

临床试验的目的决定了统计方法。 优效性试验旨在证明实验治疗优于比较治疗。 非劣效性试验旨在表明实验治疗并不比对照组差超过预先指定的差值。当实验药物在安全性、便利性或成本方面具有优势，足以证明疗效略有下降时，就可以使用非劣效性设计。 等效性试验旨在证明两种治疗方法在特定范围内具有治疗等效性。设计的选择会影响样本量、分析方法和解释，并且必须在揭盲前在统计分析计划中指定。

意向治疗与按方案分析

意向治疗 (ITT) 原则要求根据指定的治疗组对所有随机参与者进行分析，无论他们是否接受治疗、完成研究或偏离方案。 ITT 分析保留了随机化的优点，并在发生不依从和退出的现实环境中提供治疗效果的公正估计。 按方案 (PP) 分析仅包括完成研究且没有重大方案偏差的参与者。 PP 分析可能会高估治疗效果，因为它排除了不依从的参与者。大多数监管机构要求以 ITT 作为主要分析，以 PP 作为敏感性分析，以评估结果的稳健性。

亚组分析

亚组分析检查治疗效果是否因患者特征（例如年龄、性别、疾病严重程度或生物标志物状态）而异。虽然亚组分析可以产生有关不同治疗效果的假设，但由于每个亚组内的多次测试和样本量减少，它们很容易出现假阳性结果。交互作用的统计检验评估亚组之间的治疗效果是否存在显着差异。亚组研究结果应谨慎解释，并被视为探索性的，除非它们是预先指定的、适当的动力并在多项研究中得到证实。监管机构可能需要亚组分析来支持特定患者群体的标签声明。

临时分析和停止规则

中期分析是在最终分析之前对积累的试验数据进行预先计划的检查。它们有两个目的：提前停止以达到压倒性的功效或无效性，以及自适应样本量重新估计。累积数据的重复测试会增加 I 类错误率，因此必须应用停止边界来控制整体显着性水平。常见的方法包括奥布莱恩-弗莱明和海比特-皮托边界，这需要非常有力的证据证明有利或有害，才能提前停止试验。 数据安全监测委员会 (DSMB) 独立于申办者审查中期结果，并根据预先指定的规则建议继续、修改或终止试验。

自适应试验设计

适应性设计允许根据中期结果对试验进行预先指定的修改，而不会影响统计有效性。常见的调整包括样本量重新估计、剂量选择、治疗组下降和患者群体丰富。适应性设计可以通过将资源集中在最有希望的治疗方案和患者亚组上来提高效率。然而，它们需要仔细的规划、更复杂的统计方法以及用于实时数据收集和分析的强大基础设施。监管机构对适应性设计的接受程度正在不断提高，但在进行任何非盲数据审查之前，必须在方案和统计分析计划中充分描述适应性设计。

结论

生物统计学不仅是分析试验结果的工具，而且是试验设计和解释的基本组成部分。正确应用统计方法可确保临床试验产生可靠、可重复和可解释的证据。在设计阶段投资于严格统计规划的申办者更有可能产生令人信服的数据，支持监管部门的批准并为临床实践提供信息。