本期课程:为什么要预设分组,post-hoc 分析又是啥
通常,临床研究的统计分析方案需要在设计阶段就制定完成,为了保证研究结论科学、真实、可靠,在统计分析方案中往往预先指定研究的分组情况,提出研究假设,并基于此进行样本量的估计。简单理解,只有基于假设检验和足够样本量所分析得到的 P 值才是「真 P 值」。
而 Post-hoc 分析,即事后分析,是指在数据收集完毕后,根据数据本身特点额外设定分组,提出研究假设,并进行统计分析。
比如,某临床研究发现,试验药物相比对照组能显著延长患者的生存时间。而研究者是个「星座控」,突发奇想把试验人群又基于星座进行了分组与分析。结果发现:射手座的患者应用试验药物显著延长生存时间(P<0.05);而处女座的患者应用试验药物与对照差异不显著(P>0.05)。于是得出结论:射手座患者比处女座患者应用该药的生存获益更大。
上述情况,显然不科学。因为分组情况非预设,且研究假设是在观察完数据的特征后提出,所以分析也就不具有统计学意义。可以简单认为此时得到的 P 值是「假 P 值」,无论是否小于 0.05,都不代表是否有「统计学差异」,只能视为体现某种趋势,可为后续预设研究设计提供思路。
事实上,事后分析常被称为数据疏浚(data dredging)或数据捕鱼(data fishing),其动机往往是为了得到阳性的结果。因此,事后分析结果一般不被各国药品监管部分接受作为药物有效性的证据。
更多内容推荐: