b********1 发帖数: 291 | 1 【 以下文字转载自 Biology 讨论区 】
发信人: xiaoliu8964 (经济专家), 信区: Biology
标 题: 氯喹治疗武冠肺炎的双盲试验结果出来了
发信站: BBS 未名空间站 (Wed Apr 15 20:51:39 2020, 美东)
一个涉及150个新冠肺炎患者的随机双盲临床试验的结果出来了,与对照组相比,使用
羟基氯喹的患者的治疗结果和病毒量都没有差异,反而有严重副作用。
某些人吹捧的这一“神药”的疗效再次被现代化临床试验结果推翻,他们仍然只能拿“
神医”和个案说事,把对此的质疑都说成是西方人的阴谋。
&name=large
&name=large | b********1 发帖数: 291 | 2 一直对双盲实验感兴趣,但一直找不到这种公开报告。 几个问题想请教下
1. 上半部分类似生存曲线 显示150人一半对一半,75 +75; 下半部分表格显示150 =
70 +80. 请问这是为什么?
2. non_serious_event, 一栏我的p值是.006, 表格结果.004, 请问这是为什么。
prop.test(c(19,7), c(70,80), );
2-sample test for equality of proportions with continuity correction
data: c(19, 7) out of c(70, 80)
X-squared = 7.577308, df = 1, p-value = 0.00591076
alternative hypothesis: two.sided
95 percent confidence interval:
0.0493484331 0.3185087098
sample estimates:
prop 1 prop 2
0.271428571 0.087500000
3.总共才150人做实验,感觉size太少了, 3~ 5人的变动都会影响p值;我想为什么不
10个医生联合起来做实验 ,这样size会大得多, 结果更稳定?
4.这种报告为什么不考虑病人的年龄,性别,种族,遗传史,生命指标,新冠严重程度
? 我建议把10个,100个医生联合起来, 让这些病人尽量平均分布到测试组和对照组。
5.为啥不对'patients with positive sars-cov2 on rt-pcr(%)' 做chisq测试? 看来
18天以后 ,soc_hcq看起来好一点。如果我想做chisq测试, 这么写对不对 ?
x = c(14, 12)
prop.test(x, c(75,75)); | g******n 发帖数: 339 | 3 我今天闲着没事,给你回一下吧。 这些问题如果稍微有点clinical trial 经验的人都
可以回答。
1. 上半部分类似生存曲线 显示150人一半对一半,75 +75; 下半部分表格显示150 =
70 +80. 请问这是为什么?
一般来说randomized trial 的population 做efficacy analysis 和safety analysis
会有些不一样。ITT principle 一般适用于efficacy analysis.有时候少量病人会由于
某些原因会用错药,这时候做AE analysis 的时候会把最这些病人算到真实的用药组,
但是efficacy analysis 会算到randomized group. 这可能是导致这5个病人的差异的
原因。
2. non_serious_event, 一栏我的p值是.006, 表格结果.004, 请问这是为什么。
prop.test(c(19,7), c(70,80), );
2-sample test for equality of proportions with continuity correction
data: c(19, 7) out of c(70, 80)
X-squared = 7.577308, df = 1, p-value = 0.00591076
alternative hypothesis: two.sided
95 percent confidence interval:
0.0493484331 0.3185087098
sample estimates:
prop 1 prop 2
0.271428571 0.087500000
注意人家用的是fisher's exact test. 不是chisqured test.
3.总共才150人做实验,感觉size太少了, 3~ 5人的变动都会影响p值;我想为什么不
10个医生联合起来做实验 ,这样size会大得多, 结果更稳定?
如果这是工业界的实验,总要考虑sample size 和buguet 之间的平衡。而且在design
的时候一般是有power calculation的。sample size 在三期临床一般是足够的,至少
80% power.
4.这种报告为什么不考虑病人的年龄,性别,种族,遗传史,生命指标,新冠严重程度
? 我建议把10个,100个医生联合起来, 让这些病人尽量平均分布到测试组和对照组。
当然可以。但是randomization 的最大用处就是基于这样一个假设:当sample size 足
够大的时候,randomization 可以做到balance all prognostic factors. 所以一般来
讲业界的主要分析模型其实都没有包括所有的prognstic factor。 简单模型解释起来
更容易,也避免了一些统计上的manipunation。只有在exploratory analysis 的时候
才会把很多factors 放在一个model 里面,但这种分析的目的不是要证明药的有效性而
是signal detection.
5.为啥不对'patients with positive sars-cov2 on rt-pcr(%)' 做chisq测试? 看来
18天以后 ,soc_hcq看起来好一点。如果我想做chisq测试, 这么写对不对 ?
x = c(14, 12)
prop.test(x, c(75,75));
这种做法的问题是选择在那个时间点test会导致不一样的结果,除非有医学上的解释(
比如说1 year survival in K-M analysis),这种时间点的选择其实比较主观. 其实这
个问题是关于endpoint 的定义,除了传统的K-M analysis 或者log rank test, 现在
也有人用Restricted mean area under the curve 之类的。不管统计上如何定义,
clinical interpretation 一定要有意义。
【在 b********1 的大作中提到】 : 一直对双盲实验感兴趣,但一直找不到这种公开报告。 几个问题想请教下 : 1. 上半部分类似生存曲线 显示150人一半对一半,75 +75; 下半部分表格显示150 = : 70 +80. 请问这是为什么? : 2. non_serious_event, 一栏我的p值是.006, 表格结果.004, 请问这是为什么。 : prop.test(c(19,7), c(70,80), ); : 2-sample test for equality of proportions with continuity correction : data: c(19, 7) out of c(70, 80) : X-squared = 7.577308, df = 1, p-value = 0.00591076 : alternative hypothesis: two.sided : 95 percent confidence interval:
| b********1 发帖数: 291 | 4 多谢回答问题, 好人有好报。 很多年前差点进了这个行当, 不过阴差阳错,转行干
别的了。和当年的陈大师,dr.derbie, actuaries,纸老虎,哈根达斯都讨论过各种统
计问题, 现在这些人都别处发财了。 回到正题,我是从‘直觉’上琢磨这个事,当然
我的直觉也许是错的。 现在目标很明确,就是要看氯喹有没有效果, 什么叫‘有效果
’,? 直觉上看很简单, 无非是满足以下2个条件:
1. 测试组,控制组最后结果差距尽可能大,不仅百分比差距要大,绝对数字差距也要
大。 如果仅仅是两位数在加减乘除(21 -9, 21/75, 9/75),我觉得很容易
manipulation. 分母至少要有500,600,才能避免操纵数据。
2. 测试组,控制组构成要尽可能类似,种族啊,年龄,性别,健康史,新冠严重程度
,都是重要的因素。像这份报告,服用氯喹的21 out of 70 人出现不良反应, 对照组
7人 out of 80 出现不良反应。70人,80人的构成是怎么样的 ,没写在报告里。 如果
测试组比对照组多3 ~ 5 个老年人,病情严重的人,实验结论也许会不一样。 有人也
许说既然是‘随机分配’, 测试组,对照组构成应该近乎‘一摸一样’,不管怎么样
,作为一份科学实验报告, 实验完成之后应该把实验对象完整信息公布出来,而不是
让外人猜测。 | t***1 发帖数: 18 | | b********1 发帖数: 291 | 6 https://www.gilead.com/news-and-press/company-statements/gilead-sciences-
statement-on-data-from-remdesivir-study-in-patients-with-severe-covid-19-in-
china | s*******u 发帖数: 2249 | 7 对照组不是单纯的control,而是常规治疗组SOC。常规治疗+氯喹比常规治疗好不了多
少不奇怪。这个实验没回答是否氯喹有效的问题,因为回答这个问题要使用安慰剂,目
前这种实验不太道德。
奎宁为什么被推荐是因为极其便宜。如果设计一个单纯氯喹药组对比常规治疗等效性试
验,疗效差
不多但费用差很多,结果也是好的
【在 b********1 的大作中提到】 : https://www.gilead.com/news-and-press/company-statements/gilead-sciences- : statement-on-data-from-remdesivir-study-in-patients-with-severe-covid-19-in- : china
| b********1 发帖数: 291 | 8 【 以下文字转载自 Biology 讨论区 】
发信人: xiaoliu8964 (经济专家), 信区: Biology
标 题: 氯喹治疗武冠肺炎的双盲试验结果出来了
发信站: BBS 未名空间站 (Wed Apr 15 20:51:39 2020, 美东)
一个涉及150个新冠肺炎患者的随机双盲临床试验的结果出来了,与对照组相比,使用
羟基氯喹的患者的治疗结果和病毒量都没有差异,反而有严重副作用。
某些人吹捧的这一“神药”的疗效再次被现代化临床试验结果推翻,他们仍然只能拿“
神医”和个案说事,把对此的质疑都说成是西方人的阴谋。
&name=large
&name=large | b********1 发帖数: 291 | 9 一直对双盲实验感兴趣,但一直找不到这种公开报告。 几个问题想请教下
1. 上半部分类似生存曲线 显示150人一半对一半,75 +75; 下半部分表格显示150 =
70 +80. 请问这是为什么?
2. non_serious_event, 一栏我的p值是.006, 表格结果.004, 请问这是为什么。
prop.test(c(19,7), c(70,80), );
2-sample test for equality of proportions with continuity correction
data: c(19, 7) out of c(70, 80)
X-squared = 7.577308, df = 1, p-value = 0.00591076
alternative hypothesis: two.sided
95 percent confidence interval:
0.0493484331 0.3185087098
sample estimates:
prop 1 prop 2
0.271428571 0.087500000
3.总共才150人做实验,感觉size太少了, 3~ 5人的变动都会影响p值;我想为什么不
10个医生联合起来做实验 ,这样size会大得多, 结果更稳定?
4.这种报告为什么不考虑病人的年龄,性别,种族,遗传史,生命指标,新冠严重程度
? 我建议把10个,100个医生联合起来, 让这些病人尽量平均分布到测试组和对照组。
5.为啥不对'patients with positive sars-cov2 on rt-pcr(%)' 做chisq测试? 看来
18天以后 ,soc_hcq看起来好一点。如果我想做chisq测试, 这么写对不对 ?
x = c(14, 12)
prop.test(x, c(75,75)); | g******n 发帖数: 339 | 10 我今天闲着没事,给你回一下吧。 这些问题如果稍微有点clinical trial 经验的人都
可以回答。
1. 上半部分类似生存曲线 显示150人一半对一半,75 +75; 下半部分表格显示150 =
70 +80. 请问这是为什么?
一般来说randomized trial 的population 做efficacy analysis 和safety analysis
会有些不一样。ITT principle 一般适用于efficacy analysis.有时候少量病人会由于
某些原因会用错药,这时候做AE analysis 的时候会把最这些病人算到真实的用药组,
但是efficacy analysis 会算到randomized group. 这可能是导致这5个病人的差异的
原因。
2. non_serious_event, 一栏我的p值是.006, 表格结果.004, 请问这是为什么。
prop.test(c(19,7), c(70,80), );
2-sample test for equality of proportions with continuity correction
data: c(19, 7) out of c(70, 80)
X-squared = 7.577308, df = 1, p-value = 0.00591076
alternative hypothesis: two.sided
95 percent confidence interval:
0.0493484331 0.3185087098
sample estimates:
prop 1 prop 2
0.271428571 0.087500000
注意人家用的是fisher's exact test. 不是chisqured test.
3.总共才150人做实验,感觉size太少了, 3~ 5人的变动都会影响p值;我想为什么不
10个医生联合起来做实验 ,这样size会大得多, 结果更稳定?
如果这是工业界的实验,总要考虑sample size 和buguet 之间的平衡。而且在design
的时候一般是有power calculation的。sample size 在三期临床一般是足够的,至少
80% power.
4.这种报告为什么不考虑病人的年龄,性别,种族,遗传史,生命指标,新冠严重程度
? 我建议把10个,100个医生联合起来, 让这些病人尽量平均分布到测试组和对照组。
当然可以。但是randomization 的最大用处就是基于这样一个假设:当sample size 足
够大的时候,randomization 可以做到balance all prognostic factors. 所以一般来
讲业界的主要分析模型其实都没有包括所有的prognstic factor。 简单模型解释起来
更容易,也避免了一些统计上的manipunation。只有在exploratory analysis 的时候
才会把很多factors 放在一个model 里面,但这种分析的目的不是要证明药的有效性而
是signal detection.
5.为啥不对'patients with positive sars-cov2 on rt-pcr(%)' 做chisq测试? 看来
18天以后 ,soc_hcq看起来好一点。如果我想做chisq测试, 这么写对不对 ?
x = c(14, 12)
prop.test(x, c(75,75));
这种做法的问题是选择在那个时间点test会导致不一样的结果,除非有医学上的解释(
比如说1 year survival in K-M analysis),这种时间点的选择其实比较主观. 其实这
个问题是关于endpoint 的定义,除了传统的K-M analysis 或者log rank test, 现在
也有人用Restricted mean area under the curve 之类的。不管统计上如何定义,
clinical interpretation 一定要有意义。
【在 b********1 的大作中提到】 : 一直对双盲实验感兴趣,但一直找不到这种公开报告。 几个问题想请教下 : 1. 上半部分类似生存曲线 显示150人一半对一半,75 +75; 下半部分表格显示150 = : 70 +80. 请问这是为什么? : 2. non_serious_event, 一栏我的p值是.006, 表格结果.004, 请问这是为什么。 : prop.test(c(19,7), c(70,80), ); : 2-sample test for equality of proportions with continuity correction : data: c(19, 7) out of c(70, 80) : X-squared = 7.577308, df = 1, p-value = 0.00591076 : alternative hypothesis: two.sided : 95 percent confidence interval:
| | | b********1 发帖数: 291 | 11 多谢回答问题, 好人有好报。 很多年前差点进了这个行当, 不过阴差阳错,转行干
别的了。和当年的陈大师,dr.derbie, actuaries,纸老虎,哈根达斯都讨论过各种统
计问题, 现在这些人都别处发财了。 回到正题,我是从‘直觉’上琢磨这个事,当然
我的直觉也许是错的。 现在目标很明确,就是要看氯喹有没有效果, 什么叫‘有效果
’,? 直觉上看很简单, 无非是满足以下2个条件:
1. 测试组,控制组最后结果差距尽可能大,不仅百分比差距要大,绝对数字差距也要
大。 如果仅仅是两位数在加减乘除(21 -9, 21/75, 9/75),我觉得很容易
manipulation. 分母至少要有500,600,才能避免操纵数据。
2. 测试组,控制组构成要尽可能类似,种族啊,年龄,性别,健康史,新冠严重程度
,都是重要的因素。像这份报告,服用氯喹的21 out of 70 人出现不良反应, 对照组
7人 out of 80 出现不良反应。70人,80人的构成是怎么样的 ,没写在报告里。 如果
测试组比对照组多3 ~ 5 个老年人,病情严重的人,实验结论也许会不一样。 有人也
许说既然是‘随机分配’, 测试组,对照组构成应该近乎‘一摸一样’,不管怎么样
,作为一份科学实验报告, 实验完成之后应该把实验对象完整信息公布出来,而不是
让外人猜测。 | t***1 发帖数: 18 | | b********1 发帖数: 291 | 13 https://www.gilead.com/news-and-press/company-statements/gilead-sciences-
statement-on-data-from-remdesivir-study-in-patients-with-severe-covid-19-in-
china | s*******u 发帖数: 2249 | 14 对照组不是单纯的control,而是常规治疗组SOC。常规治疗+氯喹比常规治疗好不了多
少不奇怪。这个实验没回答是否氯喹有效的问题,因为回答这个问题要使用安慰剂,目
前这种实验不太道德。
奎宁为什么被推荐是因为极其便宜。如果设计一个单纯氯喹药组对比常规治疗等效性试
验,疗效差
不多但费用差很多,结果也是好的
【在 b********1 的大作中提到】 : https://www.gilead.com/news-and-press/company-statements/gilead-sciences- : statement-on-data-from-remdesivir-study-in-patients-with-severe-covid-19-in- : china
| B******y 发帖数: 9065 | 15
Sigh。看到这个Summary of AE表里面每个AE term后面都有个P-value,就基本上没有
兴趣看下去了,move on
【在 b********1 的大作中提到】 : https://www.gilead.com/news-and-press/company-statements/gilead-sciences- : statement-on-data-from-remdesivir-study-in-patients-with-severe-covid-19-in- : china
| r***k 发帖数: 13586 | 16 这个试验是垃圾试验吧,150名患者里面只有1名PD这个明显不符合正常比例,只有1名
患者有上呼吸道发炎这更是扯蛋。个人认为这个结果如果是真的,那么入组病人应该全
是无症状患者,对这些人测氯喹的用处纯属无聊。 | b********1 发帖数: 291 | 17 此话怎讲? 为啥有p值就看不下去??
【在 B******y 的大作中提到】 : : Sigh。看到这个Summary of AE表里面每个AE term后面都有个P-value,就基本上没有 : 兴趣看下去了,move on
| B******y 发帖数: 9065 | 18
Sigh。看到这个Summary of AE表里面每个AE term后面都有个P-value,就基本上没有
兴趣看下去了,move on
【在 b********1 的大作中提到】 : 此话怎讲? 为啥有p值就看不下去??
| r***k 发帖数: 13586 | 19 这个试验是垃圾试验吧,150名患者里面只有1名PD这个明显不符合正常比例,只有1名
患者有上呼吸道发炎这更是扯蛋。个人认为这个结果如果是真的,那么入组病人应该全
是无症状患者,对这些人测氯喹的用处纯属无聊。 | b********1 发帖数: 291 | 20 此话怎讲? 为啥有p值就看不下去??
【在 B******y 的大作中提到】 : : Sigh。看到这个Summary of AE表里面每个AE term后面都有个P-value,就基本上没有 : 兴趣看下去了,move on
|
|