现在每个人都是统计学家。以下是纸上谈兵的COVID专家们的错误之处
如果我们不以分析统计数据为生,就很容易被社交媒体上关于COVID-19统计数据的错误信息所误导,尤其是在我们没有正确的背景下。
例如,我们可能会精心挑选支持我们观点的统计数据,而忽略表明我们错误的统计数据。我们还需要正确解释这些统计数据。
我们很容易分享这种错误的信息。这些统计数据中有许多是相互关联的,因此误解可能会迅速增加。
以下是我们如何避免五个常见错误,并通过正确的统计数据给朋友和家人留下深刻印象的方法。
1.可怕的是感染率,而不是死亡率
社交媒体帖子将COVID-19与其他死亡原因进行比较,例如流感,暗示COVID-19不是真的那么致命.
但这些帖子忽略了COVID-19的传染性。为此,我们需要看一下感染死亡率(IFR)数量即COVID-19死亡人数除以所有感染者(我们目前只能估计这个数字,另见下文第3点)。
虽然还没有定论,但COVID-19有一个更高的仪表比流感还厉害文章暗示COVID-19的低IFR肯定是低估了它。他们还忽略了另外两点。
首先,如果我们比较典型流感IFR的0.1%与最乐观的COVID-19估计0.25%,那么COVID-19的致死率仍然是流感的两倍多。
其次,更重要的是,我们需要查看每种病毒的基本复制数(R₀)。这是一个感染者估计会感染的额外人数。
流感是R₀大约是1.3.尽管对COVID-19的估计有所不同,但它的R 0大约在a中位数为2.8.由于感染人数呈指数增长(见下文),从1.3跃升至2.8意味着COVID-19的传染性远大于流感。
当你把所有这些统计数据结合起来时,你就可以看到我们采取公共卫生措施“限制传播”背后的动机。COVID-19不仅如此致命,而且是致命的而且高度传染性。
2.指数级增长和误导性的图表
一个简单的图表可以描绘出一段时间内新冠病例的数量。但由于新病例的报告可能不稳定,统计学家更感兴趣的是病例总数随时间的增长速度。图表上向上的斜率越陡,我们就越应该担心。
对于COVID-19,统计学家希望跟踪指数级增长在案件。简而言之,无节制的COVID病例可能会导致更多病例持续增长。这给了我们一个开始时缓慢跟踪的图形,但随后随着时间急剧向上弯曲。这是我们想要压平的曲线,如下图所示。
然而,社交媒体帖子将COVID-19的数据与其他死亡原因的数据进行常规比较,显示:
甚至当研究人员谈到指数级增长尽管如此,他们仍然会误导。
一位以色列教授的广泛共享分析称,COVID-19的指数增长“在八周后消退”。很明显,他错了。但是为什么呢?
他的模型假设COVID-19病例在几天内呈指数级增长,而不是在一系列传播中增长,每次传播可能需要几天时间。这使得他只绘制了疫情爆发初期的不稳定增长。
更好的可视化可以截断那些不稳定的第一个案例,例如从第100个案例开始。或者他们使用估计病例数量所需的天数增加一倍(约六至七日)。
3.并非所有感染都是病例
还有关于COVID-19感染和病例的混淆。在流行病学术语中,“病例”是指被诊断为COVID-19的人,主要是通过检测结果呈阳性。
但是感染比病例要多得多。有些感染没有表现出症状,有些症状非常轻微,人们认为这只是感冒,并不是每个需要检测的人都能得到检测不会感染所有的感染.
感染“导致”病例,检测发现病例。美国总统唐纳德·特朗普接近真相当他说由于检测率高,美国的病例数量很高。但他和其他人还是完全错了。
更多的测试不会结果在更多的情况下,它允许更准确的估计真正的病例数。
从流行病学角度来看,最好的策略不是减少检测,而是尽可能广泛地检测,尽量减少病例与总体感染之间的差异。
4.我们不能将死亡病例与同一日期的病例进行比较
估计而是感染和死亡可能多达一个月.以及在恢复时间甚至更伟大。有些人病得很重,需要很长时间才能恢复,有些人没有任何症状。
因此,某一特定日期记录的死亡人数反映了数周前记录的病例死亡人数,当时的病例数可能是不到一半当前病例数。
快速的病例加倍时间和漫长的恢复时间也造成了大量的计数之间的差异活跃和康复病例.我们只有在回顾时才能知道真实的数字。
5.是的,数据是混乱的,不完整的,可能会改变
但很少有人意识到庞大的,混乱的而且复杂的我们的任务是追踪这种疾病的统计数据。
国家甚至州对病例和死亡人数的统计可能不同。它还需要时间为了收集数据,意味着要进行回顾性调整。
我们只有在回顾时才能知道这场大流行的真实数字。同样,早期的模型之所以是错误的,并不一定是因为建模者有欺骗性,而是因为他们没有足够的数据作为依据。
欢迎来到数据管理、数据清理和数据建模的世界,许多纸上谈兵的统计学家并不总是喜欢这些。直到现在。
进一步探索