最近,在美国各大新闻媒体上报道的一则消息似乎令人振奋:研究表明征收酒精税可以降低因酒驾而造成的死亡。这些新闻媒体的消息来源就是最近由Alexander Wagenaar发表的一个研究结果。该研究采用美国伊利诺伊州2001至2011年每月交通死亡数据来获得线性回归线,声称从2009年9月该州开始征收仅半美分的酒精特征税后,交通死亡数下降了26%。作者声称虽然2008年的金融危机也许可以部分解释交通死亡数的下降,但即便如此,交通死亡数还是因酒精特征税下降了至少15%。
每年大约有3万5千多美国人死于交通事故(近几年这个数据下降到了3万左右),在所有交通死亡中,大约35-37%和酒驾有关。如果半美分的酒精特征税真的可以使酒驾死亡数下降26%,那就可以挽救数千生命。但是事实真是如此吗?下面我们就来剖析一下该研究。
我们先来总体地看一下美国伊利诺伊州1999年9月至2013年12月每个月交通死亡的数据(蓝色菱形),以及依据此数据获得的线性回归线(红线)。从该图似乎看不出2009年9月执行特征税后交通死亡数有明显变化。
而实际上 Wagenaar仅使用了2001至2011年的数据(如下图)。蓝色菱形表示2009年9月特征税执行之前每月交通死亡数,红色方形表示的是之后的数据。红线和蓝线是依据这两组数据分别获得的线性回归线。红线在最后2009年9月的交通死亡数是33,蓝线在同样的时间点的交通死亡数是28,Wagenaar因此得出结论交通死亡数大约下降了15%。
如果真如Wagenaar所称交通死亡率下降的15%是由于征收了酒精特征税,那么如果把数据延长到2013来分析,应该得到和之前2001至2011年相似的结果,但实际却不尽然。和之前的分析方法类似,数据被分为2009年9月之前和之后。结果如下图显示,2009年9月至2013年,交通死亡数呈现的是增长趋势。
这是为什么?可能原因是,虽然和酒精相关的死亡数确实是在下降,但是其他交通死亡数量也在下降。下图显示了因酒驾死亡占所有交通死亡数的比例,该比例从2001年略高于40%下降到了2014年略低于40%。这表明酒驾死亡数的下降很可能是因为交通死亡数整体在下降,而并不一定是由于征收酒精税使酒驾死亡数下降。
如果进一步关注2009年9月酒精特征税执行后的线性回归图,我们发现了更有趣的现象。如下图显示酒驾死亡数在交通死亡数的比例从2009年9月的38%增长到2013年的40%。但是我们恐怕不能因此简单地下结论说酒精特征税增加了酒驾死亡数在交通死亡数中的比例。同理,Wagenaar也不能说明是征收酒精税减少了交通死亡数,而非其他因素。
线性回归或者逻辑回归只能表明相关性,并不能说明因果关系。虽然这是老生常谈,但是对于帮助我们理解一个研究结果却至关重要。以上这个例子表明,我们没有确凿的证据表明交通死亡数的下降是由酒精特征税引起的,很多因素都可能导致这个趋势。回归的概念是假设一个变量之间的相关性(例如,每个月的交通死亡数),然后根据这些数据来预测未知数据(例如,其他月份的交通死亡数)。数据之间的相关性是一个假设,并不是结论。很多其他因素,例如养成更好的饮酒和驾驶习惯,降低酒精消耗量,安全知识教育,公路或汽车安全性提高等等都可能降低交通死亡数,也许酒精税是这些因素之一。Wagenaar的研究只能表明酒精税和交通死亡数相关,而不一定是主导因素。酒后驾驶是一个很严重的问题,如果仅仅依靠征收少额特征税就可以挽救生命的话确实很好,但是至少在这个例子中,统计分析结果并不可靠。
编者按:
在数据分析中,很多人常常把两个事物之间的相关性盲目上升到因果关系。举一个简单的例子,有数据表明当冰淇淋销售量增加时,因溺水而死亡的概率也同时剧增。那么我们能够简单地下结论说是吃冰淇淋导致溺水吗?这显然过于盲目且有悖常理。冰淇淋和溺水死亡率之间确实有相关性,但是真正影响这两个事件的因素可能是季节。炎热的夏天冰淇淋销售量肯定比冷天增多,同时这也是人们热衷水上活动的季节。溺水死亡率增加可能仅是因为水上活动量增加了,而不是由吃冰淇淋引起的。
我们在日常生活中常常看到各种吸引眼球的新闻标题,而且有时候结论可能还不一致,例如有的报道称饮用咖啡可以降低患心脏病或糖尿病等疾病的概率,又有报道说咖啡会导致早亡等等。事实上很多此类研究都没有充分考虑事物之间的各种影响因素,且盲目地把事物之间的相关性理解为因果关系。
回归分析是非常常用且有效的数据分析方法,但是如果混淆了事物之间的相关性和因果关系,忽略了影响事物之间关系的其他因素,那么可能会严重误导我们的分析结果。
翻译:DW
校对:Jude
翻译并编辑自 Can a Half-Cent Tax on Drink Save Lives, by Statorg
原文链接:http://www.stats.org/can-a-half-cent-tax-on-drink-save-lives/