别让数据骗了你

别让数据骗了你

Published on Nov 18
4分钟
蝌蚪五线谱-科学频道
0:00
0:00
<p>你相信吗?夏天吃冰淇淋会导致鲨鱼咬人。这可不是玩笑,有数据显示,冰淇淋销量越高,鲨鱼袭击事件就越多。但你真的会因此夏天不吃冰淇淋吗?</p><p>当然不会!因为这就是一个典型的数据陷阱——把相关性当成了因果性。今天我们就来聊聊,如何在信息爆炸的时代,练就一双火眼金睛,看穿那些隐藏在数据背后的真相。</p><p>先从刚才那个冰淇淋和鲨鱼的例子说起。为什么这两个八竿子打不着的东西会扯上关系?其实答案很简单:夏天到了,天气热,人们爱吃冰淇淋,也爱去海边游泳。人多了,鲨鱼袭击的概率自然就高了。这里的"天气热"就是那个隐藏的干扰变量,它同时影响了冰淇淋销量和游泳人数,造成了冰淇淋和鲨鱼袭击之间的虚假关联。</p><p>那么,这些数据陷阱通常是怎么迷惑我们的呢?主要有三种手段:</p><p>第一种,就是我们刚才说的"忽略第三变量"。就像冰淇淋和鲨鱼的例子,两个看似相关的事物,其实是被第三个因素同时影响着。</p><p>第二种,是"因果倒置"。比如说,有人发现"经常跑步的人膝盖都不太好",于是得出结论"跑步伤膝盖"。但有没有可能是因为膝盖本来就不太好的人,才更需要通过跑步来锻炼呢?</p><p>第三种,就是纯粹的"巧合"。有个经典的例子,美国的谋杀率和奶酪消费量居然高度相关。难道吃奶酪会让人变得暴力?显然不是,这只是数据的偶然巧合罢了。</p><p>这些陷阱之所以能得逞,就是利用了我们大脑喜欢找规律、喜欢简单因果关系的天性。但真实世界往往比我们想象的复杂得多。</p><p>既然数据陷阱这么多,我们该怎么防范呢?其实科学家们早就总结出了一套方法,我们普通人也能学会:</p><p>第一步,控制变量法。这是科学研究的基本功。就像养花一样,如果你想知道某种肥料好不好用,就得保证两盆花在光照、浇水、土壤等其他条件都一样的情况下,只比较施肥和不施肥的区别。</p><p>第二步,随机对照试验。这是验证因果关系的黄金标准。比如测试一种新药是否有效,就要随机把病人分成两组,一组吃药,一组吃安慰剂,然后比较效果。这样可以最大程度排除干扰因素。</p><p>第三步,长期追踪。很多因果关系不是短期内能看出来的。比如吸烟和肺癌的关系,就是经过了几十年的追踪研究才最终确认的。</p><p>记住这三点,下次再看到"某某研究表明"的时候,就可以多问一句:这个结论是怎么做出来的?有没有控制其他变量?样本够不...
别让数据骗了你 - 蝌蚪五线谱-科学频道 - 播刻岛