当前位置: 首页 > 科技 > 人工智能 > 不但瞎编,还数据造假?哈佛就这还世界第一?_腾讯新闻

不但瞎编,还数据造假?哈佛就这还世界第一?_腾讯新闻

天乐
2020-07-15 22:52:34 第一视角

尚恩教育--一站式解决你的英语考试问题!

大家都还记得美国哈佛大学一团队用一篇论文称他们通过分析后认为武汉在2019年8月份的时候就开始了新冠疫情。(当时我们尚恩留学部的学生们看了后,冲哈佛的心都没了...)而他们的文章在逻辑分析上就是混乱的,这已经被众多的学者以及媒体批判过了,最终哈佛大学也把这篇文章撤稿。当时被爆造假后,哈佛这多年以来在中国人民心里的地位也几乎跌入谷底。在最近几天,这篇文章又被发现,它不但逻辑不通,居然连他们得来的数据都是造假的。

我们来看看文章内容

哈佛大学一研究小组上个月发表的研究报告说道,通过对武汉医院停车场的卫星图像以及使用关键词“腹泻”的互联网(百度数据...)搜索结果的分析,去年秋天之前,疫情就已经在武汉蔓延,所以武汉就是疫情爆发的源头。这项研究也被全球媒体广泛的进行了报道。其中该哈佛大学研究组分析了百度的搜索数据,发现8月份百度上搜索“腹泻”的数目比往年高很多。

通过这几点,哈佛研究团队就认为8月份新冠就已经在武汉流行。用一个图表,所有人都能使用的“百度指数”功能在百度上搜索出来的关键词来作为学术论文的研究“核心证据”,这就是哈佛的研究团队?(内心OS:我上我也行)同时,还有细心的网友发现,这个所谓的“核心证据”更是缺乏事实的支持。哈佛大学医学院论文主张在2019年9月开始出现对于咳嗽和腹泻这两个关键词的检索迅速增加。

然而事实并不是如此,腹泻两个字在百度搜索上实际并没有增加,搜索唯一增加的“腹泻的症状”这几个字。这样的研究方式也未免太过断章取义了吧。(以后要是有人嘲笑我说我的文章数据用的百度指数,我就告诉他们,哈佛都用,瞧不起哈佛?!!)这篇论文虽然仅仅是看似可笑,但是这样不负责任的文章并造成了极其严重的负面影响,如何彻底驳斥哈佛大学的这篇论文成为了众多中国研究人员的头号目标。

数据造假

1. 样本数据过少,质量低,不能反映真实情况

这篇打假文章的第一要点,指出论文作者收集到的数据数量少,并且也没有什么参考价值。“打假论文”指出,哈佛大学发表的论文研究计算了武汉市6家医院停车场的车辆数量,在2018年1月至2020年5月的29个月里,哈佛大学的研究只收集到了140个与车辆数量相关的数据点。这意味着每家医院平均每个月只有不到1个数据点,其中又有30个数据点集中在最后两个月。而6家医院之一的“湖北省妇幼保健院”共占据了24个数据点,但根据报道该医疗机构并没有针对成人肺部问题的科室。(妇幼保健和肺炎有什么关系???反正小编我看着确实是有亿点点懵)

在哈佛的这篇文章发表后,华人学者陈浩联系了著名打假人、斯坦福大学的前研究员Elisabeth Bik和德国分子细胞生物学家Schneider Leonid,在获得两人的支持后,7月3日,Leonid在推文中转发了评论文章的手稿,并指出前文含有的不当之处,并@了哈佛前文作者。

2. 哈佛大学的研究使用了一个所谓LOESS的方法

该方法从分散的车辆计数数据中得到一条光滑的曲线,并观察到,结果曲线在去年8月有所增加。但是,根据最新数据分析,哈佛研究团队在当初似乎有意调整了这些参数,使曲线与他们的主张契合并且一致。

“打假论文”的作者们直接甩出研究过程,称:如果改变span参数,那么平滑的曲线将会变得非常不同。

如图a所示,哈佛论文中“span=40%”,span越大曲线越平滑,同时也会丢失更多的信息。 作者们将span=30%赋值得到的数据图是图c,2019年就出现了两个新的高峰。同样的,要是将span=80%(图d),那么基本上就没有什么峰值出现。选择span=40%,抹去了前面的几个高峰值,而正好只保留了2019年最后的一个高峰。很明显的,哈佛论文的作者选择了符合自己论述的span=40%来作为研究中的数据。这一波分析过程的公开,坐实了哈佛大学在论文研究过程中为了得到想要的数据支撑自己的结论而可以更改研究数据的事实。

实际上,让我们来通过一张图理解一下上文

同一件事,选取什么样的角度,什么样的数据,结果天差地别。

哈佛大学这篇论文的研究手段与此大同小异,同样是故意选择了有利于自己论点的“角度”(数据),从而得到自己理想的研究结果。

如果说哈佛医学院之前用“百度搜索引擎”的关键字作为该论文研究的重要数据是“蠢”,那这次研究人员最新发现的哈佛论文涉嫌“数据造假”,就是坏到了极点。哈佛大学医学院的这篇“论文”漏洞百出,说实话这篇论文是经不起推敲的,连同行评审推广(Peer Review)都没有的论文,大概率学术界也真的只把它当作一个笑话来看。这么简单的道理,美国学术界的大能们会不知道吗?

但俗话说得好“你永远叫不醒一个装睡的人”——

就因为这篇牛头不对马嘴的论文由著名的哈佛大学发表,并且指责中国武汉在八月初就有新冠疫情发生,于是在发表之初,美媒就开始大做文章,争相报道,最后形成了迅速传播。总而言之,这篇不实论文在造成的恶劣影响力不言而喻。

所幸的是,和我们上文所说,中国的研究人员的这篇批评论文得到了学术界“打假专家”的支持,并且进入了哈佛官方学术平台DASH。而那篇“百度数据”文章也已经从同行评议的学术期刊中撤稿,状态也便成为了为作者自有。

拥有这先进设备以及各国优秀人才的西方世界,真的希望他们的学术界少一分政治斗争,多一分纯粹吧。

更多一手资讯请关注我们的微信公众号“尚恩留学”,我们会在第一时间给您推送专业、即时的信息哦!

提示:支持键盘“← →”键翻页
为你推荐
加载更多
意见反馈
返回顶部