记者|肖恩
新冠肺炎的《全球数字统计》让世界知道了除了一所知名大学之外的一个鲜为人知的统计网站。
根据美国统计网站worldometer的实时数据,截至北京时间5月20日22时32分,全球新冠肺炎确诊病例达到5018667例,已经突破500万大关。然而,根据同时期美国约翰·霍普金斯大学的统计,这个数字是4929455例,与前者相差近9万例。
图片:worldometer
图片:JHU。西班牙的情况更是扑朔迷离。根据JHU的数据,截至5月20日21时,该国确诊病例为232037例,居世界第五位,与该国卫生部的数字一致。但同时worldometer的数据为278803,在各国中排名第三,仅次于美国和俄罗斯。
每个网站的统计数据比官方每天发布一次的数据略高是正常的,因为他们是实时更新的,来源也不一样。然而,在西班牙的数据中,worldometer比官方和JHU的数据高出46766例,而西班牙前一天只有615例新增病例,这不足以填补错误。
4月中旬,西班牙卫生部增加了血清检测方法,一些地区将未确诊病例纳入死亡人数统计,导致混乱。随后,中央下发新文件,要求各大自治区按统一标准报送日常统计数据,包括死亡病例统计标准和有症状与无症状感染者分类。
目前,西班牙卫生部报告的数据仅包括聚合酶链反应确诊的病例。在西班牙,只有3万个家庭的5万人接受血清抗体检测,35408人呈阳性。
Worldometer的500万个案例无疑包括了西班牙的近5万个“水”。这部分是通过血清检测确诊的人数吗?这个鲜为人知的网站是什么来历?
数据来源是一个谜
JHU最早因实时发布疫情数据而成为“网络名人”,worldometer是其数据来源之一。随着疫情持续发酵,worldometer从幕后走向了台前,甚至取得了英国、泰国、巴基斯坦、越南、斯里兰卡等国政府的信任。
英国政府在例行新闻发布会上频繁引用其数据,但自4月15日起,数据来源改为JHU,理由是JHU数据来源多为官方数据,更权威可靠。
根据AXIOS新闻网援引的统计数据,仅在4月份,worldometer的浏览量就超过了10亿次,高于职场社交网络linkedIn,与2019年4月相比增长了36928%。
然而,随着知名度越来越高,worldometer的数据准确性不断受到质疑。
JHU的统计数据主要是国家政府的官方数据,其他辅助来源包括地方政府、媒体和统计网站。比如中文部分来自医疗社交网络丁香园的数据库。JHU拒绝透露它使用的worldometer的内容。
根据医学杂志《柳叶刀》2月份发表的一篇文章,JHU在1月份疫情开始时手动收集和更新了数据。在病例数量开始爆发后,他们开始采用半自动的数据更新流程。有些数据是从政府部门和统计网站上自动抓取的,但会被标记出来,以便随时检查;超过设定阈值的数据将在人工审核后发布。
Worldometer的数据来源比较复杂。任何人都可以通过其官网举报,只需提供数字来源链接和相应的验证链接,无需提供举报人身份。据该网站称,一个由分析师和研究人员组成的团队将核实数据,并以类似于维基百科的方式运作。
worldometer的数据上报页面JHU疫情数据统计也有错误。4月13日,他们把全球确诊人数从200万下调到190万,因为美国佛罗里达州的统计出了一个乌龙,10万例被高估了。而且worldometer似乎从来不会纠正数据。
维基百科的编辑戈麦斯说,worldometer没有固定的标准,总是取最高值。数字来源和可靠性不是他们的首要考虑因素。几位维基百科的编辑已经表明worldometer不会被用作流行病数据的来源。
美国耶鲁大学流行病学教授皮策表示,worldometer的大部分数据来自政府数据,看似可信,但也存在误差和矛盾。特别是现有病例数的问题,是相当大的,因为网站的治愈数不是实时更新的,然后及时修改现有病例数。她还注意到,4月24日,西班牙worldometer的治愈率是18000,但政府当时报告的只有3105。
西班牙首相府发言人表示,worldometer同时收录了西班牙PCR检测和血清抗体检测两项结果,并公布了叠加值。鉴于并非所有国家都会报告抗体检测数据,这种计算方法本身就不科学,也导致全球确诊人数“提前”超过500万。
神秘的“团队”
据多家美国媒体报道,worldometer于2004年由刚移民纽约的俄罗斯程序员阿里梅托夫(Alimetov)创立。因为经营困难,不到两年后阿里梅托夫以2000美元的价格卖给了一个叫达里奥的人。
随后,网站多次易手,数据内容越来越丰富。2011年,worldometer被美国图书馆协会评选为最佳免费参考网站之一。
在这次疫情爆发之前,worldometer提供了各领域的各种统计数据,从全球人口和新生儿,每年的汽车产量,到驻伊美军的死亡人数,而且是用34种语言说的。每一项数据称为一个“计数器”,其他网站可以购买使用权,将“计数器”复制到自己的网站上。
如果每年购买一个许可证,worldometer的“计数器”每月成本为35美元。如果是单次使用,一个计数器的价格是210美元,期限是90天。客户主要是企业和各类机构。
根据worldmeter网站的自我介绍,他们的研究团队从最可靠的来源获取数据,并保持跟踪。每个“计数器”都配备了先进的算法,从中央服务器的算法中下载相关数据,并在前端显示当前估值,实时更新。
如今,该网站的所有者是一家名为Dadax的美国公司。据美国有线电视新闻网(CNN)报道,该公司有20多个网站,其中几个是实时统计网站,还有一些已经停止运营。
Worldometer声称由一个“由开发人员、研究人员和志愿者组成的国际团队”运营,但CNN在查阅公开数据后指出,没有证据表明该公司组建了这样一个团队,也不确定是否有固定工作人员审核数据准确性。从去年10月份开始,该公司就没有发布过招聘信息,但其官网上有一则招聘开发志愿者的通知,目前仍然有效。
根据官网信息,worldometer专门成立了多语种团队,持续监控各国记者会直播等数据来源,实时更新疫情数据。与维基百科不同,worldometer的运营团队是匿名的,网站上没有互动板块。
Worldometer神秘的团队和运作模式,让本已复杂的疫情更加扑朔迷离。
牛津大学数据统计小组Our World in Data的创始人罗斯抱怨说,读者总是质疑他们的数据为什么与worldometer不同,但他们自己检查后发现,这些数据没有确切的来源或错误。