2020年初,Steam平台上的游戏《瘟疫公司》玩家数量激增,这一现象意外成为新冠疫情暴发的早期预警信号,该游戏模拟病毒传播机制,玩家需通过策略让病原体感染全球,随着现实疫情发展,游戏在1月底中国疫情暴发时销量突破50万份,2月全球疫情扩散期间更登上Steam畅销榜首,数据科学家发现,游戏热度曲线与多国疫情时间线高度吻合,意大利等国的玩家搜索量峰值甚至早于官方确诊病例激增,虽然游戏开发商明确声明其并非预测工具,但这一案例揭示了游戏数据作为社会情绪"温度计"的潜力——大众通过虚拟疫情演练,无意识中反映出对现实风险的集体预判,这种"游戏行为学"为公共卫生监测提供了新思路,表明非传统数据源可能捕捉到官方统计前的社会动态变化。
Steam与疫情数据的关联
Steam用户行为的变化
Steam是全球更大的数字游戏发行平台之一,拥有数亿活跃玩家,在2020年初,随着新冠疫情的爆发,许多国家开始实施封锁和社交隔离政策,导致大量人群居家时间增加,这一变化迅速反映在Steam的玩家在线数据上:
- 在线人数激增:2020年2月至3月,Steam的并发在线用户数创下历史新高,2020年3月15日,Steam同时在线玩家突破2000万,远超以往记录。
- 游戏时间延长:玩家平均游戏时长显著增加,尤其是在疫情严重的国家和地区,如中国、意大利和美国。
这些数据表明,当人们被迫减少外出活动时,线上娱乐(尤其是游戏)成为主要的消遣方式,Steam的活跃用户数据可以间接反映社会活动的变化,进而推测疫情的影响范围。
地区性数据与疫情传播的关联
更令人惊讶的是,Steam的玩家在线数据在某些地区的变化甚至早于官方报告的病例增长。
- 意大利的早期信号:2020年2月底,意大利成为欧洲疫情的重灾区,但早在2月中旬,Steam的意大利玩家在线时间就开始显著上升,这可能反映了当地居民因担忧疫情而减少外出。
- 美国的数据波动:美国各州的封锁政策实施时间不同,而Steam的数据显示,在 正式宣布封锁前,某些州的玩家在线时间已明显增加,这与后来的病例激增趋势高度吻合。
这些现象表明,游戏平台的数据可能比传统统计 更快地捕捉到社会行为的变化,从而为疫情预测提供早期信号。
大数据在疫情预测中的潜力
非传统数据源的独特优势
传统疫情监测依赖于医疗机构的病例报告,但这一过程通常存在滞后性,相比之下,像Steam这样的平台数据具有以下优势:
- 实时性:玩家在线数据几乎是实时更新的,能够迅速反映社会行为的变化。
- 覆盖范围广:Steam在全球拥有大量用户,数据可以细化到不同国家和地区。
- 无意识行为数据:玩家的在线行为是自然发生的,不受调查问卷或官方统计的主观影响。
与其他数据源的对比
在新冠疫情期间,除了Steam,其他非传统数据源(如谷歌搜索趋势、社交媒体活动、交通流量数据)也被用于疫情预测。
- 谷歌搜索趋势:关键词如“发烧”“咳嗽”的搜索量增加,往往预示着病例上升。
- 苹果地图数据:出行请求的减少可以反映封锁政策的效果。
Steam数据的独特之处在于,它不仅反映人们对疫情的担忧,还直接体现了居家行为的增加,从而更直接地关联到社交隔离的程度。
可能的机制与科学解释
行为经济学的视角
从行为经济学角度看,人们在面临不确定风险时,会本能地减少外出并寻找替代性娱乐方式,当疫情开始传播但尚未被官方确认时,部分敏感人群可能已经自发减少社交活动,转而投入游戏,这种“超前行为”使得Steam数据成为疫情传播的早期指标。
数据建模的可能性
如果能够将Steam的玩家在线数据与历史疫情数据进行对比分析,理论上可以建立预测模型。
- 时间序列分析:观察玩家在线高峰与病例报告之间的时间差。
- 地理空间分析:比较不同地区的玩家活跃度与疫情严重程度的相关性。
这种模型虽然不能替代医学检测,但可以作为辅助工具,帮助公共卫生部门更早地发现潜在风险区域。
挑战与局限性
尽管Steam数据在疫情预测中展现出潜力,但也存在一些挑战:
- 数据混杂因素:玩家在线时间的增加可能受多种因素影响(如新游戏发布、节假日),需排除干扰。
- 样本偏差:Steam用户主要是年轻男性,可能无法完全代表全体人口的行为模式。
- 隐私与伦理问题:如何在不侵犯用户隐私的前提下利用这些数据,仍需谨慎考虑。
未来展望:游戏数据与公共卫生
新冠疫情的爆发让世界意识到,传统监测体系之外的数据可能具有重要价值,游戏平台、社交媒体和其他数字足迹数据可能被整合到公共卫生预警系统中。
- 多源数据融合:结合Steam、谷歌搜索、移动通信数据,构建更全面的疫情监测 。
- 机器学习应用:利用AI分析玩家行为模式,自动识别异常信号。
这种“数字流行病学” 有望在未来的公共卫生事件中发挥更大作用。
