行业焦点

美国公开新冠数据集欲借力AI,人工智能如何参与全球战“疫”?


浏览量:12385

截至北京时间3月22日6时,全球累积确诊病例超30万,死亡病例近13万,这场来势汹汹的疫情在世界范围内持续蔓延。国内“重灾区”湖北已连续4天无新增病例,而世界的防疫战争才刚刚开始。


欧洲已成世界新冠疫情中心,意大利累计确诊过5万,政府同意派遣军队进入伦巴第大区协助抗疫;美国的情况也不容乐观,特朗普宣布疫情严重的纽约州出现“重大灾难”,这场防疫战已然成为世界人民共同的“健康守卫战”。


前几日,美国白宫与微软、谷歌等公司合作,汇编了最大的新冠病毒学术论文库,呼吁研究人员用AI技术分析这近3万篇学术论文,期望发现人类可能错过的重要问题。


除此之外,预测研判、检测诊疗、疫情防控,这套AI“组合拳”还亮出了不少花式操作。


发布病毒数据集,激活全球AI力量


根据美国白宫官网报道,3月16日,艾伦AI研究所、微软研究院、美国国立卫生研究院下属国家医学图书馆、白宫科学技术办公室等联合发布了COVID-19开放获取数据库,其中包含了有关COVID-19、SARS-CoV-2及冠状病毒家族的学术论文。


这一数据库向全球研究人员开放,并会随着同行评议新研究的发表不断更新。数据集的发布当然不只是为了整理和存档,挖掘更有用的信息才是目的所在。这是目前可用于数据和文本挖掘的最全面的新冠文献机读数据库。白宫号召全美的人工智能专家行动起来,运用AI技术分析这些论文,帮助解答新冠病毒最紧迫的疑难问题。


数据库一经开放,谷歌云旗下的机器学习和数据科学社区Kaggle立即发起了CORD-19数据集文本挖掘竞赛。Kaggle在官网上发布了10个问题,涵盖冠状病毒特性、新冠病毒危险因素、病毒传播和诊疗、疫苗、非药物干预、信息共享和跨部门合作以及社科伦理等方面,每项问题中最符合评估标准的人员将获得1000美元的奖金。


正如艾伦AI研究所所长Oren Etzioni所说,人工智能本身不能解决问题,但能帮助人们更快速地发掘问题的答案。美国首席技术官迈克尔·克拉希欧斯也表示,他们希望计算机能够比人类更快地扫描研究结果,发现人类可能错过的东西。AI已经成为科学家重要的左膀右臂。


机器学习技术在大量文本中提取摘要,有时需要分析数百万个相似的内容项才能得出结论。想要发挥数据集更大的作用,自然语言处理(NLP)技术的进步不容忽视。例如,艾伦AI研究所的语言模型ELMO和AllenNLP,能够分析不同论文之间的关系;阿里达摩院将NLP技术用于病历文本分析,这个模型也被评为全球性能最强的NLP系统。


此外,NLP技术的作用还体现在疫情预警上。12月30日,波士顿儿童医院的自动健康地图系统发布了境外关于新冠病毒的首次公共警报。31日,加拿大AI创业公司Blue Dot也向客户发出了疫情警告——“避开武汉等危险区域”,早于CDC和WHO的通报。


Blue Dot的健康监控平台对数十亿个数据点进行分析,找出相关词汇短语,从而预测传染病的爆发,还可以预测病毒的传播。据《华尔街日报》报道,其信息来源包括:国内外每日新闻稿10万+、官方报告、卫星气候数据、航班信息和包括人口数据、医疗力量和可传播传染病的昆虫数据在内的政府资源。这不是Blue Dot第一次预测成功,利用类似的AI技术,他们还曾准确预测了埃博拉病毒和巴西寨卡病毒的迁移。


海量数据+最强大脑,AI技术让病毒无处遁形。


疫情之下,医疗AI化身可靠援军


不仅是作为“场外辅助”,AI还在战场上与新冠病毒正面交锋。


知己知彼,百战不殆。曾经开发了AlphaGo的DeepMind正在执行一项新任务:找出这种新型冠状病毒的某些特性。DeepMind已发表的一篇文章中称,已经将AlphaFold系统用于新冠病毒的蛋白质结构,这种“自由建模”的机器学习技术能够在没有相似蛋白质结构的先验知识时,提供准确的预测。


DeepMind表示,虽然这些预测尚未得到验证,但能够帮助研究人员更充分地理解新冠病毒,这可能在开发疫苗或治疗时有用。


也有研究人员利用人工智能技术进行抗病毒药物的筛查,AI公司Deargen与韩美高校的研究人员合作进行这一工作。他们公布了针对抗病毒药物的预测模型,并在预测后对FDA批准的约4000种市售药物进行了测试。研究表明,用于治疗和预防艾滋病毒的抗逆转录病毒药物阿扎那韦最有希望能被用于临床。这一基于深度学习的“药物-靶标”相互作用的模型,旨在预测药物和蛋白质之间的亲和力得分。


Deargen首席技术官朴成秀表示,这种方法能够以更快的速度和更少的成本,利用AI来预测吸收、分布、代谢、排泄和毒性,可将范围扩大到有效且相对安全的候选药物中。


英国AI医疗领域的独角兽Benevolent AI,也在柳叶刀上发表短文,公布了AI分析和筛选抗新冠病毒药物的发现。通过靶向内吞,AI发现了四种潜在药物能够抑制病毒内吞,排除较强的副作用后,结果表明 Baricitinib可作为一种抗新冠病毒的候选药物。据CNN报道,IBM研发的配备AI超级大脑的Summit,已经辨识到77种可能有效阻止新冠病毒蔓延的药物成分。


此外,AI医疗在战疫中的重要性还体现在辅助诊断方面。谷歌母公司Alphabet旗下医疗部门Verily推出了新冠病毒筛查项目,上线第一天测试了20多人。微软与CDC合作构建了一个聊天机器人——“冠状病毒自我检查器”,可以指导用户初步判断自己是否感染。日本的Doctor-NET也将开启AI检测新型冠状病毒的试验,将与北京推想科技合作,引进这套根据CT图像进行检测的系统。


事实上,国外将AI医疗技术运用在传染病防治的案例早已有之。早在2008年,谷歌就推出了流感趋势服务;美国国家过敏和传染病研究所曾资助“配体搜索算法”项目,旨在用AI程序设计药物;2013年IBM就开始研究如何运用AI系统“沃森”提高护理水平,谷歌的监测工具LYNA将乳腺癌诊断的时间缩短了一半,准确率达到99%。


技术迅猛发展,AI医疗成为我们防疫战中最坚实的后盾。


中国经验+技术,助力全球AI战疫


中国一个多月来的艰苦鏖战如今为各国提供了“抄作业”的范本。中国驻韩大使馆援助韩国大邱物资上写到:“道不远人,人无异国”,在国内疫情得到控制的同时,中国又马不停蹄地投入了全球共同的防疫战之中。不仅提供物资、医护人员以及“山川异域,风月同钉”,还有宝贵经验和AI技术。


近日,百度频频被外媒“点名”报道,肯定其AI抗疫的胜利,《麻省理工科技评论》也发表关于百度AI战疫的报道,全球疫情升级之下中国经验显得尤为宝贵。MIT的文章涉及百度 AI 技术在病毒分析、实时筛查、辅助诊疗、大数据分析等方面的应用成果,还包括自动驾驶车辆在无接触作业方面的应用。文章认为“此次疫情中展现出的数字链接,其规模是传染病史上前所未有的”,这些经验也为全球疫情防控提供了思路。


不止于经验,更有实实在在的技术支持。疫情爆发初期,百度就向全球科研中心免费开放了算法Linear Fold,以及世界上现有最快的RNA结构预测网站,其可将新冠病毒的全基因组二级结构预测从55秒缩短至27秒,助力全球疫情防控。


阿里也联合全球健康药物研发中心,开发AI药物研发和大数据平台,实时公布;阿里云宣布向全球公共科研机构免费开放一切AI算力,用以加速新药和疫苗的研发。3月19日,阿里再一次宣布向全球医院免费开放新冠肺炎AI诊断技术,达摩院的CT影像AI可在20秒内完成一次诊断,最快仅用2秒,准确率高达96%以上。


推想科技与武汉同济医院、中南医院联合研发的新冠肺炎“CR+AI”辅助筛查和疫情监测系统,也远赴意大利、日本的抗疫一线。意大利已然成为全球疫情的“震中,其医疗系统正面对极大压力,推想科技的CT+AI为疫情筛查构筑起了一道防线。


不过在病毒肆虐全球的当下,世界范围内基于AI技术的医疗研究只能是辅助作用,成效不显,正所谓“远水难救近火”。面对这次疫情,AI技术原本为人称道的预测功能却未能派上用场。尽管Blue Dot早在12月底就发出疫情预警,甚至预测到病毒有传播到新加坡、东京、香港等地的风险,却未能引起足够重视。


也许,这次疫情给人类最大的教训和提醒,就是全人类该如何通力合作,去建立一个权威、准确的全球卫生“哨兵系统”,这才是未来AI技术在医疗领域发展的重中之重。