上个月,谷歌母公司Alphabet旗下的Verily启动了Project Baseline研究,与斯坦福大学医学院和杜克大学医学院合作,收集了大量表型健康数据,以期制定出一套明确的人类健康参考标准。
Project Baseline旨在收集来自约10,000名参与者的健康数据,每个参与者将被追踪四年。这些数据将被用来制定人类健康的“基线”图,深入了解健康向疾病的转变过程。获得的数据将以多种形式呈现,包括临床数据、影像数据、自我报告及行为数据,以及从传感器和生物样本上获得的数据。该研究的数据存储库会建立在谷歌计算基础架构上,并安置在谷歌云平台上。
“政府如果能够进行数据质量管理和数据共享,就会带来很大改变,”Roam Analytics(一家位于旧金山的机器学习分析平台提供商,专注于生命科学)的首席科学家Andrew Maas说。“私人企业想这样做,并愿意收集大量数据,那很好。如果给我们这些数据,我们能够在一年里做出惊人的结果。但是,如果因为人们的担忧而导致数据无法收集,我们什么都做不了。”
患者数据的可及性和计算能力是理想与现实之间存在差距的重要原因。IBM沃森通过众多合作伙伴关系积累了大量数据,输入其所谓能够更深入理解患者健康状况的认知计算模型。由于实际结果尚未完全呈现,舆论对IBM沃森的看法趋向两极。有人觉得这算得上是机器学习的鼻祖。
斯坦福大学语言学和计算机科学系的主任Chris Potts和Roam Analytics的首席科学家称,沃森“可以说是医疗保健领域最有希望的企业”。其他人对此却不怎么有信心——Social Capital的CEO Chamath Palihapitiya称沃森为“一个笑话”。
这种不确定性似乎并没有阻碍沃森发展新的合作伙伴。就在本月,沃森加入了MAP Health Management,把他们的机器学习技术用于治疗药物滥用。IBM研究部门正与Sutter Health合作,以未充分利用的EHR数据为基础,开发预测心力衰竭的方法。
IBM沃森从2011年开始这个项目,当时这台机器赢了Jeopardy游戏,使公司对这项技术用于实践充满信心。
“我们必须教导它医疗领域的相关技术,这些技术相当复杂,它们根据专业的不同而变化,而且在世界的每个地方都不一样。我们必须让系统习得医学用语。”沃森健康副总裁兼首席策略官Shiva Kumar说, “第一步是自然语言处理的能力,比如在参与对话时能给出最好的回答。接着就是培养与病人对话的能力,让它进一步吸收知识,不断向前发展。”
Kalsar还解释说,为了做到这一点,IBM沃森必须解决非结构化数据的问题,“我们打算使用词汇认知计算,因为它不仅仅局限于机器学习和深度学习,还能够整合学习,洞察更深刻的东西。”
“医疗产业是独一无二的:它受到高度监管,还有大量不能使用的数据。当然同时也有很多未开发的资源,”他说,“所以,这是一片很多技术都可以一展拳脚的领域。但到最后,治疗的成功与否仍旧掌握在医生手里。”
如何前进
许多专家预测,AI能够在医疗领域掀起波澜。
Allscripts Analytics的首席医疗官Fatima Paruk博士认为,AI将首先应用于慢病管理;随着以患者为中心的健康数据的可用性越来越高,以及环境和社会经济因素的发展,AI也会跟着进一步发展;最后,基因信息会融入,使精准医学变成现实。
AI能够对那些在技术上早已非常落后的制药公司产生巨大影响。这些制药公司如今也开始寻求改变了。Lux Capital的合伙人,辉瑞公司的前董事长兼首席执行官Jeff Kindler将制药公司称为“创新者困境的典型代表”,因为他们从未遭受过严重的财务危机,因此也没有动力转变商业模式。但是,AI发展的速度和潜力巨大,制药公司也无法拒绝其吸引力,这些医药领域的利益相关者需要更多的沟通,来了解到底怎样运用AI。
效率是药物开发的关键,特别是对于那些正卡在FDA的创新企业来说,他们可能会让AI的能力变得更强大。辉瑞负责数字战略与数据创新的副总裁Judy Sewards表示:“我在一个需要花12年才能推出一种新产品的行业工作,12 年相当于三个总统任期,或者说三届世界杯的时间。在那段时间里,1600名科学家需要着手研究,进行3600次涉及数千名患者的临川试验。我们考虑的是AI能不能加快这一进程,使其更智能化,将突破性药物与相应的患者需求连接起来?”
Sewards表示,“使这样的设想成为现实”正是他们与IBM 沃森进行免疫学研究的目的,“有些人担心机器或AI会替代科学家和医生,但实际上它们更像是研究助理或者帮手。”
德勤医疗负责人Rajeev Ronanki说,只有三股强大力量的结合,才能推动机器学习向前发展,这三股力量是:数据的指数级增长,更快速的分布式系统,和更智能的能够处理和理解数据的算法。当这三股力量结合在一起时,Ronanki预测,CIO可以收获一些认知方面的洞见,以强化人类决策的能力,提高基于AI的参与工具性能,以及设备和流程中的AI自动化水平,提升领域相关的专业能力。他引用一段IDC报告的内容,称:“我们认为这种增长将会持续,预计在机器智能方面的投入将增加到313亿美元。”
“今天我们所处的位置基本是零,”Roam Analytics的首席执行官兼共同创始人Alex Turkeltaub表示,“我们多多少少想出了一些商业途径,最多只能使用硕士生水平的统计数据。因为要把数据放在一起并同时要处理监管问题是非常困难的。大多数最前沿的深入学习算法是在60年代开发,而它们的想法又来自于16世纪。我们必须找出更好的方法。”
就像辉瑞公司的Judy Sewards所指出的:“在这个行业,你必需有百分之百的确定性,因为一旦犯错,有些患者可能就要为此付出生命。”