医药行业正在利用大数据分析技术推动新型医疗,根据不同患者的具体需求以及对基因、环境、生活方式等数据的了解确定治疗方案。 但如何滤除数据噪声,找到真正的科学解决方案,这仍是一大难关。
作者:Rebecca Gibson
在全球人类基因项目过程中,科学家花了13年和30亿美元(26亿欧元)才实现了单一人类基因组中30亿个基础DNA对排序。25年后的今天,只要花大约1000美元(878欧元)就能对一个人的基因组实现排序,而且通常只需要一天。基因组排序变得更快,成本更低,而且也更方便诊断罕见病人疾病,同时能帮助研究人员针对不同病人制定具体治疗方案。
举例来说,英格兰的4岁女孩Jessica Wright从出生后就经常犯癫痫症而且发育迟缓。没人知道为什么,直到她及其父母的DNA经过排序分析比较才得到答案,而该排序分析是英国10万人基因组项目的组成部分。2016年1月,Jessica被诊断患有GLUT1缺陷综合症,这是一种非遗传性疾病,会导致脑部细胞缺乏能量,无法 正常工作。她的医生提出高脂肪饮食疗法,为她的大脑提供能量,并减少癫痫药用量。 Jessica是全球受益于精确医疗法的许多病人之一,现在人们正积极推广该疗法让所有病人受益。
总部位于美国加州的慈善机构全球基因组织估计全球有3.5亿人患有约7000种罕见疾病中的某一种,其中80%的罕见疾病跟基因有关。因此,全球科技公司、研究机构和政府都在加大力量分析庞大的健康和基因数据,希望了解为什么有人会患特定的疾病,并采用不同的治疗方案。其目标就是针对少量人群、甚至在必要时针对某个特定的病人制定精确医疗方案,并降低这种治疗的成本。
“精确医疗前瞻性地采用基因组和大数据以避免疾病,至少能在疾病恶化之前实 现诊断。”
LLOYD B. MINOR
斯坦福医学院院长
全球工作正在推进:
谷歌与总部位于纽约的自闭症宣传机构“自闭症患者发声”组织合作推进自闭症的诊断工作,通过1万户家庭的DNA排序推进病症细分和治疗。
在澳大利亚,布里斯班QIMR伯格弗医学研究所和昆士兰科技大学的研究人员正在探索如何推动基于基因组的个性化癌症和阿兹海默症疗法。
美国总统奥巴马在2016年预算中批准2.15亿美元(1.89亿欧元)用于全美精确医疗计划。
中国政府到2030年将投资30.9亿美元(约27亿欧元)用于支持精确医学研究。
斯坦福大学医学院的研究人员正在探索如何运用孕妇的一滴血来进行无细胞测试,检测胎儿唐氏综合症。(图片 © Steve Fisch / Stanford University)
总部位于深圳的华大基因是全球最大基因企业,已对100万中国人实现基因排序。该公司还在英特尔和中国阿里巴巴集团帮助下建立了亚太地区首个精确医疗应用的云端平台华大在线。
华大在线负责人金鑫指出:“此前,医疗机构、制药企业和临床实验室必须购买昂贵的软件并聘请专家才能分析数据,而现在他们能用英特尔的算法在阿里巴巴的公用阿里云端来运行复杂的基因排序,只需接入华大在线即可。”金鑫还补充说,一些医院正在测试这种服务。
在背后支持上述所有创新的是大数据,也就是TB级乃至更大量的数据,此外还有分析技术。
医疗研究公司Information Frameworks的首席研究官Naeem Hashmi指出 :“ 大数据平台为结合大量非结构化个人表现型和基因数据提供了方便的途径,这些数据来自多种不同源头,能提供社会经济和环境信息,数据整合有助于了解有关因素对健康的影响。”
法国国家健康和医学研究院的 CEO Yves Levy认为大数据将在机构尝试使用排序基因组肿瘤数据发挥重要作用,该机构用来自3000名癌症患者的数据来评估药物有效性。
他说:“我们将用达索系统的 3DEXPERIENCE 平台将大数据集成到进程中,并打造虚拟生物化学模型,重新检测病理路径,改进我们的分析进程,并生成新的假设。我们认为这将推动生物医学研究转型,并对人们的健康产生重大影响。”
加州斯坦福大学医学院正进一步推进精确医学发展,利用大数据技术来分析来自病人数据库和可穿戴产品的信息,从而预测乃至避免疾病的发生。
该院院长Lloyd B. Minor指出:“精确医疗前瞻性地采用基因组和大数据以避免疾病,至少能在疾病恶化之前实现诊断,这将大幅减少需要特殊护理的病人数量。举例来说,我们正与总部位于北加州的杜克大学以及Verily(前身为谷歌生命科学)记录来自北加州和北卡罗莱纳1万人所佩戴设备传输的健康信息,从而跟踪这些人长期时间内的健康状态变化。如果某个参与者2021年出现了糖尿病症状,那么我们将回过头来分析其数据,精确找到今后可能患病的早期迹象,从而帮助我们发现类似的病患风险。”
斯坦福医学院精确医疗计划包括 cfDNA测试等高级诊断技术。
Minor指出:“我们能用cfDNA 检测法检测孕妇学样的少量 DNA,从而发现胎儿是否患有唐氏综合症(或21三体),而不必使用今天成本高、风险大的羊膜穿刺术。目前的癌症检测法成本太高,也太复杂,难以成为常规例行检测法。不过今后cfDNA检测可用于持续监测,从而大幅提前发现癌症的时间。这对卵巢癌和胰腺癌尤其有用,因为这种癌症往往直到晚期才会出现症状。”
“我们需要强大的分析算法,看看这7000万条信息是否与特定疾病相关。”
MARTIN LANDRAY
英国牛津大学医学和流行病学教授点评英国生物库
要通过精确医疗制定个性化的治疗方案,研究人员必须首先对大量或许是数百万人进行研究。
英国牛津大学医学和流行病学教授Martin Landray指出:“针对具体患者制定定制疗法是可能的,但要全面了解患者疾病对不同治疗方案的反应,我们必须比较来自尽可能多的人的基因表现型数据,包括健康人和病患的数据。为了给一位60岁的糖尿病患者开药,我可通过算法从20万人数据库中快速发现5000名糖尿病患者信息,并明确其身体健康状况与我的病人身体状况之间的关系。比方说,如果85%的人60岁后吃某种药出现高血压,那么我在开这种药时就会非常谨慎。”
虽然电子病历(EMR)、MRI和可穿戴设备能生成比过去更多的健康数据,但病人隐私控制措施限制了大规模数据分享分析,这对推进精确医疗是不利的。
深圳华大基因的科学家已在中国完成100万人类基因组排序。华大的云端服务支持医学研究人员和医院。(图片 © BGI)
为此,英国卫生部在全英建立了13家基因医疗中心,招募相关病人,同意的病人将加入2014年12月启动的10万英国基因组项目,将到2017年前从7万病人身上实现10万人类基因组排序。在病人同意的背景下,项目成功从1万人身上排序了7000个基因组,有力推动了罕见病、遗传病和癌症的诊断治疗。
英格兰基因项目的生物信息学负责人Tim Hubbard指出:“截至目前,收集的数据用于个人治疗或匿名共享实现大规模研究。我们打造了一体化基础设施,先针对不同病人分析数据,再整体分析数据,从而为比较不同人群提供庞大的数据样本。我们每天运行约100个基因组,并与3家具备计算实力的外部公司合作,分析海量数据。不过,为了保护病人隐私,商业和学术研究人员必须在英国政府的专用G云端分析我们数据库中的数据。”
虽然10万基因组项目作为一次性项目获得资金,但Hubbard预计整体基因组排序随着英国卫生部的广泛采用将最终具有经济可行性。“我们针对调查中的每种疾病建立了临床数据模型和资格标准,所以我们事实上建立起了一个框架,这个框架未来扩展后能探索超越癌症和罕见病以外的精确医疗方案。”
要实现数据意义,海量原始数据的格式必须能让研究人员方便地进行分析,并能让临床人员方便地加以查询。
Landray指出:“英国生物库对50万病人的基因代码完成排序后,我们将能用统计方法来计算约7000万种基因组变量。难点在于想办法对其做出解释。我们需要强大的分析算法,看看这7000万条信息是否与特定疾病相关。大数据还能帮助我们发现MRI意料之外的图形或者活动记录仪收集到的临床人员没有明显注意到的数据。”
不过,大多数医疗服务供应商还没有为适当收集、管理和分析大数据做好准备。
Hashmi指出:“全球医疗系统仍然存在很强的碎片化,因为不同的医疗服务供应商都采用自己的IT系统。通常相同机构中的不同部门如放射科和心血管科之间采用的EMR系统是不互联的。大数据平台为精确医疗带来巨大潜力,但只有找到整合不同IT系统的方法,在保护病人隐私的前提下自由分享数据,让经过分析的数据方便可用,能整合到临床实践中,才能避免数据壁垒,才能带来真正的价值。”
不过,并非所有研究人员都是精确医疗的粉丝。美国明尼苏达州罗切斯特马约诊所的病理学家和麻醉师Michael Joyner提醒说,光挖掘基因变量和疾病之间的基因组数据关联可能得出错误的关联结论。他指出,事实上,研究社会经济和环境因素反而能提供更多信息。
Joyner指出:“许多完全健康的人身上都存在疾病相关的基因变量,但这只会微弱增加风险。大规模人群样本的广泛基因组分析可能带来错误的正相关结论。癌症治疗领域的精确医疗尝试并没有达到预期,但实施禁烟令、落实人类乳突状病毒接种则非常有效。此外,研究显示基于基因分数的疗法不见得更有效。使用病人华法林(避免血栓塞的抗凝血药)代谢数据与根据病人年龄和体重来调节药剂用量相比并没什么优势。”
虽然存在怀疑,虽然研究人员和临床人员让基因组和大数据成为大量病人诊断治疗的常规手段还有很长的路要求,但2015年11月题为《全球精确医疗市场估算和预测(2015年至2022年)》的报告指出,全球精确医疗市场到2022年降低到880亿美元的市值。
斯坦福医学院的Minor指出:“病人与医疗数据相隔离、被排除在医疗服务交付进程之外的日子已经一去不复返了。精确医疗和精确健康需要前期投资,但说到底当我们能尽早预测、避免、诊断和治疗疾病时,我们就能降低后期病患护理相关的资源和成本,也能帮助人们享受更长寿、质量更高的生活。”