毕业论文
您现在的位置: 房颤症状 >> 阵发性房颤的症状 >> 正文 >> 正文

CCI创新周讯精准心脏病学一

来源:房颤症状 时间:2018-1-1

本周的创新周讯,我们分享的是《JACC:BasicToTranslation》中的一篇干货,详细介绍了3种关于向精准心脏病学过渡的想法。(由于篇幅过长,本文内容分为两期)

△文献来源:《JACC:BasictoTranslationalScience》

作者简介:KippJohnson博士

西奈山伊坎医学院,MD/PhD

医学科学家训练计划成员

对于心血管领域的机器学习和网络生物学对精准医学的应用有深入研究,主攻医学、遗传学和基因组学。于乔尔·达德利实验室深入研究生物信息学。-年曾于芝加哥大学攻读生物学、理学与统计学

摘要

传统的心血管病研究基于大规模的临床病理学分析,这些研究的结论很快就会被纳入标准化临床指南并指导临床实践。然而,由于心血管疾病治疗的复杂性和变异性,传统的研究模式已经很难解决问题。本文中,我们比对了3种建立精准心脏病学的想法:1)通过机器学习来精准描述心血管疾病;2)通过应用疾病的网络模型来分析整体复杂性;3)综合运用前两种方法,通过药理学和多向药理学系统更准确地匹配药物和患者、对患者疾病进行分类。最后,我们探究了精准心脏病学在应用时可能遇到的挑战,包括所需资源与基础设施,以及证实这种新方法具有临床效益的有力依据。

心血管病的精准医疗是通过深入探究疾病背后的病理生理机制来进行靶向治疗。目前对心血管病理生理学已达成多尺度的认知。20世纪六、七十年代,解剖学在认识到心梗的病因是冠脉闭塞后,血管造影术、动脉搭桥术,及之后的经皮冠状动脉介入治疗才得以发展起来。

20世纪七、八十年代兴起的分子生物学技术为生物学传导通路(如RAAS系统)的发现奠定了基础。这些发现为药物治疗提供新的靶点(如血管紧张素转化酶)。血管紧张素转化酶和其它类似的药物,比如β受体阻滞剂、羟甲基戊二酸单酰辅酶A还原酶抑制剂和糖蛋白IIb/IIIa抑制剂,已经显著降低了全球数百万心脏病患者的发病率与死亡率。

在过去,虽然我们针对单一的分子靶点治疗某些心血管疾病的确起到了效果,但未来的趋势将会是新模式的应用。慢性心脏病往往涉及多种病变过程,包括遗传、环境和特发因素,准确判断病因十分困难。虽然全基因组关联分析研究(GWAS)已经揭示了多个与心血管疾病高度相关的基因位点,但这些位点在疾病遗传性中起到的作用仍小于10%。“遗传性的丢失(missingheritability)”给药物研发带来了困难:这意味着通过GWAS、现象关联分析或者功能缺失研究找到的基因靶点对推进复杂心血管疾病研究的发展效果甚微。尽管目前对新药的需求仍在增加,但药物开发速度却在下降,例如胆固醇酯酶抑制剂在临床试验中就反复以失败告终。

△冠状动脉粥样硬化中基因组与多表型的关联是驱动几种心血管疾病的基础机制

本文中,我们将心血管疾病新型治疗手段有关的三个领域联系在一起。首先,我们把精准医疗的概念融入心脏病学,称为“精准心脏病学”。“精准心脏病学”指的是利用大量的临床和分子学特征来对疾病的演化过程和病理特征进行更精确的描述和分层。心血管疾病的精确描述把多源信息整合到一起,形成疾病相关特征。到目前为止,疾病的分类依旧取决于经验。除此之外,我们打算通过计算机采集多尺度数据去对疾病进行更精确的鉴别,为精准治疗提供保障。第二,我们将整合并运用疾病网络去治疗慢性心血管疾病的并发症。对并发症的深度理解将为新治疗手段的应用创造机会。第三,我们从系统药理学角度对心血管药物进行探究,包括药物再定位和多向药理学。我们讨论了精准心脏病学可能从成本优化、协同治疗、治疗标准等方面对医疗发展起到的推动作用。

精准化心脏病学的定义

尽管公共股份和联邦政府对精准医疗的发展投入了大量精力,但对精准医疗的定义仍然存在争议。精准医疗这个词目前在肿瘤学领域应用最为广泛,多用于描述癌细胞突变的进程,可以对患病前后状态进行精准的诠释与比对。这种对患病前后状态的划分为患者体细胞突变个体化表现的靶点治疗提供了清晰的思路。这个项目也应用于确定基因组的分析和在公共卫生研究领域的药物基因学。虽然基因药物利用基因的信息,我们设想通过从纵向医疗数据得到的转录组、蛋白质组和代谢组的信息来进行进一步研究,这些数据包括疾病诊断、程序、药物和环境暴露的数据我们定义精密心脏为多维数据在异质心血管疾病空间子集划分中的应用。这一模式的第一目标就是对患者进行分层,这样可以更好地指导治疗的干预。

很多肿瘤学精密医疗的定义并不能直接应用于心血管疾病,因为在心脏病和癌症有本质上的区别。体细胞突变是癌症的一个重要特征,但是不是心脏病中的重要特征。大部分心脏疾病都是慢性过程,疾病发生过程可能在症状表现出来几十年前就开始了。心脏疾病分很多种,多以并发症或多发症呈现的,然而对于一个感染的个体来说,癌症一般为统一的病理过程(尽管个体中已表达的肿瘤由于基因突变可以建立大分子和病理生理多样性)。临床上,心脏病学对疾病的定义往往比较宽泛,其中可能隐含细微的疾病变异。这些症状在疾病过程中显现。此外,心血管疾病有很强的时间效应,即同一种疾病在不同的时间点治疗,可能需要完全不同的干预措施来预防或治疗。

传统定量方法对精准心脏病学

不再适用

精准心脏病学新定量处理方法的建立有几个原因。首先,生物系统具有其内在的复杂性,表现出个体分子和协调通路之间因潜在相互作用而导致的动态特征。对人类而言,无论细胞基因组学还是大体解剖学,包括分子和细胞生理学层面,都体现了其重要性的功能。第二,对多种病因进行数据分析是一种挑战。我们在临床上收集到患者就医的数据往往有限,当这些数据信息被输入电子病历后,这种局限会使后期分析更加困难,并且由于在临床上收集数据费用昂贵且耗时,所以样本容量通常很小。总的来说,这些挑战阻碍了我们建立更好指导患者治疗复杂疾病的综合准确模型。

当解决问题的模型确定,临床研究人员常采用传统统计方法,如Logistic或Cox回归模型进行分析,研究者通过这些方法总结出有限预测变量之间的关联,而非系统的完整表征。但上述统计方法的检验假设须提前进行,并且这些模型不太适用于具有隐藏特征的数据。因此,精准心脏病学需要使用更先进的信息计算方法。具体来说,机器学习可用于非监督建模和研究数据。

在将纵向动态的数据纳入检测和决策过程方面,医疗行业滞后于其他行业。例如,信用卡公司收集了包含客户信息和个人交易信息在内的大量纵向数据,但这些信息通常不能用于识别欺诈交易。合法交易通常远超欺诈交易,这种不平衡的因变量问题使得传统统计方法不可靠。

△精准心脏病学的多样数据来源

相反,神经机器学习方法,如神经网络被应用于解决这个问题,它将整个收集的数据区分出不同层次以表示不同数据类型,然后对这些数据进行测试以完善不同的功能。这一策略已被证明对检测欺诈交易非常有效,因此我们提出了采用类似的策略来处理心脏病学中的医学数据。医疗保健服务相对其他行业来说,极其重视患者的安全和隐私,但我们认为通过研究和使用其他行业的数据驱动方法,同样可使医学特别是精准心脏病学取得很大进展。作为心脏病学机器学习成功的范例,移动心电图设备Kardia的数据已经成功地与机器学习结合并用于检测房颤。

如今大量资源可用于精准心脏病学,从患者那里收集的临床数据,如生命体征,成像结果,实验室检查和病史,均可进行处理并纳入预测模型。此外,机器学习已经成功应用于超声成像。在此基础上我们还可以加入一些信息,如药物,诊断,程序和计费代码等添加设置成临床信息。其他临床数据可与一些外部数据库相关联,如药物信息可与药物不良反应,药物相互作用的数据库相联系。我们还设想将新兴生物传感器和设备(如智能手表或移动健康应用)的信息纳入到待分析的数据中。而从全基因组关联研究或其他技术发现的基因组信息,如单核苷酸多态性,拷贝数变异和结构变异也可用于预测模型。表观遗传学,转录组学和蛋白质组学的联合研究同样能表示基因组功能,代谢学结果也呈现出其与临床特征紧密相关。以前的方法可以将现象关联研究中鉴定的表型分类,我们统称这套多尺度数据为多组学。

通过机器学习方法分析心血管的

多尺度数据

在多组学研究中,我们尚未研究出能将不同类型数据关联起来的机器模型。为了处理这类不确定信息,可以用统计学的机器学习方法来对复杂的多组学数据进行询问、建立模型和学习。

以数学方法为基础的机器学习可以被广义理解为监督或非监督学习方法。监督学习方法需要对数据组设置标签(比如“病例”和“对照”)。这些带标签的数据通常被分为训练和测试两个数据组,以减少过度拟合的影响并得到更好的预测模型。监督学习算法(例如,支持向量机、随机森林、朴素贝叶斯分类器及其组合)可以根据数据的性质(连续或分类)、稀疏度和完整度或者机器学习的任务性质(如预测,分类等)来执行特定的机器学习任务。生物学和医学中的许多分类和聚类问题,都可以利用机器学习方法解决,包括心血管疾病的分类,精确表型的分析和临床诊断辅助系统(41,43,44)。

△精准心脏病学的机器学习方法

机器学习中的“非监督学习”用于学习多组学以及建立模型。非监督学习可以被广义理解为机器学习方法的一种,不需要与疾病状态、死亡率和其他广泛研究的因变量等外部参考数据作比较,就可以发现数据组中的隐藏结构。该方法可用于降低干扰影响和高度多尺度数据组的容量——本质上就是从复杂的信息来源中提取出具有代表性的数据组,这些精选出来的数据组对之后的分析具有更重要的意义。许多传统的非监督学习方法,比如主成分分析,奇异值分解以及各种聚类方法等,尽管已经发展成熟且依然稳妥和适用,然而由于计算机科学和生物信息学领域的迅速发展,机器学习已经接受了大量新兴技术的洗礼,比如先进的矩阵因子算法(45–47)、拓扑数据分析(48–51)、人工神经元网络自编码(52)以及特别要指出的深度学习或者多层神经元构成的人工神经元网络(53–62)。举一个最近非监督学习的例子,Li等人(63)利用一个卫生系统生物数据库中的数据,包括EHRs中的多方面信息、临床观察、基因数据等,使用拓扑数据分析方法将2型糖尿病病人归为了3个亚型。在另一个例子中,通过以去干扰自编码器为基础的深度学习,人们建立了一个新的乳腺癌基因表达数据库,较之前的方法可以更好地预测死亡率(52)。深度学习可能是近几年来机器学习中发展最快的领域:由于可以获得大量的数据,深度学习已能够得到最理想的结果并且已广泛运用于药物研究(58,59)和数字化病理学(54,55)中。简而言之,深度学习借多层叠加的模型,将数据有层次地展示出来。每一层都由不同的模型组成,它们对数据进行分析并将结果传递给更高一层的模型,直到最高一层输出其得到的结果。在最近的一个研究中,Miotto等人(36)揭示了深度学习的前景,他们利用这种技术对EHR中分散的、重复的、重叠的数据建立模型并以非监督方式对病人疾病状态进行了分类。他们将这种概念命名为“深度病人”(36)。

精确测定一个病人疾病的临床表型十分困难。建立EHRs的主要目的不是用于研究而是用于医疗服务和提供医疗费用的账单。再者说,不同的医生、医疗系统和科学家可能以不同的标准去诊断某种疾病(64)。如果不作说明,这些因素会导致得出不同的结论和研究结果。标准化算法的发展得益于从EHRs中分配病例并掌握情况的愿景,比如来自eMERGE联盟的算法(65,66)。这些电子表型(“E-表型”)算法可以给研究中病人的标准化提供帮助。很多这样的算法存放在表型知识库(PheKB)中(67),这是一个使用EHR数据进行高质量表型验证的E表型分析算法的集中式存储库(68)。对于每个疾病算法,病例和对照队列均使用标准化定义,可以在不同的设置上统一应用。然而,由于这些算法的苛刻条件,到目前为止只开发了有限的数量。对算法化疾病进行分类为建立更准确的方法打下了非常重要的基础。需要注意的是,像来自eMERGE的这些E表型分析方法本身并不精确;相反,他们忽略了整个疾病过程的复杂性,而仅以“有”或“无”对疾病进行分类。

与前文中描述的算法“E表型”方法相反,有一种被称为“计算表型”的方法(69)。计算表型的目的是通过机器学习的方法来解决疾病机制中固有的复杂问题,以定义精确的表型。

通常,计算是为了使用这些表型以动态的方式来进行模拟预测。例如,一组调查人员试图在疑似遗传疾病的患者中进行。研究者将基因测序与临床特征数据相结合,对不同的假设突变构建预测评分模型。他们发现他们的模型可以从基因病因学正确诊断28%的病例,而这些病例以前未曾被诊断过(70)。在另一个例子中,研究者开发了一种新的机器学习方法来预测各种细菌物种中的抗生素抗性表型(71)。在这里,我们设想了一种特定类型的计算表型,我们称之为精确亚类型,可以使用E表型(建立准线整体疾病病例对照组)和计算表型(描绘这些组群的新子集)中的观察结果。

参考文献

敬请期待

下期精彩后续!

精准心脏病学的疾病纳入标准

精准心脏病学分型的示例

基于患者分层和人口卫生信息的

疾病网络

药物再定位可作为定向干预途径

机遇:多向药理学

挑战:将精准心脏病学与其他

医学专业结合

精准心脏病学:从计算机向患者

群体转移

精准心脏病学的未来展望

原创作品,如需转载,请标明出处

投稿可在后台留言

往期精彩

国外新一代介入性主动脉瓣的设计点评及临床评价

NEJMCANTOS研究CCI无创迷走神经刺激仪

难治性高血压的器械治疗进展

心血管领域的创新转化

仰望星空:CCI纪念冠脉介入40周年特刊

医生如何创办生物医疗设备公司

“完全可降解支架”近期热点

本期策划:沈雳余锂镭靳志涛

文字编译:高子昂王培琳黄朔阳明婷倩

杨晓萌叶涨邓志岳朱梦悦

后期制作:张倩倩杨晓萌邓志岳朱梦悦

赞赏

长按







































北京治疗白癜风哪家医院好
常见的白癜风发病原因

转载请注明:http://www.yuhexiang.net/zfxfczz/1703.html