您的位置:医药网首页 > 医药资讯 > 医疗器械行业 > Nature子刊:通过机械培训模子辨认简单疾病的紧张生物标志物

Nature子刊:通过机械培训模子辨认简单疾病的紧张生物标志物

2021年5月27日讯/跟着高通量技术的倒退,通过天下各地研讨职员的独特尽力,造成了年夜型公共数据库,如癌症基因组图谱(TCGA)。这对说明疾病表型的分子机制具备严重意义。然而,因为癌症等简单疾病的病理以及其在遗传、基因组和卵白质组程度上简单的分子机制,研讨简单的人类疾病仍具备挑战性。今朝,已有好多基于机械培训的办法开辟进去,包含非线性核支持向量机(SVMs)、随机丛林(RFs)和人工智能畛域的深度神经网络(DNNs),为药物反馈和医学影像分类等临床相关的生物医学和生物组学数据树立了更弱小的预测模子。然而这些模子算法较为简单,存在信息不通明性,且难以解释每个独自特征的作用。然而,辨认紧张的生物标记物可以协助研讨职员树立对于预防、诊断和医治简单人类疾病的新假如。

在本研讨中,研讨职员提出了一种基于分列的特征紧张性测试(PermFIT),用于估量和测试特征的紧张性。PermFIT(https://github.com/SkadiEye/deepTL)采取盘算效率高的方式完成,无需模子改装。PermFIT可解释简单框架中的单个特征,包含深度神经网络,随机丛林和支持向量机。

通过对TCGA肾癌数据和HITChip Atlas体重数据的利用展现, PermFIT法式进一步显示了其良好性能。通过PermFIT法式的特征选择显着进步了这些预测模子的性能。然而,值得指出的是,PermFIT的预测性能改善受限于每个机械培训模子框架的才能。例如,RF在建模交互项方面绝对低效,是以PermFIT-RF的性能能够会遭到具备基因-基因强交互作用的简单性状的限定。总体上,PermFIT与DNN的联合一直显示了良好性能。

图 通过个性选择改良模子性能

总之,研讨职员通过在分歧场景下进行的年夜量数据研讨标明,PermFIT不仅能获得无效的统计揣摸,还能进步机械培训模子的预测精度。PermFIT在肾癌基因图谱数据和HITChip图谱数据的利用,展现了其在辨认紧张生物标记物和进步模子预测性能方面的理论利用性能。

(100医药网100yiyao.com)

原文出处:Mi, X., Zou, B., Zou, F. et al. Permutation-based identification of important biomarkers for complex diseases via machine learning models. Nat Commun 12, 3008 (2021).

医药网新闻
返回顶部】【打印】【关闭
扫描100医药网微信二维码
视频新闻
图片新闻
医药网免责声明:
  • 本公司对医药网上刊登之所有信息不声明或保证其内容之正确性或可靠性;您于此接受并承认信赖任何信息所生之风险应自行承担。本公司,有权但无此义务,改善或更正所刊登信息任何部分之错误或疏失。
  • 凡本网注明"来源:XXX(非医药网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。本网转载其他媒体之稿件,意在为公众提供免费服务。如稿件版权单位或个人不想在本网发布,可与本网联系,本网视情况可立即将其撤除。联系QQ:896150040