N Engl J Med:我们身处数据金矿,为何仍为医学证据所困? |
![]() |
让我们先来描绘一下这片 数据海洋 的广阔。根据联邦数据,高达96%的美国医院已经采用了电子健康记录 (Electronic Health Records, EHRs) 系统。从理论上讲,这是一个巨大的宝库。每一次都可能成为一个研究数据点,无数患者的真实诊疗历程可以汇集成强大的证据,帮助我们比较不同疗法的优劣,发现罕见药物副作用,甚至预测疾病的暴发。这远比传统的、耗资巨大且耗时漫长的临床试验 (clinical trials) 更高效,也更贴近真实的临床环境。
然而,这篇文章一针见血地指出,我们看到的很可能只是黄金的幻象。问题的根源在于这些系统的 出身 它们从诞生之初,就不是为了科学研究而设计的。
EHRs:一部为 账单 而写的病历,而非为 科学 而作的笔记
想象一下两本笔记的区别。一本是商人的账本,它清晰地记录了卖出了什么商品,收了多少钱。它的核心目标是确保交易无误、利润最大化。另一本是研究人员的实验记录本,它不仅记录成功的结果,更会详尽地描述失败的尝试、意外的观察、以及所有可能影响实验结果的环境变量。它的核心目标是无限逼近真相。
不幸的是,我们当今的EHRs系统,更像是前一本 商人的账本。它们的核心驱动力是医疗支付 (reimbursement)。医生在系统中录入信息,首要目的是为了确保提供的医疗服务能够获得保险公司的最高额度报销。这意味着,那些与计费直接相关的信息,比如诊断编码、实施的手术、开具的药物,会被相对准确地记录。但那些对于研究至关重要,却与当次支付无直接关联的信息,则常常被忽略或粗略带过。
例如,一位因急性入院的患者,他的诊断、用药、等信息会被详细记录。但他的吸烟史、饮食习惯、精神压力、甚至社会经济状况等关键的风险因素 (risk factors),如果没有成为本次计费的明确项目,就可能记录得非常不完整,甚至完全缺失。数据质量也因此参差不齐,常常是 低质量且不全面 的。当研究人员试图利用这些数据来分析心肌梗死背后的深层原因时,他们面对的就是一堆充满了 信息虫洞 的资料。
更糟糕的是,许多重要的暴露 (exposures) 和结局 (outcomes) 甚至没有被可靠地记录下来。比如,一个新药上市后,患者是否因为微小但持续的不良反应而自行停药?一位慢性病患者的在接受新疗法后是提升了还是下降了?这些对于评估医疗干预真实效果至关重要的信息,在以计费为中心的EHRs系统中往往无处寻觅。
因此,直接利用这些原始的RWD进行观察性研究 (observational studies),就如同在布满哈哈镜的房间里测量身高 你总能得到一个读数,但那个读数离真相有多远,你很难有把握。研究中的 混杂偏倚 (confounding)问题变得异常棘手,我们很难分清观察到的结果究竟是治疗本身的效果,还是那些未被记录的、潜藏的病人特征所导致的。建立因果关系 (causality) 变得异常困难,这直接削弱了RWE的 证据 成色。
破碎的镜子:如何拼凑出一个完整的 健康人 ?即便我们能奇迹般地解决单个医院的数据质量问题,一个更严峻的挑战也随之而来:数据是极度碎片化的。在现代医疗体系中,一个人的健康档案并非一本完整的书,而是散落各处的、无数张破碎的纸片。
你可能在社区诊所看感冒,在专科医院治疗慢性病,在另一家影像中心做检查。每一次互动都产生一个数据孤岛。这些孤岛共同构成了一个 你 ,但没有任何一个单一的系统能够看到完整的你。这种无法获得 纵向的、全人维度的 (longitudinal, whole-person) 数据的困境,是RWD发挥其潜力的第二大障碍。
数据孤岛的 三国演义
文章为我们剖析了构成这幅破碎图景的几个关键数据源,以及它们各自的局限:
1. 电子健康记录 (EHRs):这是信息最丰富但也最分散的源头。每个医疗机构都像一个独立的王国,守护着自己的数据城池。即便它们都使用标准化的系统,但将数据安全、高效地连接起来,形成一个患者的终身健康视图,仍然是一个巨大的技术和政策挑战。
2. 医保理赔数据 (Claims Data):这像是连接各个王国的 商业航线 。它记录了患者在不同地方接受的医疗服务支付信息,能够帮助研究人员串联起一部分碎片。但它的问题在于,信息维度相对单一(主要与钱有关),且当患者更换保险计划时,这条航线就断了。支付方通常不会主动分享用户的历史数据。因此,文章提出了一个极具前瞻性的政策建议:建立并资助一个全国性的 全支付方理赔数据库 (national all-payer claims database)。这个数据库将整合来自所有支付方(公共和私人保险)的数据,为研究提供一个前所未有的完整支付视角。这虽然需要立法和资金支持,且困难重重,但其潜在价值是巨大的。文章中提及的以色列,正是凭借其全国性的数据库,在新冠疫苗接种后迅速发现了罕见的副作用,这就是一个有力的例证。
3. 死亡数据 (Mortality Data):知道谁活着,谁去世了,以及去世的时间和原因,这是所有长期健康研究的基石。然而,在美国,获取这一基础数据却出奇地困难。文章指出了一个鲜明的对比:在英国的RECOVERY试验中,研究人员可以快速接入国家死亡数据,从而在新冠大流行期间迅速评估了多种疗法的有效性。而在美国,最权威的美国国家死亡数据库(National Death Index, NDI),其数据更新频率曾经是每年一次(尽管正在努力提升至每月一次),而且使用费用高昂。这种延迟和成本,对于需要快速响应公共卫生危机的研究来说,几乎是致命的。这笔高昂的 用户费 用于补偿各州收集数据的成本,但却成为了限制其科学价值的枷锁。联邦政府需要投入资金,降低使用门槛,并改善整个死亡数据的基础设施。
超越传统边界:链接未来的数据维度
文章的视野并未止步于此。它进一步提出,要构建 全人健康 的图景,我们甚至需要超越传统的医疗数据。想象一下,在获得参与者明确同意 (consent) 的前提下,研究人员可以将健康数据与金融服务提供商的数据进行链接。这将为营养学研究开辟全新的天地,我们可以真实地看到人们的购物和餐饮习惯如何影响他们的健康。这需要建立能够和链接海量数据集的专业组织,例如文中提到的 以患者为中心的临床研究网络 (National Patient-Centered Clinical Research Network, PCORnet) 和各类专业学会的注册登记系统,它们可以成为数据链接的枢纽,支持更广泛、更创新的,包括干预性试验。
AI书记官的困境:数据采集的双刃剑面对数据采集质量不高和医生文书工作负担过重这对 孪生难题 ,人工智能 ,特别是大语言模型 (Large Language Models, LLMs),似乎是天降的 救星 。
文章设想了一个美好的场景:AI可以作为 环境智能书记官 (ambient AI scribes),在医生与患者交流时,自动捕捉对话内容,并实时生成结构化的病历草稿。这无疑能将医生从繁重的键盘敲击中解放出来,让他们有更多时间与患者进行真正的沟通。同时,通过预设的模板,AI理论上可以比疲惫的人更不知疲倦地采集更完整、更标准化的数据。
然而,这篇文章也冷静地指出了这把双刃剑锋利的另一面,即 AI书记官的困境 。
幻觉 与 沉默 的陷阱
首先,AI无法记录那些 未被讨论 的信息。如果医生因为时间紧张或认为不重要而没有询问患者的饮食习惯,那么再智能的AI也无法凭空创造出这些数据。数据的完整性瓶颈,最终还是取决于临床工作流 (care workflows) 的设计和医生的行为。
其次,也是更危险的,是AI可能产生 虚构数据 (fictitious data)。这是大语言模型固有的 幻觉 (hallucination) 问题在医学领域的致命体现。一个AI模型可能会在没有足够信息的情况下,错误地 推断 出一个它认为 合理 的症状或体征,并将其写入病历。例如,它可能听到患者提到 有点累 ,就自动在病历里添加了 乏力 这一标准医学术语,但患者的 累 可能只是前一晚没睡好,远未达到医学上 乏力 的诊断标准。这些看似微小的不准确,一旦汇入RWD的汪洋大海,就会成为污染研究结果的 毒素 ,导致错误的科学结论。
因此,简单的技术堆砌并不能解决问题。文章强调,像美国国立卫生研究院 (NIH) 和卫生高级研究计划局 (ARPA-H) 这样的资助机构,应该大力投资于设计能够巧妙利用AI工具的全新临床工作流程。这需要采用 以人为本的设计 (human-centered-design) 理念,目标是在确保数据被准确、完整记录的同时,真正减轻临床医生和患者的负担。这不仅仅是一个技术问题,更是一个系统工程和流程再造的挑战。
穿越制度迷宫:重塑游戏规则即使我们拥有了高质量、全流程的数据,并有AI加持,如果不能穿越监管和伦理的制度迷宫,RWD的潜力依然会被牢牢锁住。文章的最后一部分,将矛头指向了那些亟待演进的 游戏规则 。
为研究打开 数据交换 的大门
美国卫生与公众服务部 (HHS) 推动建立了一个名为 受信交换框架和通用协议 (Trusted Exchange Framework and Common Agreement,TEFCA)的网络,旨在实现全国范围内的健康信息交换。这无疑是打破数据孤岛的重要一步。然而,文章指出了一个关键的限制:目前的TEFCA框架,并不允许数据 仅仅为了研究目的 (solely for research purposes) 而进行交换。必须优先考虑修订TEFCA,使其明确支持并促进以研究为目的的数据交换,为RWD的流动打开合法合规的 高速公路 。
现代化监管机构:让监管跟上时代
作为美国药品和医疗器械的 守门人 ,美国食品药品监督管理局 () 的角色至关重要。FDA已经发布了一些关于在监管决策中使用RWD/RWE的指导文件,这是一个积极的信号。但文章坦言,并非所有FDA的部门都对这些创新的证据模式抱有同样开放和熟练的态度。更深层次的问题在于,FDA自身的信息技术系统已经 过时 (outdated),这使得管理机构知识、推广新方法变得异常困难。
同时,FDA也缺乏足够的专业知识和资金来主动应对AI(尤其是LLMs)这类飞速发展的技术,并为其在监管科学中的安全应用制定规则。近期HHS系统内的人员裁减和预算削减提案,更是雪上加霜,威胁到卫生机构吸引和留住相关领域专家的能力,从而可能阻碍监管科学的进步。
重新定义 风险 :为低风险研究松绑
最后,文章触及了一个深刻的伦理学问题:现行的 人类受试者保护条例 (regulations governing human-subjects protections) 如何影响RWD研究。
当前的伦理审查体系,倾向于用 绝对术语 (absolute terms)来定义研究风险。这意味着,无论研究设计如何,只要涉及人类数据,都会启动一套复杂的审查流程。然而,RWD研究的风险谱系是极为宽广的。一项利用匿名的、回顾性的RWD进行两种已上市药物效果比较的研究,其给参与者带来的风险,可能仅仅是微乎其微的隐私泄露风险。这与一项让患者试用全新化合物的I期临床试验相比,风险完全不在一个量级。
文章提出了一个更巧妙、更具适应性的伦理审查框架:将研究风险定义为 增量风险 (incremental risks)。也就是说,风险应该是 参与研究相对于接受标准治疗所额外增加的风险 。对于许多RWD研究而言,患者本身就在接受标准治疗,研究只是在后台对他们的数据进行分析,其增量风险非常低。采用这种新的风险定义,可以大大简化和加速那些对患者几乎没有额外风险、但却能产生巨大公共价值的比较效果研究 (comparative-effectiveness trials),让伦理审查回归其保护受试者的本质,而不是成为高效研究的障碍。
从碎片到智慧:绘制通往 学习型医疗 的蓝图通读全文,我们仿佛完成了一次对未来医学的深度勘探。文章为我们揭示了RWD这座金矿的真实面貌 它光芒四射,却也深埋于层层岩石之下。要开采它,需要的是系统性的变革,而非零敲碎打的修补。
作者们最后为我们清晰地描绘出了一条通往未来的路径图,它由三大支柱构成:
第一,强化源头激励:改革支付模式,将高质量的数据采集与医疗支付挂钩。让数据质量不再是医生的额外负担,而是其专业价值的体现。正如文中所建议的,可以扩大和加强CMS的 以证据开发为基础的覆盖 项目,让参与证据生成成为获得医保覆盖的前提。
第二,构建信息基建:大力投资于国家层面的数据基础设施,包括建立全支付方理赔数据库、改造升级国家死亡数据库,并扶持像PCORnet这样的数据链接中心。这相当于为国家建设一套 健康信息高速公路网 。
第三,革新治理规则:推动监管和伦理框架的现代化。让TEFCA为研究敞开大门,让FDA拥有与时代同步的技术和人才,并建立一个更灵活、更聪明的伦理审查体系,能够准确识别并管理不同研究的真实风险。
归根结底,我们追求的不仅仅是数据本身,而是数据背后蕴含的智慧。我们的最终目标,是建立一个能够持续学习和自我优化的 学习型医疗系统 (learning healthcare system)。在这个系统中,每一次临床实践都能为科学证据添砖加瓦,而每一项科学新知都能迅速反哺临床决策,最终惠及每一位患者。这条路虽然漫长且充满挑战,但正如这篇文章所昭示的,为了一个更健康、更长寿的未来,每一步的努力都至关重要。
版权声明 本网站所有注明“来源:100医药网”或“来源:bioon”的文字、图片和音视频资料,版权均属于100医药网网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:100医药网”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。 87%用户都在用100医药网APP 随时阅读、评论、分享交流 请扫描二维码下载->

- 相关报道
-
- 数字孪生细胞实验室横空出世!Cell:AI + 语法模型破解癌症与大脑发育的动态密码 (2025-07-31)
- N Engl J Med:我们身处数据金矿,为何仍为医学证据所困? (2025-07-31)
- CAR-T细胞疗法研究进展(第50期) (2025-07-30)
- 孕期遇冷竟改变脂肪“体质”?Front Endocrinol:短期温度波动会给母鼠脂肪组织留下持久印记,影响代谢适应 (2025-07-30)
- 为什么有些记忆忘不掉,但是有些却记不清?Science:揪出幕后“记忆剪辑师”,原来它一直在“切时间轴” (2025-07-29)
- 同一大脑回路,雌雄反应大不同!Cell 揭秘调控交配行为的 “性别开关” (2025-07-29)
- 近期科学家们在类器官研究领域取得的新进展! (2025-07-29)
- Science子刊:一类RNAi疗法降低HBV抗原和DNA水平同时激活免疫系统,有望终结HBV感染 (2025-07-28)
- Nature Biotechnology:解密大脑“天书”!ScISOr-ATAC技术,同时窃听细胞内部的“三重宇宙” (2025-07-28)
- Cell系列综述:GLP-1研究奠基全面总结GLP-1类药物在糖尿病和肥胖以外的健康益处 (2025-07-28)
- 视频新闻
-
- 图片新闻
-
医药网免责声明:
- 本公司对医药网上刊登之所有信息不声明或保证其内容之正确性或可靠性;您于此接受并承认信赖任何信息所生之风险应自行承担。本公司,有权但无此义务,改善或更正所刊登信息任何部分之错误或疏失。
- 凡本网注明"来源:XXX(非医药网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。本网转载其他媒体之稿件,意在为公众提供免费服务。如稿件版权单位或个人不想在本网发布,可与本网联系,本网视情况可立即将其撤除。联系QQ:896150040