您的位置:医药网首页 > 医药资讯 > 医药营销 > Nature Methods:拥抱不确定性——Ultrack用“选择困难症”智慧破解细胞追踪难题

Nature Methods:拥抱不确定性——Ultrack用“选择困难症”智慧破解细胞追踪难题

一步错,步步错:细胞追踪中的 第一宗罪

要理解 Ultrack 的巧妙之处,我们先来看看传统细胞追踪方法的 阿喀琉斯之踵 。绝大多数自动化追踪方法都遵循一个经典的两步流程:第一步,细胞分割 (cell segmentation),即在每一帧图像中,像抠图一样,精确地识别出每个细胞的轮廓和位置;第二步,细胞链接 (linking),即根据细胞在相邻帧之间的位置、大小、形状等信息,将同一个细胞串联起来,形成轨迹。

这个流程听起来合情合理,但在实践中却隐藏着一个致命的缺陷,我们可以称之为 过早承诺的陷阱 ,或是细胞追踪的 第一宗罪 。

生命世界是拥挤而复杂的。在发育中的胚胎或肿瘤组织中,细胞常常像市场里的人群一样摩肩接踵,它们的边界模糊不清,分割算法很难做到百分之百的准确。一个经典的难题是:两个紧紧贴在一起的细胞,算法是应该将它们识别为两个独立的个体,还是一个即将分裂的细胞?一旦算法在第一步做出了一个错误的 承诺 ,比如错误地将两个细胞合并成一个(欠分割,under-segmentation),或者将一个细胞分裂成两个(过分割,over-segmentation),这个错误就会像瘟疫一样在后续的追踪中传播开来。

想象一位侦探在分析一段监控录像,如果他在第一分钟就错误地认定A和B是同一个人,那么他接下来所有的推理都将建立在一个错误的基石之上,最终的结论也必然是荒谬的。细胞追踪也是如此,初始分割的微小失误,经过成百上千个时间点的累积,最终会导致轨迹的断裂、身份的互换,甚至整个细胞谱系的错乱,让我们对生命的理解产生巨大的偏差。

那么,有没有可能避免这种 过早的承诺 呢?这正是 Ultrack 方法的出发点。它提出了一种反直觉却充满智慧的策略: 如果我们不急于在第一时间做出唯一的、最终的决定呢?

选择困难症 的智慧:Ultrack如何玩转 可能性

Ultrack 的核心思想,是拥抱不确定性,将 选择困难症 变成一种优势。它不再要求分割算法在初始阶段就给出一个完美的答案,而是鼓励算法提供所有 可能 的答案,即所谓的分割假说(segmentation hypotheses)。

这些假说可以来自四面八方。例如,研究人员可以使用多种不同的分割算法,像经典的 分水岭 算法 (watershed) 和基于深度学习的CellPose模型,让它们各自给出自己的答案。即便只使用一种算法,也可以通过调整其内部参数(比如图像的对比度或亮度阈值)来生成一系列不同的分割结果。

一个绝佳的例子展示了这种策略的威力。研究人员分析了一组标记了人细胞的数据集 (YFP-TIA-1)。在这个数据集里,细胞的亮度差异很大。如果使用较高的伽马校正值(例如 = 1.0),分割模型能很好地处理较亮的细胞,但会漏掉许多暗淡的细胞;反之,如果使用较低的伽马值(例如 = 0.1),暗淡的细胞被成功识别了,但原本明亮的细胞又因为过度饱和而导致分割错误。无论选择哪个单一的参数,结果都差强人意。

而 Ultrack 的做法是,将所有四种伽马设置( = 0.1, 0.25, 0.5, 1.0)产生的分割结果全部作为 候选答案 收集起来。它发现,通过整合这些不完美的 假说 ,最终的追踪准确率 (Tracking Accuracy, TRA) 达到了惊人的0.924,检测F1分数 (F1-score) 也高达0.921。这一成绩甚至超过了其中表现最好的单一参数设置( = 0.5,其TRA为0.860)。更直观的是,错误检测的细胞数量(假阴性,false-negative)从最差情况下的418个,骤降到了整合所有假说后的仅仅69个。这有力地证明,通过考虑多种可能性,Ultrack 能够取长补短,从一堆 平庸 的答案中组合出一个 卓越 的解。

然而,同时处理成千上万个细胞在数千个时间点上的无数种分割可能性,这听起来像是一场计算灾难。Ultrack 的巧妙之处在于它使用了两种强大的数学工具来驯服这种复杂性。

第一个工具是超度量轮廓图(Ultrametric Contour Maps, UCMs)。这是一种极其高效的数据结构,可以把所有嵌套的、层级化的分割假说压缩到一张图里。你可以把它想象成一张地形图,细胞与细胞之间的边界被描绘成一道道 墙壁 ,墙壁的高度代表了这个边界是真实细胞边界的可信度。UCMs 用一种极为紧凑的方式,编码了从 将整个胚胎看作一个细胞 到 将每个像素看作一个细胞 之间的所有可能性,极大地降低了存储和计算的负担。

第二个工具是整数线性规划 (Integer Linear Programming, ILP)。这是一个强大的优化框架,用于在巨大的组合可能性中寻找最优解。Ultrack 将整个细胞追踪问题转化为了一个大型的 ILP 问题。它的目标是:找到一套最优的细胞轨迹组合,使得这套轨迹的 时间连续性 得分最高,同时必须遵守基本的生物学规则,比如一个细胞最多分裂成两个,细胞不能融合,也不能凭空出现或消失。这就像一位顶级的物流规划师,为成千上万个包裹规划最优的运输路线网络,既要保证效率最高,又要遵守 卡车不能同时在两个地方 等物理规则。

通过这种 拥抱不确定性 的哲学和强大的数学工具,Ultrack 成功地将细胞追踪从一个 对与错 的判断题,变成了一个 好与坏 的优化题,从而在根本上提升了追踪的稳健性。

三个臭皮匠,赛过诸葛亮:多色多算法融合的威力

Ultrack 的这种开放和包容的框架,使其能够轻松地整合来自不同信息源的 智慧 。研究人员通过一个精巧的多色细胞追踪实验,淋漓尽致地展现了这种 融合 的力量。

他们使用了一种基因工程技术,为转移性细胞 (MDA-MB-231) 随机标记上红、绿、蓝三种颜色。这样,即使细胞形态相似且紧密聚集,它们不同的 颜色身份证 也能帮助我们区分彼此。这个实验的设计,旨在回答一个问题:我们能把不同分割算法的优势和多色信息的优势结合起来,达到 1+1 2 的效果吗?

研究人员设计了一系列循序渐进的对比实验,结果令人印象深刻:

第一步:单通道,单算法的 常规操作

他们首先将多色图像转换为灰度图,然后仅使用强大的 CellPose 算法进行分割和追踪。结果差强人意,追踪准确率 (TRA) 仅为0.544,并且产生了高达16,325个漏检细胞 (false negatives)。这说明,在复杂的细胞环境中,即便是顶级的分割算法,单打独斗也力不从心。

第二步:引入多通道信息的 小升级

接着,他们不再使用灰度图,而是在红、绿、蓝三个通道上分别应用 CellPose。细胞的颜色信息有效地帮助区分了彼此,性能有所提升,但仍不理想。

第三步:引入多算法的 外援

研究人员意识到,CellPose 虽然在精确分割细胞轮廓方面表现出色,但有时会漏掉一些信号较弱的细胞。于是,他们引入了一个相对 古老 但有用的帮手 分水岭算法 (watershed)。分水岭算法虽然在分割精度上不如 CellPose,但对暗淡细胞的检测更为敏感。

第四步:终极融合 多通道、多算法的 联合作战

最后,Ultrack 同时接收来自三个颜色通道的、由 CellPose 和分水岭两种算法共同生成的全部分割 假说 。不仅如此,它还将细胞的 颜色 作为一个重要的特征,用于判断相邻帧之间的细胞是否为同一个体。

结果是惊人的。追踪准确率 (TRA) 一路飙升,最终达到了0.979的高水平。漏检的细胞数量从最初的16,325个锐减至714个,而错误识别的细胞(假阳性,false-positives)也从5,549个降低到831个。这就像小时候的故事:一个诸葛亮(CellPose)解决不了的问题,通过联合多个 臭皮匠 (watershed 和不同颜色通道的信息),最终被完美攻克。

这个实验的意义远不止于提升了几个百分点的准确率。它揭示了一种全新的研究范式:研究人员不再需要煞费苦心地去寻找或训练一个 完美 的、适用于所有情况的分割模型。他们可以像组建一个 复仇者联盟 一样,将多个各有所长的 英雄 算法组合在一起,让 Ultrack 这位 神盾局局长 来协调指挥,取长补短,发挥出团队的最大威力。

无中生有:从模糊光影到清晰谱系

Ultrack 的强大之处,不仅在于它能 兼收并蓄 ,还在于它能在看似 信息贫乏 的数据中挖掘出生命的轨迹。研究人员通过两个极具挑战性的任务,展示了 Ultrack 无中生有 的能力。

任务一:为 无标签 细胞赋予生命

荧光标记虽然是观察细胞的利器,但它也像一把双刃剑。高强度的激光照射会对细胞产生光毒性 (phototoxicity),长时间观察下的细胞可能已经不是在自然状态下活动了。因此,无标记成像 (label-free imaging) 技术,如定量相位成像(Quantitative Phase Imaging, QPI),受到了越来越多的关注。这种技术对细胞更 温柔 ,但生成的图像对比度低,信息模糊,传统的分割算法在上面常常 失明 。

研究人员使用了一种名为VSCyto2D的人工智能模型,对原始的 QPI 图像进行 虚拟染色 (virtual staining),即预测出细胞核和细胞膜可能在的位置,并生成对应的强度图。此时,并没有明确的细胞边界,只有一片模糊的光影。

令人惊讶的是,Ultrack 甚至不需要明确的 分割 结果。研究人员直接将这张虚拟染色的强度图作为输入 图中强度高的区域代表可能是细胞边界。Ultrack 利用其内部的 UCM 算法,从这片连续的强度景观中,直接构建出了一系列分割假说,并成功地完成了追踪。

结果对比是颠覆性的。对于原始的 QPI 图像,即便是 CellPose 这样的先进模型也束手无策,其检测 F1 分数仅为0.347。而 Ultrack 结合虚拟染色技术的追踪结果,F1 分数飙升至0.812。它成功地识别并追踪了数千个在原始图像中几乎 隐形 的细胞。这表明,Ultrack 的核心算法是如此强大,它甚至可以跳过 分割 这一步,直接从图像的底层特征中重建出细胞的谱系。

任务二:为 瞬移 的细胞弥补时间的断层

在活体成像中,研究人员常常需要在成像速度、视野大小和分辨率之间做出艰难的取舍。有时为了获得更大的视野,不得不降低拍照的频率(即时间分辨率)。这就导致了一个问题:在相邻两张照片之间,一些移动迅速的细胞可能已经 瞬移 到了一个很远的位置,让追踪算法误以为它消失了,而在另一个地方又冒出了一个新细胞。

为了解决这个问题,Ultrack 整合了时间配准 (temporal registration)的功能。它通过计算一个 光流场 (vector field),来预测整个组织或细胞群体的集体运动趋势。在进行细胞链接时,它会先根据这个运动趋势对细胞的位置进行 补偿 ,然后再计算匹配度。

在一个赤拟谷盗甲虫 (T. castaneum) 胚胎的数据集中,研究人员进行了 极限测试 。他们故意每隔10帧才进行一次追踪,此时,一些细胞的移动距离超过了150个像素,是其自身直径的好几倍。在不进行运动补偿的情况下,追踪准确率 (TRA) 只有惨淡的0.443。而一旦开启了 Ultrack 的时间配准功能,TRA 立刻跃升至0.623。这个功能就像为追踪算法安装了 惯性导航系统 ,即使在时间信息稀疏的情况下,也能大致预测出细胞的去向,极大地提升了长距离追踪的成功率。

终极试炼:征服TB级胚胎与 像素级 追踪

在展示了其多才多艺的 基本功 之后,Ultrack 迎来了两场最严苛的 终极试炼 ,以证明它在真实世界顶级难题面前的实力。

斑马鱼胚胎发育的 马拉松

这是一项艰巨的任务:对一个正在发育的斑马鱼胚胎进行长达13.2小时的连续成像,生成了一个高达3.7 TB的四维数据集。这不仅仅是数据量大,更在于其内部的复杂性:数万个细胞在快速地分裂、迁移,形成各种组织和器官。

Ultrack 不仅成功地处理了这一海量数据,更展现了其惊人的可扩展性。在高性能计算集群 (HPC) 上,整个分析过程仅需8.2 小时。而更令人振奋的是,即便是放在一台只有32GB内存的普通笔记本电脑上,通过巧妙的 核外处理 (out-of-core processing) 技术,Ultrack 也能在5天内完成任务。这意味着,顶级的细胞追踪分析不再是拥有超级计算机的顶尖实验室的专利。

分析结果同样惊人。研究人员评估了追踪的 无错轨迹长度 ,发现在三个独立的斑马鱼胚胎中,平均而言,有50%的细胞轨迹能够被完美追踪长达62 帧(约合1小时的发育时间)。在细胞数量以指数级增长,环境日益拥挤的情况下,能达到如此长的持续准确追踪,充分证明了 Ultrack 的稳健性。

为了进一步验证其在密集环境下的准确性,研究人员还设计了一个极为巧妙的 稀疏标记 (sparse labeling) 验证实验。他们在一个全身细胞都表达绿色荧光蛋白的斑马鱼胚胎中,随机地给极少数细胞额外标记上红色荧光。这样,他们就有了一批 卧底 细胞。在拥挤的绿色细胞海洋中追踪这些稀疏的红色细胞,要比追踪所有细胞容易得多,因此可以作为接近完美的 黄金标准 (ground truth)。

他们用这个黄金标准来评判 Ultrack 在追踪所有绿色细胞时的表现。结果显示,在长达500帧的时间跨度里,Ultrack 的总错误率仅为0.073。这个成绩,优于先前一项里程碑式研究在更短的150帧内创下的0.078的基准。这证明,Ultrack 具备在超长时间跨度上维持高精度追踪的非凡能力。

斑马鱼侧线神经丘的 精雕细琢

如果说追踪整个胚胎是一场考验耐力的马拉松,那么追踪一个小型器官 斑马鱼的侧线神经丘 (neuromast) 则是一场考验精度的 外科手术 。神经丘是斑马鱼的感觉器官,仅由数十个细胞组成,但其内部的细胞分裂、死亡和迁移,对于器官的形成和稳态至关重要。在这里,任何一个微小的追踪错误都可能导致对器官发育机制得出错误的结论。

研究人员利用双色标记(细胞核和细胞膜)对神经丘进行了长达41.7小时的成像,并使用 Ultrack 重建了其中71个细胞的完整谱系。结果达到了令人难以置信的精准度:追踪准确率 (TRA) 高达0.9989!

为了进行公平的比较,他们将同样的、由 CellPose 生成的分割结果,分别输入给 Ultrack 和另一款广受推崇的经典追踪软件 TrackMate。尽管输入完全相同,结果却大相径庭。TrackMate 产生了721个错误,而 Ultrack 只有279个,足足减少了442个需要手动修正的错误。

究其原因,正是两者设计哲学的根本不同。TrackMate 忠实地接受了 CellPose 给出的(有时是错误的)分割结果,并在其基础上进行链接。而 Ultrack 则将这些分割结果仅仅看作是 假说 之一,当它发现将一个被过度分割的细胞(例如,CellPose 错误地将一个细胞识别为两个)重新合并起来,能够更好地解释细胞在时间上的连续性时,它会毫不犹豫地 纠正 上游的分割错误。这种独特的 纠错 能力,使得 Ultrack 能够在不完美的输入之上,实现近乎完美的输出。

一个为探索而生,而非为专家独享的工具

一项计算工具的伟大,不仅在于其技术上的先进性,更在于它能否被广大的研究者轻松使用,从而真正转化为科学发现的动力。Ultrack 的开发团队深谙此道。

他们不仅将 Ultrack 打包成一个易于安装和使用的 Python 库,还为它开发了在生物图像分析领域最流行的两个平台 Fiji 和 Napari的图形化界面插件。这意味着,即便是一位不擅长编程的生物学家,也只需通过鼠标点击,就能享受到 Ultrack 带来的强大分析能力。从笔记本电脑到超级计算机,从图形界面到命令行,Ultrack 提供了全方位的解决方案,真正实现了高性能细胞追踪技术的 民主化 。

回顾 Ultrack 的整个设计,我们看到的是一种深刻的智慧。在面对复杂系统时,拥抱不确定性、整合多方信息、在全局时空中寻找最优解,可能比固守于局部的、单一的 最佳 答案更为有效。

有了 Ultrack 这样的工具,研究人员可以更有信心地去绘制整个脊椎动物的细胞命运图谱,去观察细胞如何精确地追捕并摧毁,去揭示断肢再生过程中细胞的精妙协作。

版权声明 本网站所有注明“来源:100医药网”或“来源:bioon”的文字、图片和音视频资料,版权均属于100医药网网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:100医药网”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

87%用户都在用100医药网APP 随时阅读、评论、分享交流 请扫描二维码下载->

医药网新闻
返回顶部】【打印】【关闭
扫描100医药网微信二维码
视频新闻
图片新闻
医药网免责声明:
  • 本公司对医药网上刊登之所有信息不声明或保证其内容之正确性或可靠性;您于此接受并承认信赖任何信息所生之风险应自行承担。本公司,有权但无此义务,改善或更正所刊登信息任何部分之错误或疏失。
  • 凡本网注明"来源:XXX(非医药网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。本网转载其他媒体之稿件,意在为公众提供免费服务。如稿件版权单位或个人不想在本网发布,可与本网联系,本网视情况可立即将其撤除。联系QQ:896150040