Nature Methods:细胞的“秘密自拍”!一部揭示近两万个基因功能的视觉百科全书 |
![]() |
如果我们想了解一座城市的运作方式,仅仅查看它的地图是不够的。我们可能需要深入城市的每个角落,观察交通如何流动,商业区如何繁忙,居民区如何生活。同样,要理解一个基因的功能,只看它的序列是不够的,我们需要看到当这个基因被改变时,细胞这座 微观城市 会发生什么变化。而 细胞画像 (Cell-Painting) 技术,就是实现这一目标的强大工具。
这项技术堪称一门细胞学的 彩妆艺术 。研究人员使用六种不同的荧光染料,为细胞内的八个关键部件进行 染色 ,如同给细胞化上了一套精致的妆容。
Hoechst染料会将细胞核 (nucleus) 染成蓝色,这是细胞的 司令部 ,储存着遗传物质DNA。Concanavalin A标记出内质网 (endoplasmic reticulum, ER),这是细胞内的 蛋白质加工厂 。MitoTracker染料则会点亮线粒体 (mitochondria),即细胞的 能量工厂 。Phalloidin与WGA (wheat germ agglutinin)两种染料组合,共同勾勒出细胞骨架 (cytoskeleton) 和高尔基体 (Golgi) 的轮廓,它们是细胞的 支撑结构 与 物流中心 。SYTO 14染料则让细胞质中的RNA和核仁 (nucleoli) 显现出来,这些是执行基因指令的关键分子和结构。
当细胞被这套组合染料 画 过之后,在高通量显微镜下,它就变成了一幅色彩斑斓的艺术品。但这还不是终点。更关键的一步是,计算机软件会对这些图像进行分析,从每个细胞中提取数千个形态学特征 (morphological features)。这些特征包罗万象,远不止于简单的 大小 或 形状 ,还包括了细胞核的纹理、线粒体的分布模式、蛋白质的聚集状态、不同细胞器之间的空间关系等等。所有这些特征组合在一起,就构成了一个细胞的 形态学画像 (morphological profile) 一个由数千个数字组成的、高度复杂的 指纹 。
这个 指纹 就是细胞在特定状态下的独特特征。通过比较不同基因被扰动后细胞 指纹 的异同,研究人员就能推断出这些基因可能拥有的功能。如果改变基因A和改变基因B导致了细胞非常相似的 指纹 ,那么这两个基因很可能在功能上有所关联,或许它们是同一个生物学通路上的 合作伙伴 。正是这种基于海量视觉信息的分析方法,让每一个基因都有了 开口说话 的机会,用它们对细胞形态的改变,来讲述自己的功能故事。
双管齐下:当基因被 调高 或 静音 时要让基因 开口说话 ,首先需要对它进行 扰动 (perturbation)。在这项研究中,研究人员巧妙地采用了两种互补的策略来扰动基因:基因过表达 (overexpression) 和基因敲除 (knockout)。
基因过表达,通过开放阅读框 (Open Reading Frame, ORF) 技术实现,相当于将某个基因的 音量 调到最大。研究人员将编码特定蛋白质的基因序列通过慢病毒载体 (lentivirus) 送入细胞,使得该蛋白质被大量生产。这种方法的独特优势在于,即使某个基因在所研究的细胞类型(这里是人细胞U-2 OS)中原本不表达或表达量很低,通过强制过表达,我们依然能观察到它的功能性影响。
基因敲除,则利用了强大的CRISPR-Cas9基因编辑技术,相当于将某个基因 静音 。研究人员使用精心设计的向导RNA (guide RNA),引导Cas9蛋白到基因组的特定位置进行切割,从而破坏该基因,使其无法再生产功能性蛋白质。这种方法非常适合研究那些对细胞生存和功能至关重要的基因。如果一个基因是细胞生命活动的关键齿轮,那么一旦将它移除,整个 细胞机器 的运转必然会受到显著影响。
这两种策略并非简单的重复,而是互为补充的 双重火力 。例如,一个基因可能属于一个庞大的家族,家族成员之间功能高度冗余。此时,仅仅敲除其中一个成员,可能不会引起明显的细胞形态变化,因为其他 兄弟姐妹 会立刻顶上。但如果过表达这个基因,就可能产生一种 显性负效应 (dominant-negative effect),即过量的、可能是不完全功能的蛋白质会干扰整个家族的正常运作,从而揭示出其潜在功能。
JUMP联盟的研究规模是空前的。他们总共测试了15,243个不同的人类基因。其中,有12,609个基因通过ORF技术被过表达,有7,975个基因通过CRISPR技术被敲除。值得注意的是,有5,343个基因同时接受了这两种方法的 考验 ,这为直接比较两种扰动方式的效果提供了宝贵的数据。
结果是惊人的。在所有被测试的基因中,高达68%(即 10,352个 基因)在被扰动后,都产生了可被 细胞画像 技术检测到的形态学变化,研究人员称之为具有 表型活性 (phenotypic activity)。这意味着,这种方法极其灵敏,能够捕捉到非常细微的细胞变化。具体来看,通过CRISPR敲除的基因中,有70%显示出表型活性;而通过ORF过表达的基因中,这一比例为56%。这些数据不仅证明了两种扰动策略的有效性,也暗示了它们在揭示基因功能方面的不同侧重和能力。一个基因在被 静音 时可能引发剧变,而在被 调高 时则可能影响甚微,反之亦然。正是这种双管齐下的策略,让这份形态学图谱变得更加全面和立体。
从 物以类聚 到 基因社交网络有了海量的细胞 自拍 和它们对应的数字 指纹 ,研究人员如何从中淘金呢?他们遵循一个简单而深刻的原则 物以类聚,人以群分 ,在基因世界里,这被称为 因相似性定罪 (guilt-by-similarity)。这个逻辑的核心是:如果在功能上相关的基因,它们对细胞形态造成的影响也应该是相似的。
想象一下一个庞大的社交网络。如果你发现两个人,他们的朋友列表高度重合,都喜欢同样的音乐,常去同样的餐厅,那么你很自然会推断,这两个人很可能彼此认识,或者在同一个圈子里活动。研究人员正是用这种方式来构建一个 基因社交网络 。他们计算每两个基因扰动后产生的形态学画像之间的余弦相似度 (cosine similarity),这个值越高,代表两个基因引发的细胞表型越相似,它们在功能上相关的可能性就越大。
但这引出了一个关键问题:我们如何知道这个新构建的 基因社交网络 是真实可靠的,而不是一堆由技术误差产生的随机巧合?
为了回答这个问题,研究人员进行了一项非常巧妙的验证。他们引入了一个 外部参照系 药物重定位知识图谱 (Drug Repurposing Knowledge Graph, DRKG)。你可以将DRKG理解为一个已经存在的、汇集了大量已发表科学文献、数据库和实验证据的 生物学知识库 。它记录了基因与基因之间、基因与疾病之间、蛋白质与蛋白质之间已知的相互作用和联系。
验证过程就像是用一份已知的标准答案来批改一份新的答卷。研究人员系统性地比较了他们的 形态学相似性 数据和DRKG中的 已知功能关联 。结果令人振奋:在ORF和CRISPR两个数据集中,都出现了非常一致的强烈趋势 那些在形态学上高度相似的基因对,在DRKG知识库中存在已知功能关联的可能性,要远远高于随机选择的基因对。
让我们来看具体数据。当研究人员观察那些形态学相似度极高(例如余弦相似度绝对值大于0.8)的基因对时,他们发现,大约有 40%到50% 的这类关系,是可以在DRKG知识库中找到证据支持的。这意味着,它们的关联性已经被现有的科学知识所证实。相比之下,如果随机地将基因进行配对,只有大约 10% 的配对能在知识库中找到关联。这个巨大的差异强有力地证明了, 细胞画像 所揭示的基因间关系,绝非偶然,而是深刻反映了真实的生物学规律。
然而,这个结果最激动人心的部分,并非是那被验证的40-50%,而是那剩下的一半以上 那些在形态学上高度相关,但在现有知识库中却找不到任何记载的 新大陆 。这些全新的、前所未见的基因关联,正是这份图谱最宝贵的财富。
从宏观地图到微观寻宝:几个精彩的 寻宝 案例如果说整个JUMP数据集是一幅宏观的世界地图,那么其中每一个新发现的基因关联,就是一次深入未知领域的微观探险。研究人员展示了几个精彩的案例,让我们得以一窥如何利用这张地图进行 寻宝 。
案例一:转录 刹车 MYT1与它的新目标RNF41
在CRISPR敲除数据集中,研究人员发现了一个非常强的 反相关 信号:当基因MYT1 被敲除时,细胞呈现出的形态,与基因 RNF41 被敲除时的形态,几乎是完全相反的。这就像一个跷跷板的两端。MYT1 已知是一个转录抑制因子,它的作用就像是基因表达的 刹车 。基于这种跷跷板式的形态学关系,研究人员提出了一个大胆而直接的假设:MYT1 的功能之一,可能就是直接 刹车 ,即抑制 RNF41 基因的转录。
这是一个可以被实验验证的漂亮假说。为了证实这一点,他们进行了后续的CUT RUN实验(一种用于研究蛋白质与DNA相互作用的技术)。结果完美地印证了他们的猜想:实验发现,MYT1蛋白确实会结合在小鼠视网膜细胞中RNF41基因的启动子区域(即基因的 开关 区域)。这个发现是一个教科书式的例子,展示了如何从高通量形态学筛选出发,产生一个全新的、可检验的生物学假说,并最终通过实验证实它。一个之前未知的基因调控关系,就这样被清晰地揭示了出来。
案例二:Hippo信号通路的新 朋友圈
Hippo信号通路是细胞生物学中的明星通路,它在调控器官大小、细胞增殖和凋亡中扮演着核心角色,其失调与多种癌症的发生密切相关。在这份数据图中,研究人员毫不意外地发现,许多已知的Hippo通路成员,如 YAP1、WWTR1 (TAZ) 和 STK3,在被扰动后呈现出高度相似的形态学特征,在图谱上聚集在了一起,形成了一个紧密的 俱乐部 。这再次验证了这张图谱的可靠性。
但真正的宝藏在于这个 俱乐部 的新面孔。研究人员注意到,还有一些之前与Hippo通路鲜有关联的基因,比如CEP72、IL20RB和MTMR9,也与YAP1等核心成员展现出强烈的形态学正相关。它们像是这个 俱乐部 里新来的朋友,虽然背景不详,但行为举止却与老会员们高度一致。这一发现强烈暗示,这些基因可能也是Hippo通路网络中未被发现的参与者或调控者。它们的功能可能与细胞增殖、组织生长等关键过程有关,值得研究人员投入更多精力进行深入研究,以揭开它们在Hippo通路以及相关疾病中的潜在作用。
案例三:一个与癌症和线粒体功能相关的神秘 三人组
有时,这张地图揭示的不是一个已知通路的新成员,而是一整个全新的、功能未知的 大陆 。研究人员发现,有三个基因 ECH1、UQCRFS1 和 SARS2 在ORF过表达和CRISPR敲除两种模式下,都表现出极强的正相关性。这意味着无论它们被 调高 还是 静音 ,其对细胞形态的影响都非常一致。
这本身就很不寻常,更令人好奇的是,这三个基因的已知功能似乎风马牛不相及。ECH1 是一种参与脂肪酸代谢的酶;UQCRFS1 是线粒体呼吸链复合物III的一个关键亚基;而 SARS2 则是一种在线粒体中负责将丝氨酸连接到其tRNA上的合成酶。它们为何在形态学上如此 步调一致 ?
通过挖掘其他公共数据库,线索开始浮现。研究人员发现,在多种系的RNA表达数据中,这三个基因的表达水平也高度相关。进一步分析显示,这个基因簇与线粒体功能和癌症过程紧密相连。例如,另一个基因LINC00473的表达变化,会同时影响这个 三人组 中多个成员的活性,而LINC00473已知是线粒体功能和能量代谢的重要调控者。UQCRFS1近期也被确定为的一个潜在生物标志物和药物靶点。
所有这些线索汇集在一起,描绘出了一幅新的图景:这三个看似无关的基因,很可能共同构成了一个新的功能模块,这个模块与线粒体的稳态、细胞代谢以及癌症的进展密切相关。这张形态学图谱,就如同一个高明的侦探,将散落在不同地方的孤立线索串联起来,指向了一个隐藏的、值得深入调查的 犯罪团伙 。
案例四:为 大脑特供 基因TSC22D1寻找新线索
最后一个案例则展示了这张图谱如何为我们理解特定组织中的基因功能提供意想不到的线索。研究人员发现了一个有趣的基因簇,其中包含了GPR176、CHRM4和MYT1等已知与神经系统发育和功能密切相关的基因。然而,在这个簇中,他们发现了一个 局外人 TSC22D1。
根据现有的注释信息,TSC22D1 的功能主要与细胞凋亡、肿瘤抑制和应激反应有关,似乎与神经功能没有直接联系。但在这张形态学图谱上,它却与一群 神经专家 紧密地反相关。这种强烈的形态学关联性暗示,TSC22D1 可能在神经元中扮演着一个之前被我们忽略了的重要角色。
这个猜测很快得到了其他数据的支持。通过查询人类蛋白质图谱 (Human Protein Atlas) 数据库,研究人员发现, TSC22D1 基因在人体组织中,正是在大脑中表达水平最高的。这与它在形态学上与神经基因的关联形成了完美的呼应。更深入的挖掘还发现,在与相关的细胞模型中,TSC22D1 的表达水平也受到显著影响。
这一系列的发现,为TSC22D1这个基因的功能研究开辟了一个全新的方向。它不再仅仅是一个普通的 应激反应 基因,而很可能是一个在维持大脑功能、甚至与神经退行性疾病发生发展相关的关键角色。这张细胞形态图谱,就像一位向导,将我们引向了一片熟悉的基因森林中一个未曾被探索过的角落。
不止于数据:一份面向全球研究者的 开放式藏宝图这项研究最伟大的意义,或许并不仅仅在于它所揭示的几个具体发现,而在于它为整个科学界提供了一份前所未有的、极其宝贵的公共资源。JUMP联盟深知这份数据的价值,因此他们选择了一种完全开放的姿态,将所有原始图像、处理后的形态学画像数据,以及分析工具,全部公之于众,免费提供给全世界的研究人员使用。
他们将海量数据上传到了亚马逊云服务 (AWS) 的开放数据平台上,并建立了多个用户友好的在线门户网站,如布罗德研究所 (Broad Institute) 的 JUMP细胞画像中心 (JUMP Cell Painting Hub) 和Ardigen公司开发的phenAID浏览器。这意味着,任何一名研究人员,无论他是否擅长分析,都可以轻松地访问这个数据库。他可以输入自己感兴趣的基因,立刻就能看到当这个基因被扰动后,细胞长什么样,以及在形态学上,哪些其他基因与它最相似。这极大地降低了数据探索的门槛,使得这张 藏宝图 真正成为人人可用的工具。
当然,研究人员也坦诚地指出了这项研究的局限性。首先,所有的实验都是在一种细胞系(U-2 OS)上完成的。一个基因在骨肉瘤细胞中的功能,可能与它在神经元或肝细胞中的功能不尽相同。其次,实验只观察了扰动后单个时间点(ORF为48小时,CRISPR为96小时)的细胞状态,而许多生物学过程是动态变化的。最后,尽管CRISPR技术已经非常精确,但脱靶效应等技术伪影的可能性依然存在。
然而,这些局限性非但没有削弱这项工作的价值,反而为未来的研究指明了方向。我们可以想象,未来的研究将把 细胞画像 技术应用到更多的细胞类型中,比如、细胞、神经元等;可以进行时间序列的动态观察,捕捉基因功能在时间维度上的变化;还可以结合其他组学技术,如转录组学和蛋白质组学,构建一个更加立体、多维度的生命功能图谱。
JUMP联盟的这项工作,不是一个故事的结束,而是一个伟大时代的开端。它为我们提供了一部可以不断被查阅、被注释、被扩充的 活的 基因功能百科全书。它就像人类历史上第一次绘制出的精确世界地图,虽然还有许多空白的内陆等待探索,但它已经为后来所有的探险家提供了导航的蓝本。如今,全球的生命科学研究者们,都手持着这份珍贵的地图,准备开启属于他们自己的、对生命未知领域的伟大航行。而那些隐藏在基因序列深处的秘密,正在等待着被一一揭开。
版权声明 本网站所有注明“来源:100医药网”或“来源:bioon”的文字、图片和音视频资料,版权均属于100医药网网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:100医药网”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。 87%用户都在用100医药网APP 随时阅读、评论、分享交流 请扫描二维码下载->

- 相关报道
-
- Nature Methods:细胞的“秘密自拍”!一部揭示近两万个基因功能的视觉百科全书 (2025-08-12)
- 广西规范整合产科及麻醉类医疗服务名目价钱的关照 (2025-08-12)
- 反超OpenAI,百川开源大模型医疗能力登顶世界第一 (2025-08-12)
- 《自然》:科学家首次发现,EB病毒让B细胞和T细胞涌入大脑,引发多发性硬化症! (2025-08-12)
- Nature子刊:哈佛大学研究发现,猪油/牛油等动物油会抑制免疫系统,促进癌症发展 (2025-08-12)
- 复旦大学基因治疗耳聋临床研究登上Cell子刊封面 (2025-08-12)
- Science:使用AI模型预测哪些启动子突变会改变基因表达 (2025-08-12)
- AMI Pharm推动AYP-101进入三期临床,开启减脂注射药新纪元 (2025-08-11)
- 关于举办“人工智能赋能药物研发全流程技术应用’高级研修班的通知 (2025-08-11)
- 己糖激酶2通过蛋白激酶活性促进外泌体生成参与急性缺血性脑卒中损伤 (2025-08-11)
- 视频新闻
-
- 图片新闻
-
医药网免责声明:
- 本公司对医药网上刊登之所有信息不声明或保证其内容之正确性或可靠性;您于此接受并承认信赖任何信息所生之风险应自行承担。本公司,有权但无此义务,改善或更正所刊登信息任何部分之错误或疏失。
- 凡本网注明"来源:XXX(非医药网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。本网转载其他媒体之稿件,意在为公众提供免费服务。如稿件版权单位或个人不想在本网发布,可与本网联系,本网视情况可立即将其撤除。联系QQ:896150040