您的位置:医药网首页 > 医药资讯 > 医药行业分析 > 科学家研究了3000名中国人 发现了2500万个新突变.

科学家研究了3000名中国人 发现了2500万个新突变.

资料来源:丁香学术2021-11-25 08:17

遗传变异特征的分析和遗传变异谱的构建是研究种群、种群史、医学遗传学和基因型-表型关联的基础。自2003年人类基因组信息首次发布以来,许多大规模全基因组测序(WGS)项目在西方国家率先开展,产生了数量众多、资源多样的群体遗传变异。这是因为从大队列WGS资源中构建单体型参考面板是为了促进全基因组关联研究

遗传变异特征的分析和遗传变异谱的构建是研究种群、种群史、医学和基因型-表型关联的基础。

自2003年人类基因组信息首次发布以来,许多大规模的全基因组测序(WGS)项目在西方国家处于领先地位,产生了大量多样的群体变异资源。这是因为从WGS资源的大排长龙中构建单体型参考面板是促进全基因组关联研究(GWASs)的一种有意义且具有成本效益的方法。然而,到目前为止,作为世界上最大的民族,中国汉族人口仍然没有具体的参考标准。

虽然之前的一些研究也关注了中国人群,但这些研究要么样本量有限,地理覆盖面不广,要么基因组覆盖面较浅,这些都限制了其作为参考的可靠性。

在2020年的一项针对中国人的研究中,ChinaMAP项目提供了10000多人的高深度(40X)全基因组测序数据和表型的系统分析,但该项目侧重于此,他们没有根据该研究建立单体型参考面板。汉族是东亚乃至世界上最大的民族,约占全球人口的20%,占中国大陆人口的92%。因此,建立完整、高质量的汉族群体遗传变异数据库和参考图谱势在必行。这样的资源将有助于分析人口结构和人口历史,促进对世界上最大人口的研究。

中国科学院生物物理研究所徐涛院士和何顺民研究员合作发表了题为《纽约大学基因组资源:基于全基因组测序的深度变异图谱和in Cell Reports参考面板》的论文。中国人口文章系统介绍了一个名为“女娲”的基因组资源,数据来自中国23个省份约3000人的深WGS。

这个数据资源是一个高质量的公开可用的参考资料,专门针对中国人口。目前,它对世界范围内与汉族人群相关的研究具有最好的参考价值,也为中国人群和疾病的研究提供了有益和可靠的支持。

主要研究内容

基于中国大人口队列的深WGS数据

NyuWa基因组资源包括2999个不同中国样本的WGS数,测序深度高。样本来自中国23个行政区,包括17个省、2个自治区和4个直辖市。大部分样品来自上海、广东和北京。基因组比对和消除重复后,实际基因组的覆盖深度中位数为26.23。根据性染色体的基因组覆盖率,可以清楚地确定每个受试者的性别,包括1335名女性和1664名男性。

根据纽约大学的数据,发现了2500万个新变种。

经过严格的质量控制,研究人员鉴定出7106万个SNPs和819万个InDels,并对其进行了综合评述。与其他变异信息公共数据库相比,NyuWa数据集包含2500万个新变异,包括2310万个SNPs (32.5%)和190万个位点插入(23.3%)。进一步分析发现,蛋白质编码基因共有3190万个突变位点,其中85.7万个位于CDS区,110万个位于UTR,3000万个位于内含子。lncRNA外显子有478万个突变。

随后,为了评估NyuWa参考小组的基因分型性能,研究小组使用了来自人类基因组多样性项目(HGDP)的亚洲人群的基因分型数据和高覆盖率WGS数据作为测试数据集。通过对比分析,他们发现NyuWa在中国人群相关基因组的研究方面优于其他现有的参考数据库。同时,NyuWa适合中国南方和北方的人。

变异体的临床价值

为了进一步说明NyuWa资源在改善人类健康方面的价值,他们进一步评价了其在基因突变相关疾病研究和医学应用方面的应用价值。不出所料,纽约大学和公共数据集的大多数致病变异是一致的,属于罕见变异。致病变异通常频率较低,而等位基因频率高的可能与常见疾病有关。

此外,他们还在ClinVar数据库中发现了一些与致病性解释相矛盾的变异体,这些变异体在NyuWa资源中显示出更高的等位基因频率。例如,以1%的等位基因频率为阈值,rs182677317和rs369849556这两个变异体被认为与罕见疾病睫状体运动障碍有关,而NyuWa数据集中的高等位基因频率(1%)表明这些变异体可能没有致病性。因此,这些结果表明NyuWa数据集中变异的等位基因频率可以为疾病相关变异的研究提供额外的参考。

他们还评估了ADME核心基因已知药物基因组位点的等位基因频率,这些位点可能影响中国不同省份和世界各地药物的疗效和安全性。结果表明,中国和世界不同地区不同群体间等位基因频率存在显著差异。

比如世界卫生组织推荐的治疗结核病的药物异烟肼,主要是被NAT2酶(N-乙酰转移酶2)乙酰化代谢,代谢的速率是由多种因素决定的。代谢缓慢的患者发生肝毒性的风险更高。NAT2中有很多SNP位点,形成不同的等位基因,其中一个叫做NAT2*12,是一个快速乙酰化的等位基因。研究人员发现,NAT2*12的等位基因频率在中国和东亚的不同省份一直很高(接近100%),而在其他人群中频率较低。这说明中国人在使用异烟肼前检测NAT2*12的必要性不如其他人。

医药网新闻
返回顶部】【打印】【关闭
扫描100医药网微信二维码
视频新闻
图片新闻
医药网免责声明:
  • 本公司对医药网上刊登之所有信息不声明或保证其内容之正确性或可靠性;您于此接受并承认信赖任何信息所生之风险应自行承担。本公司,有权但无此义务,改善或更正所刊登信息任何部分之错误或疏失。
  • 凡本网注明"来源:XXX(非医药网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。本网转载其他媒体之稿件,意在为公众提供免费服务。如稿件版权单位或个人不想在本网发布,可与本网联系,本网视情况可立即将其撤除。联系QQ:896150040