斯隆-凯特琳研究所Lareau等质疑Nature重磅文章:依赖于最少证据的mtDNA变异调用分析不可靠,ReDeeM验证不足发表时间:2024-08-02 16:57 导语 追踪谱系和克隆性的细胞条形码具有巨大的潜力,可以重新定义对发育和再生过程的理解,并研究疾病的发病机制。基于测序的体细胞线粒体DNA(mtDNA)和核DNA(nDNA)突变鉴定揭示了几乎所有人体组织(包括造血系统)中的克隆嵌合。 Weng等人[1]描述了具有深度线粒体突变分析(ReDeeM)的调节多组学,报告了前所未有的细胞间共享的mtDNA变体数量。然而,该结果是否可信? 单细胞测序网:2024年7月29日,美国斯隆-凯特琳癌症研究所Caleb A. Lareau等人就美国哈佛医学院波士顿儿童医院Weng等人于2024年1月22日发表在Nature上的研究结论(Deciphering cell states and genealogies of human haematopoiesis)提出质疑,认为Weng等人提出的ReDeeM方法分析流程正交验证不足,在文库生成和序列比对上游存在大量技术伪影,可能误导系统发育推断。该文章“Artifacts in single-cell mitochondrial DNA mutation analyses misinform phylogenetic inference”发表在预印版上。 Caleb A. Lareau等人的验证结论 被质疑文章 Weng等人开发了一个ReDeeM方法以最大限度提高mtDNA覆盖率并保留scRNA-seq与scATAC-seq的特点(图1a),通过三个独立文库(mtDNA、ATAC、RNA)匹配细胞条形码与mtDNA片段起始和结束位置的整合,作为内源性唯一分子标识符(eUMI),实现单分子共识纠错、显著提高变异检出灵敏度与准确性,从而促进检测具有低异质性的罕见mtDNA突变。Weng等人并开发出基于eUMI的开源计算管道(redeemV和redeemR包)用于共识mtDNA突变调用。 基于该技术与分析管道,Weng等人描述了细胞之间前所未有的共享mtDNA突变数量,并利用这些突变推断了造血系统的系统发育树。 图1 联合多组学检测单细胞分辨率mtDNA突变(Weng等人) 鉴于Weng等人的研究结论与先前结果不一致,Lareau等人重新审阅了Weng等人的研究结论,提出了两点质疑。 其一,尽管ReDeeM技术富集了10X Genomics单细胞多组学测序文库的mtDNA,并应用深度测序使得每个mtDNA分子产生了~5个PCR拷贝,不仅较之前方法的覆盖率提高了3倍以上,并经mtDNA变异一致性检测证实消除了测序错误。然而Weng等人采用的生信分析存在问题。 ReDeeM分析只需要一个mtDNA分子来调用细胞中的突变,然而单个mtDNA分子突变只会在一个子细胞中繁殖并在细胞分裂过程中从另一个子细胞谱系中消失;细胞分裂过程中的线粒体不均匀分配同样意味着存在于2~3个拷贝中的突变在不同子细胞谱系丢失的机会极大。因此该分析方法可能限制了克隆或系统发育推断。 Lareau等人重新评估了供体的造血细胞变异计数,并观察到,尽管达到了测序饱和,但单个细胞内75.4~85.1%的突变调用仅由一个测序的mtDNA 分子支持;将需求增加到每个细胞的突变由两个mtDNA分子支持,那么会导致所有供体的连接性显著损失(87.8~99.9%)(图 2a, b),表明在不寻常的阈值>0处选择二值化对于这项工作的结果至关重要。 图2 基于ReDeeM的细胞间连接是由低平均频率但高度丰富的不规则性质突变驱动的(Lareau等人) 其二,Lareau等人确定了一组mtDNA突变体,其中大多数由一个mtDNA分子支持,这些分子存在所有供体中,并在数十到数百个细胞中重叠,称为“低均值和高连通性”突变体(LMHC)(图2c)。尽管它们仅占所有ReDeeM变体的3.9~7.1%,但它们在许多细胞中的存在不成比例地影响细胞连接性,对于构建可靠的系统发育而言并不可靠。 Lareau等人还注意到,在所有供体中,聚集的ReDeeM衍生的LMHC变体在mtDNA分子边缘的丰度比其中心丰度高约10~20倍(图2f),表明ReDeeM文库存在普遍的边缘偏差,类似于伪影。且值得注意的是,ReDeeM分析流程中并没有进行边缘/伪影修剪。 Lareau等人根据Weng等人的算法与修订后的算法绘制了两棵系统发育树(图3a, b),发现二者之间存在明显不同的拓扑结构。通过最新方法MRCA[2]进行评估后,发现原始树与需要2+eUMI的树之间存在近随机关系(33.8~39.2%;图3c,灰色;随机率为33.3%);相反,恰好具有1个eUMI的突变体保留了大部分MRCA三重一致性(64.7~68.8%;图 3c,黑色)。这些结果强调了与更真实的mtDNA变体相比,低丰度和人工造成的mtDNA变体检出的信息含量存在差异。修剪低支持和可能的人工mtDNA变体会去除几乎所有报告的系统发育结构。 图3 系统发育树推断比较 综上所述,Lareau等人认为,ReDeeM技术需要更多证据来支持可靠的mtDNA检测与系统发育树推断,大多数由一个分子支持的mtDNA突变体都显示出可能的人为边缘偏向分布,从而削弱了它们在下游分析(包括系统发育重建)中的实用性。当被称为突变体时,这些低支持伪影极大地夸大了突变体丰度,并严重扭曲了细胞间连接性和系统发育的推断,与需要更严格阈值的变体调用启发式方法相比,这实际上是随机的(图3)。因此,Lareau等强烈警告不要使用依赖于最少证据的mtDNA变异调用工作流程,包括Weng等人引入的计算管道。 原文链接: https://www.biorxiv.org/content/10.1101/2024.07.28.605517v1.full#xref-ref-3-1 参考文献: [1] Weng, C., Yu, F., Yang, D. et al. Deciphering cell states and genealogies of human haematopoiesis. Nature 627, 389–398 (2024). [2] Ludwig, L. S. et al. Lineage Tracing in Humans Enabled by Mitochondrial Mutations and Single-Cell Genomics. Cell 176, 1325–1339.e22 (2019). |