随着单细胞测序技术的不断发展,越来越多测序数据正不断产生,数据质量也大大提高,从海量的数据中提取信息进行分析以寻找生物学规律成为了科学家们攻关的新方向。北京大学生物医学前沿创新中心BIOPIC、生命科学学院生物信息中心高歌研究员长期致力于开发新生物信息技术以解析细胞调控图谱,成果丰硕。本期,《时空对话》栏目有幸邀请到他来分享多年来跨学科研究所面临的挑战以及与测序行业共成长的过程中总结的心得。

博士生导师、北京大学生物医学前沿创新中心BIOPIC、生命科学学院生物信息中心、暨蛋白质与植物基因研究国家重点实验室研究员。高歌研究员长期致力于开发新生物信息技术以整合解析细胞调控图谱,并探索其在重大慢性疾病精准诊疗中的应用。近年来于Nature Biotechnology、Nature Communications、Nucleic Acids Research、Genome Research等刊物上发表通讯作者论文30余篇,累计他引逾万次,多次入选Clarivate/SCI全球高被引学者、Elsevier中国高被引学者等。
2022年,您的团队在 Nature Biotechnology 期刊上提出单细胞多组学数据整合与调控推断新方法,请您简单介绍一下该方法,该方法的重要性体现在何处?主要应用于哪些方面?
高歌研究员:构成每个人身体的40万亿细胞虽然具有相同的基因组,但它们的表型和功能有很大的差别,背后的原因就来自于不同细胞中特有的基因表达调控过程。单细胞技术的快速发展使得我们有机会可以在单个细胞的层次去探索这个过程,我们相信,通过开发新一代的生物信息技术,可以更有效的解析生物学家产生的大量单细胞多组学数据,以更好地理解调控过程并最终解码细胞调控图谱。团队之前提出的GLUE算法就是这方面的一个尝试。
GLUE的核心想法是通过对底层计算模型的理性设计来基于生物学知识框架解析数据,打通传统的数据导向与知识驱动模式。具体来说,GLUE算法首次实现了在一个统一的框架下去解决跨组学数据整合与调控关联推断两个看似无关的问题,在确保性能的同时也兼顾了结果的可解释性。目前这还是一个阶段性成果,但是一定程度上反映了我们在这方面的一些想法和努力。

在开发新一代生物信息学方法与技术期间,您是否有遇到一些难题?最终是如何解决的?有没有比较难忘的经历呢?
高歌研究员:我自己并不是生物学背景,在研究过程中经常会遇到的困难是如何将生物学纷繁复杂的现象和多种机制融合在计算框架之下,也就是如何把生物学需求结合已有的资料转化为机器可以理解、计算的东西。在这个过程中,首先需要理解生物学数据,特别是要理解生物学家应用数据的思路,然后再将这些理解转化为可以计算的问题,通过程序、公式等方式来呈现。这是一个不太容易的事情,这个过程中必然会碰到很多挫折,或者说绝大部分时间都是挫折。比如有的时候发现了一个很好的问题,但是我们现在可能没有足够的资料、足够的技术手段,或者没有足够的算力实现;而另外一些时候,我们在计算上做了许多努力,但是可能最终解决的并不是一个生物学上重要的问题。我想这可能是生物信息的特点:学科交叉一方面带来了很多机会,但同时也伴随着不同学科“语言”和思维方面巨大差异引起的挑战。我们只有充分重视这个特点,才能做的更好。
利用单细胞水平精准解析的细胞调控图谱在生物医学领域扮演着何种角色,其优势体现在何处?又面临着哪些挑战?
高歌研究员:09年汤富酬教授成功开展单细胞转录组实验以来单细胞领域呈现蓬勃发展的态势。从计算的角度来说,单细胞技术提高了数据的精度,将之前混杂的“一团”混合信号分解成若干细胞的独立信号,提高了信噪比。在过去十余年的发展中,单细胞技术通过cell typing定量化地显示了众多细胞之间在基因表达上的差别,让我们可以从更高的精度来认识细胞,已经带来了许多前所未有的新发现。随着细胞调控图谱的解析,可以进一步揭示这些差异背后的调控基础与机制,实现对于细胞命运决定等关键生物学问题的深入理解,从传统的“是什么”进一步推进为“为什么”。而这些理解必然最终会为包括再生医学等在内的临床转化应用提供基础。比如,2012年诺贝尔奖得主山中伸弥教授把4个转录因子转入小鼠的成纤维细胞重编程为诱导多功能干细胞,开启了再生医学与干细胞医学的新纪元,而细胞调控图谱的解析将可以使我们能精准地定位与特定细胞命运决定相关的调控因子,从而为细胞治疗等一系列应用赋能。
单细胞和空间组学在临床应用上有着光明的前景,但目前推广到临床的难度很大,您觉得主要面临哪些问题,这些问题可以从哪些方面寻求突破?具体到生信领域,您希望未来在行业看到哪些研究方向?
高歌研究员:单细胞测序技术产生了大规模的数据,如何能将这些上亿级别的数据有效地整合、挖掘、解析以回答生物学问题是对上游生物信息方法技术开发的巨大挑战。从应用的角度来看,如何将这些计算的结果转化为具有临床意义、面向人民健康的成果也是巨大的挑战。在这个过程中,既需要有先进的生物信息方法技术,也需要对生物学和医学问题的深入理解。作为一个生物信息学工作者,当然希望我们的计算结果不仅是算得漂亮,而是真的能够make difference,但这并不是一件容易的事,我们需要和一线的生物医学科学家紧密合作,搭建好从理论-实践-应用的桥梁,不断成长进化。
单细胞测序网、时空组学网联合开展“时空对话”栏目。拟邀请100位单细胞测序领域的全球顶尖科学家、企业家、学者、投资人、青年研究员、博士等围绕着单细胞测序的最新研究、技术进展、临床应用等多方面进行访谈,传递价值观念、深度见解,为行业发展提供方向。
↑↑↑
扫码可查看往期精彩文章
进入单细胞行业交流群,请在后台回复 “进群”
