博客专栏

EEPW首页 > 博客 > 科学家结合机器学习方法,开发可预测“细胞分化命运”模型,能用于再生治疗及癌症预测等

科学家结合机器学习方法,开发可预测“细胞分化命运”模型,能用于再生治疗及癌症预测等

发布人:深科技 时间:2022-04-16 来源:工程师 发布文章


世界上没有两片相同的树叶,细胞也一样。利用基因表达研究中的一项重要技术单细胞转录组测序,可以把数以十万甚至百万量级的单个细胞分离出来,对细胞里面表达的所有 RNA 分子进行测序,从而以极高通量和高分辨率揭示细胞的状态和分化转变。然而,目前分析这些单细胞数据的工具主要集中于简单的描述和统计分析,还未有能够充分推断并揭示细胞命运转变机理甚至做出高精度预测的方法及模型。

 

为此,美国麻省理工学院(MIT)乔纳森·韦斯曼(Jonathan Weissman)课题组和匹兹堡大学医学院邢建华课题组联合开发了一个可预测细胞未来分化命运的模型 dynamo(相关开源工具包链接: https://github.com/aristoteleo/dynamo-release),该模型还能给出相应的发育方程来具体解释导致细胞最终分化的关键基因及作用机制。人类因此有一天或能实现“定制”所需的特定细胞。

 

2022 年 2 月 1 日,相关论文以《绘制单细胞的转录组矢量场图》(Mapping transcriptomic vector fields of single cells)为题发表在 Cell 上,MIT 乔纳森·韦斯曼实验室博士后邱肖杰和匹兹堡大学邢建华实验室博士生张衍担任共同第一作者,邱肖杰、 邢建华及乔纳森·韦斯曼为共同通讯作者。

 

图片

图 | 相关论文(来源:Cell

 

据了解,dynamo 模型结合了内在 RNA 剪接和 RNA 代谢标记动力学来得出准确的绝对 RNA 速度,并采用机器学习方法构建高维速度矢量场,还结合微分几何分析算法来阐明潜在的调节网络,甚至可以通过物理里的最小作用量方法来预测细胞命运转变的最优路径和关键转录因子,且实现全基因组基因敲除对细胞状态和命运扰动的准确预测。 

 

该团队将 dynamo 这个理论工具应用于各种不同的生物过程,包括预测分化的造血干细胞系的未来状态、揭露出细胞周期进展和与之正交的糖皮质激素反应、提供了造血干细胞发育过程中几个悬而未决的问题的可能分子机制,包括巨核细胞相对于其他干细胞谱系的更早期发育以及嗜碱细胞的两条可能发育路径等。

 

动 图 | 人造血干细胞分化预测动画(来源:邱肖杰)

 

邱肖杰提到,这项研究的重要贡献在于其超越了之前基于数据的描述性方法,首次直接利用高通量数据学习出了能够揭示细胞动态变化过程的方程。这得益于过去十年里机器学习方法和单细胞测序技术日新月异的进步。

 

从一定程度上,这个工作的重要意义,类似于 400 年前天文学家第谷·布拉赫(Tycho Brahe)的学生约翰尼斯·开普勒(Johannes Kepler)对其收集的天体运动大数据进行分析而得出行星运动三大定律。随着实验方法的进一步发展以及更高通量和精度数据的产生,生物学将同物理学一般迈进一个更加定量的时代。

 

另外,需要特别强调的是,dynamo 的核心技术是采用了机器学习和深度学习的方法,这些方法特别适合处理大数据。但问题是,机器学习模型通常被认为是一个“黑箱”。因此,该团队通过引入物理学方面的动力系统分析方法,将“黑箱”拆解成一些直观的、有物理意义且与细胞发育相关的具体变量。

 

图 | 研究过程(来源:邱肖杰)


不过,邱肖杰表示,相关研究论文的发表并非一帆风顺。该研究是 2018 年底邱肖杰加入乔纳森·韦斯曼实验室做博士后时立题,再从形成一个多学科的完整团队到最后发表,总共历时近 3 年半的时间。

 

而且,在论文审稿过程中,该团队也遇到不少困难,他们收到了一些诸如“预测不够令人印象深刻”“新意不够”等的审稿人评价。为此,他们花了 3~4 个月的时间进行造血发育的相关实验,又花了了另外 4 个月左右的时间分析数据,在论文中增加了对不同细胞转变的预测,并基本达到 85% 的准确率,论文最终顺利被接收。

 

邱肖杰指出,这项研究的应用场景很广,且不限于具体问题,基本能够用单细胞测序研究的生物动态过程都适用。首先,dynamo 模型可以得出在细胞变化过程中发挥作用的特定基因,并预测将来这个细胞会怎么变化,所以可用于临床上的重大疾病诊断,如只需提取患者的一点细胞就可以分析预测其得癌症的概率及病发时间等。

 

其次,dynamo 模型能够对不同造血细胞之间转变所需要的途径进行预测,可用于再生医疗。例如,人在皮肤烧伤时,研究人员可以将其他部位细胞转变成皮肤细胞来进行康复治疗;对待精神类疾病患者,研究人员可以将其大脑中的胶质细胞转变成神经细胞来缓解病症。

 

该团队称,后续他们希望把 dynamo 模型与空间组织、蛋白质的表达和表观遗传及更多领域整合起来,作进一步的研究。此外,他们将尝试使用这个工具解决更为具体的生物问题,如衰老的防止,即把一个老年细胞变回年轻时的状态。值得注意的是,邱肖杰最近还利用 dynamo 帮助科技前沿机构华大基因分析其大视场高精度的空间基因组学方法 Stereo-seq(https://www.biorxiv.org/content/10.1101/2021.01.17.427004v3),相关研究论文不久后会在 Cell 刊出。

 

图 | 邱肖杰(来源:邱肖杰)


据了解,邱肖杰是湖南人,本科毕业于长春工业大学,随后分别在华东师范大学和华盛顿大学获得硕士和博士学位,目前在 MIT 攻读博士后。此外,现在他已经开始在美国申请教授职务,并希望在将来建立一个结合机器学习、单细胞技术和系统生物学的实验室。

 

最后他谈到,这项研究虽然属于生物学领域,但还需要结合物理方面的学科知识,而他不是学物理出身。幸运的是,他遇到了论文的通讯作者之一的匹兹堡大学邢建华教授。邢建华所在的课题组长期以来一直在用数学和物理的思维及手段解决生物学问题,包括细胞分化的认识与调控方面。

 

随后,又有张衍加入到研究中。张衍的数理功底特别好,做了许多模型上的工作,帮助加快了整个研究过程的推进速度。

 

邱肖杰表示,“合作很重要,现在几乎没有通才,只有合作才能把研究做得更快和更加深入。”

 

-End-



支持:熊岳城

 

参考:

1.Xiaojie Qiu et al. Mapping Transcriptomic Vector Fields of Single Cells. Cell(2022)https://doi.org/10.1016/j.cell.2021.12.045


*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。



关键词: 机器学习

相关推荐

技术专区

关闭