科学知识图谱(知识图谱)快来看
作者 周子茗 郭国骥细胞是生物体的基本单位。一个生物体中到底有多少种细胞,其各自的命运又是怎样决定的。随着云计算、大数据、人工智能,以及新一代生
作者周子茗 郭国骥
细胞是生物体的基本单位。一个生物体中到底有多少种细胞,其各自的命运又是怎样决定的。随着云计算、大数据、人工智能,以及新一代生物检测技术突飞猛进的发展,生命过程的模拟将逐渐成为可能。
自罗伯特·胡克(R. Hooke)发现细胞以来,人类对这一生物体基本单元产生了浓厚的兴趣,生物学家对细胞分类尝试也持续了百余年技术的进步一直主导着细胞研究的进程从光学显微镜到电子显微镜,再到荧光原位杂交技术,生物学家在显微、亚显微和分子三个层次对细胞的研究取得了骄人的成果。
光学显微镜的诞生让生物学家发现了细胞的存在,通过对大量动植物的观察,人们逐渐确定了生物都是由形形色色的细胞构成的,真核细胞是多细胞生物结构和生命活动的基本单位在接下来的一段时间里,通过在显微水平研究细胞,科学家对其结构与功能方面的知识迅速积累,关于形态学、胚胎学和染色体的研究更使人们认识到细胞在生命活动中的重要作用。
1930年代电子显微镜技术出现后,科学家对此前光学显微镜下无法观测的亚显微结构又有了新认识,发现了细胞的各类超微结构,促进了对细胞膜、线粒体、叶绿体等结构和功能的研究其后的原位杂交技术则令细胞生物学与分子生物学的联系日渐紧密,各种新兴技术的发展使得研究细胞分子结构及其在生命活动中的作用成为科研热点,细胞内基因调控、信号转导等机制的研究,成为细胞生物学未来的发展方向。
细胞图谱细胞生物学是现代生命科学研究的基石,过去150年中,科学家根据不同的标准,如细胞的结构、功能、位置,以及所含分子,对细胞进行分类,但这些分类往往无法互相关联对细胞所含分子的分类仍是为了特定目的而设,或基于偶然发现的标志物或选择之便,而非基于系统性和综合性的指标。
故时至今日,对细胞类型和状态的描述仍非常有限,有关细胞类型的知识存在大量空白唯一已知从单个受精卵到成年个体的完整细胞谱系的案例就是秀丽隐杆线虫(Caenorhabditis elegans),然而这一研究对象十分特殊,线虫通体透明,全身只有1000个左右细胞。
我们面临的挑战是缺乏对细胞类型和细胞状态的严格定义由于细胞处于不断变化过程中,导致很难分清细胞类型和细胞状态之间的分界,实际情况可能与目前的定义相差甚远针对这一问题,科学家希望通过构建一个由数据驱动的理论,来重新定义细胞类型和细胞状态,这就是细胞图谱计划。
什么是细胞图谱?我们先了解一个新兴的研究领域——单细胞测序分析单细胞测序分析包含许多技术分析手段,比如单细胞基因组测序,单细胞转录组测序,单细胞表观遗传测序,单细胞蛋白组测序等其中与细胞图谱计划联系最紧密的是单细胞转录组测序分析技术(single-cell RNA-seq),它通过不同实验方案来收集组织样品的mRNA信息,但与传统的转录组测序分析(RNA-seq)不同,单细胞转录组分析能精确识别特定转录本来自哪个细胞。
打个比方,如果说群体转录组测序的结果是一幅抽象画,那么单细胞转录组测序的结果就是一张具800万像素的高清照片将单细胞转录组分析应用于细胞研究,能对每个样本细胞的细胞类型及其状态进行精确划分早在1992年,安博温(J. Eberwine)等对单个神经元细胞进行了转录组分析,由于当时测序技术及实验设计的限制,这种方法只能揭示少量细胞部分转录组的特征,应用范围十分有限。
直到2009年,通过技术的革新,汤富酬等开发出基于高通量测序的单细胞转录组测序技术 [1],使大规模研究单细胞转录组成为可能随着高通量测序技术的发展和推广,单细胞测序分析也得以迅猛发展,近年来以微流控、微孔板技术为基础的高通量单细胞测序分析(Cyto-seq、Drop-seq、Indrop)开始涌现,且以这些技术为基础,建立了一批以10X Genomics为代表的单细胞高通量测序平台,它们可以实现单次实验分析几千到几万个细胞的转录组数据,研究者可根据自己的实验需求定制使用。
2012年,美国科学(Science)杂志成功预测了单细胞研究会成为2013年六大重点研究方向之首;同年,美国国立卫生研究院宣布将在5年内投入9000万美元以上用于单细胞测序分析工具的研发单细胞测序分析就此进入了飞速发展的黄金时期。
同时,科学界也逐渐达成共识,准备通过单细胞测序分析完成大规模细胞图谱绘制2016年10月,在伦敦举行的一次科学会议上,与会者发出了建立人类细胞图谱的倡议,希望通过全球生物学家、临床医生、物理学家、计算科学家、软件工程师、数学家及其他技术人员的共同努力和合作,来完成人类细胞图谱(Human Cell Atlas)的绘制。
人类细胞图谱旨在描述所有人类细胞的稳定属性及其瞬态特征 [2],即细胞中各类生物大分子的位置和丰度信息,通过这些信息构建一个综合性参考数据目录,以反映不同要素之间的关系、揭示细胞的功能性进程此外,图谱还提供一个坐标系统,该系统中的概念可以在不同水平上通用,在任何分辨率下都可以了解概念特征,高维信息被化繁为简。
那么,人类细胞图谱如何提炼主要特征、提供坐标,并展现它们之间的关联呢?一个解决方案是通过定义一系列分子标志物来描述每个细胞,这些分子标志物包括述编码人类蛋白基因的表达、非编码基因的表达、转录本可变剪接、启动子和增强子的染色质状态,以及蛋白质表达和翻译后的修饰状态等。
收集信息的最佳量级和种类则由技术可行性和不同层次的生物学研究需求所决定人类细胞图谱还将具有代表组织学和解剖学信息、时间信息和疾病状态的注释这些信息对协调细胞的生理学、组织学和功能的分子表达谱非常重要从某些方面来说,人类细胞图谱计划(基本单位是单个细胞)和人类基因组计划(基本单位是单个基因)非常相似。
它们均致力于创建生物学的“元素周期表”,综合性地罗列出人体中两个关键性的“原子”——细胞和基因,这将为生物学研究和医学应用打造重要基础但是人类细胞图谱计划的实施,在细胞生物学研究方面需要特殊的实验工具,并选择分子和细胞学方面的描述手段,还面临大量的挑战性工作。
理想化的人类细胞图谱计划研究的对象包括:①人体的所有细胞;②每个细胞的空间位置;③每一时刻对应的每个细胞的状态;④多个个体的细胞图谱的叠加,即根据不同健康状态、基因型、生活方式和外界环境加以注释显然这一目标不可能实现,但通过对大量样本研究结果的积累,理解所有人类细胞的关键特征及其相互之间的关系,正逐渐成为可能。
人类细胞蓝图2017年10月被誉为生物学领域的人类登月计划——“人类细胞图谱计划”拉开序幕,首批拟资助的38个项目中,由中国科学家承担的项目仅有1项在这一背景下,实验数据大部分来自非亚裔群体,使得人类细胞图谱数据中缺乏亚裔群体的数据,其未来相关的应用存在局限。
在这一背景下,中国科学家承担起相应的责任,借助国家自然科学基金委资助的相关项目,开始实施绘制人类细胞蓝图的计划,这项工作与人类细胞图谱计划相互补充,为细胞图谱在更广泛的尺度上造福人类做出了贡献人类细胞蓝图(Human Cell Landscape) [3]和人类细胞图谱的区别在于,人类细胞蓝图专注于描述细胞内转录组的表达信息,这一目标的实现依赖于近年来快速发展的单细胞转录组测序技术。
早期的单细胞转录组测序技术的成本非常高,只适用于对几个或几十个单细胞进行分析,从而制约了其应用价值而基于微孔板、微流控和液滴的细胞分离方法,大大提高了单细胞分析的通量,降低了分析的成本通过引入细胞标签的方式,给来自不同细胞的生物大分子加上不同的“二维码”。
通过生物信息学的分析方法可视化地展现细胞的生理学与病理学之间的差异Microwell-seq [4]是中国首个自主搭建的单细胞高通量转录组测序平台,由笔者课题课题组研发平台利用琼脂糖制成的微孔板,创新性地为单个细胞提供与索引磁珠结合的反应空间,每个微孔就像一个隔离的“房间”,允许细胞单独与索引磁珠接触发生反应。
而索引磁珠则通过3轮分裂池合成,拥有近百万种组合数(同一索引磁珠上的细胞标签相同)利用这种原理,Microwell-seq能同时对成千上万的单个细胞进行大规模平行单细胞转录组分析这一技术成功地将单个细胞的分析成本降至0.5元,而通量提升至2万个/天。
与同期其他技术相比,Microwell-seq具有便捷、可操作性强、兼容性高等特点,不依赖进口试剂和仪器等优点,可广泛应用于分子生物学实验室
Microwell-seq单细胞高通量转录组测序平台工作流程图利用Microwell-seq笔者课题组完成了人类细胞蓝图的绘制,这一工作是国内生物学领域的一次重大科研突破,课题组在前期工作中,利用单细胞技术成功解析了早期胚胎分化体系及成体造血干细胞分化体系,并阐明了分化机制。
目前已在人多能干细胞的三胚层分化体系,以及人中胚层组织干细胞体系(造血干细胞、间充质干细胞)中,完成了单细胞转录组数据积累对小鼠33个不同组织进行单细胞测序,绘制出小鼠细胞图谱已成功建立较完善的计算生物学研究平台和研究团队,建立高通量单细胞数据的分析流程及大规模数据的整合手段。
并在此基础上与医学院校和医院紧密合作,对正常人组织来源细胞进行了大规模单细胞转录组测序分析,绘制出人类细胞蓝图共获得70多万个单细胞转录组数据,建立了人体各大组织的人类细胞蓝图数据库人类细胞蓝图的研究充分利用了Microwell-seq成本低廉、双细胞污染率低和细胞普适性广等优势,鉴定了人体100余种细胞大类和800余种细胞亚类。
基于该数据库,研究团队开发了scHCL单细胞比对系统用于人体细胞类型的识别,该系统能快速对各类转录组测序数据进行鉴定此外,为方便数据分享与应用,搭建了人类细胞蓝图网站在研究中团队发现,多种成人的上皮细胞、内皮细胞和基质细胞在组织中似乎扮演着免疫细胞的角色。
趋化因子阳性上皮细胞、抗原呈递阳性内皮细胞和白介素阳性成纤维细胞广泛分布于成体的各种组织器官之中,并在分类上独立于传统的上皮细胞、内皮细胞、基质细胞和免疫细胞研究认为,成年人非免疫细胞的广泛免疫激活,代表了人体区域免疫的一种重要调节机制,但深入的机理需进一步验证。
在跨时期、跨组织和跨物种的细胞图谱分析中,研究团队揭示了一个普适性的哺乳动物细胞命运决定机制:干细胞和祖细胞的转录状态是混杂且随机的,分化和成熟细胞的转录状态分明且稳定,基因组中的调节子预先决定了分化终端的稳定状态。
此外,对人鼠相似细胞类型、同源转录因子和基序等的研究,展示了人类细胞蓝图的广泛应用前景总体来说,人类细胞蓝图首次在单细胞水平上全面分析了胚胎和成年期细胞的种类,研究数据将成为探索细胞命运决定机制的资源宝库,研究方法将对人体的正常与疾病细胞状态的鉴定带来深远影响。
周子茗,硕士研究生;郭国骥,教授:浙江大学医学院干细胞与再生医学中心,杭州 310058zimingzhou@zju.edu.cnZhou Ziming, Master Degree Candidate; Guo Guoji, Professor: The Center of Stem Cell and Regenerative Medicine, Zhejiang University, Hangzhou 310058.。
Tang F, Barbacioru C, Wang Y, et al. mRNA-Seq whole-transcriptome analysis of a single cell. Nature Methods, 2009, 6 (5): 377.
Regev A, Teichmann S A, Lander E S, et al. The Human Cell Atlas. eLife, 2017, 6: e27041.Han X, Zhou Z, Fei L, et al. Construction of a human cell landscape at single-cell level. Nature, 2020, 581 (7808): 303-309.
Han X, Wang R, Zhou Y, et al. Mapping the mouse cell atlas by microwell-seq. Cell, 2018, 172(5): 1091-1107. e17.
关键词:细胞图谱计划 人类细胞蓝图 单细胞测序■
免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186