中科院青岛能源所:拉曼组与机器学习的微藻种质挖掘新技术助力“双碳行动”

2021-06-28 19:43:12来源: 科技日报 作者: 王健高

科技日报记者 王健高 通讯员 刘洋 崔晓辉

6月28日,记者从中国科学院青岛生物能源与过程研究所获悉,该所单细胞中心发表了首个微藻拉曼组数据库,并结合机器学习,示范了单细胞精度、快速的微藻种类鉴定和代谢功能表征。这一新技术为微藻细胞工厂的高效挖掘和筛选提供了一个免培养、高通量的强有力手段,相关工作成果发表于《分析化学》(Analytical Chemistry)。该工作由该所单细胞中心徐健研究员主持完成,得到了该所单细胞中心马波研究员、深圳大学胡强教授和上海师范大学王全喜教授的帮助。

微藻是地球上代谢功能最为多样化的生物类群之一,在全球碳循环中发挥着关键性的作用,也是生物技术产业中重要的一类光合细胞工厂,但是微藻的种质鉴定和代谢功能检测通常十分繁琐,而且自然界大部分微藻尚难以培养。

拉曼组机器学习加速微藻种质挖掘、服务“双碳行动” 图/刘阳

微藻是在自然界中广泛存在的单细胞光合自养生物。它们可将空气中的二氧化碳高效转化为油脂、碳水化合物、蛋白质和色素等高附加值产品,应用于第三代生物燃料、饲料、食品和保健品等。因此,“微藻细胞工厂”有望成为服务“碳中和”和“碳达峰”的低碳制造解决方案之一。这一前景的前提和基础是微藻种质资源的快速鉴定和代谢功能检测。但是,传统上“先养后筛”的种质筛选策略面临着培养时间长、步骤繁多、难以自动化,且难以分析尚难培养藻种等诸多瓶颈。

针对上述瓶颈问题,该所单细胞中心Mohammadhadi Heidari Baladehi等人开发了一种基于拉曼组的藻类细胞快速辨别与代谢功能快检技术。拉曼组是一个细胞群体的单细胞拉曼光谱的总称,代表着可以在单细胞精度快速、低成本、高通量获取的细胞群体实时代谢状态。

首先,针对已获纯培养的藻种,研究人员采集了色素分子拉曼光谱(PS)和微藻细胞自身拉曼光谱(WS)这两张谱图,构建了首个藻类拉曼组数据库。该数据库包含了在不同生长期(稳定期和指数期)、分属27个微藻种属的超过9000个单细胞的拉曼光谱。该团队开发的机器学习算法,通过PS和WS的联用,来辨别待测单细胞的藻种和生长状态,准确率可达97%。

其次,针对环境中的尚难培养的藻类细胞,研究人员借助前期发明的单细胞拉曼分选技术来捕获活性藻类单细胞,从而采集其PS和WS这两张拉曼谱图,进而结合下游单细胞测序,建立了环境中微藻单细胞代谢表型组和基因型的关联。该方法不需分离培养,即可构建环境中任何微藻细胞的拉曼光谱数据库,进而基于机器学习,支撑尚难培养藻种的快速鉴定和代谢功能检测。

此外,除了种质辨别,单细胞拉曼光谱还能揭示微藻利用二氧化碳后的碳源存储形式(如油脂、淀粉、蛋白、色素等),以及它们的含量和化学性质(如油脂的不饱和度等)。这些代谢表型信息,对于快速评估微藻种质的培养工艺、经济价值和应用潜力至关重要。

与传统上依赖于培养的“先养后筛”的策略不同,这一基于拉曼组的种质筛选策略无需培养与扩繁细胞,既节约了大量时间和人工,也能够挖掘和筛选尚难培养的微藻细胞。同时,针对每个微藻细胞,拉曼光谱的采集通常仅需数秒的时间,且无需破坏细胞,故而步骤简洁、分析通量高、易于实现自动化,还能在单细胞精度同时探测从代谢表型组到基因组的全面信息。因此,这一新技术将大大加速微藻细胞工厂及其代谢产物的挖掘与利用。

气候变化是人类面临的全球性问题,二氧化碳排放量超标和温室气体的激增严重威胁地球生命系统。徐健介绍,我国于2020年正式提出碳达峰和碳中和目标,今年全国两会上,碳达峰、碳中和被首次写入政府工作报告。微藻作为一种天然的固碳细胞工厂,将在双碳行动这场硬仗中发挥重要作用。

针对工业产油微藻(微拟球藻;Nannochloropsis spp.),该所单细胞中心前期已经发表了基因敲低技术、基因编辑技术、染色体大片段切除技术等特色遗传操作工具,并组织了“微拟球藻设计与合成”国际合作计划(NanDeSyn ),推动国内外工业微藻研究与产业群体的资源共享与技术合作。徐健表示,此次首个微藻拉曼组数据库及其机器学习手段的发表,将加速新一代微藻资源信息平台的构建和共享,促进藻类为“双碳行动”做出特色贡献。

加载更多>>
责任编辑:马嘉悦