浙江大学生命科学研究院蒋超老师的办公桌旁,窗户半开着,一台小巧的亮银色机器放在窗口,它的“机械鼻”以每分钟10升的速度“吸取“着户外的空气。这是蒋超老师正在开发的空气采样器,借助于它,科学家将去探究甚至穷尽空气中漂浮的各类物质及其与人类的关系。
今年,蒋超组在Nature Protocols上在线发表题为“Decoding personal biotic and abiotic airborne exposome”的方法学文章,从设备开发、试验流程以及生信分析角度系统的描述了揭秘个体水平空气暴露组组分的研究方法。
环境暴露组(Exposome)是近几年新兴的针对于环境因素运用先进技术手段进行大规模量化,并研究这些组分与人类、动物以及其他生物健康状态/疾病发生发展关系的学科。环境暴露组中又以空气中的暴露成份最难研究。本期青稞有约,我们邀请蒋老师来为大家介绍这一领域的科学问题、研究方法与研究进展。
1、能否通俗地介绍一下空气暴露组研究,这一研究领域试图回答什么科学问题?
蒋超:人类和各种生物的生长发育与疾病健康都是由遗传(内因)和环境(外因)因素共同决定的。近年来,借助于多组学研究和分子生物学、细胞生物学、生物化学以及结构生物学的有机结合,人类对于遗传因素等内因的理解取得了巨大进步。相比之下,我们对环境因素的了解远远落后了,有些时候还需要用问卷调查这种形式来获取数据。为了回答这个问题,科学界近年来提出了暴露组研究概念,用研究遗传因素等内因的先进科学手段来研究环境因素。空气暴露组是暴露组(Exposome)这个新兴领域的一个研究方向。
我对空气暴露组(或空气环境暴露组)研究的理解是:在不同的时空尺度上,使用敏感、精准、高通量的研究方法去检测空气中所有生物和化学颗粒的成分,并探究这些不同生物化学物质跟人类和环境健康之间的关系。同时,空气暴露组产生的大数据还可以被很多其他研究领域所使用,如进化、生态、环境科学、以及公共卫生等。
与其他组学研究领域类似,空气暴露组学属于数据驱动研究(Data-driven)。这个研究领域基本逻辑是: 如果我们能穷尽对比如一次细胞分裂、一种发育过程、一种行为、一种疾病、甚至是生命体的一生的每一个微小步骤进行记录的话,我们就可以对这个过程的确切机理拥有深刻的了解。
之所以说空气暴露组学是一种数据驱动(Data-driven) 的研究,这是相对于假说驱动(Hypothesis-driven)提出的。即在研究过程中,我们并没有一个特定的假说(hypothesis),而只是希望对事物发生过程(process)进行尽可能详尽的完备的记录。对科学的终极目的而言,数据驱动和假说驱动其实并不矛盾。本质上来说,数据驱动的研究提出大量假说,再由假说驱动的研究进一步检验,两者可以很自然的结合起来。同时,随着技术的发展,最终我们也可以大规模的验证不同假说,从而使两种研究方式彻底统一。
图:空气暴露组组成及动态图(修改自https://nca2018.globalchange.gov/chapter/13/,蒋刘一琦)
图:个体空气暴露组的生物化学组分示意图(蒋超提供)
空气暴露组学可以回答很多有趣的问题。例如,我们通常说的“气场”是什么?这在科学上是没有定义的。近几年的研究发现,人体可以释放出来一定量的微生物颗粒以及化合物/代谢物分子。当然人体所发出的比如红外辐射,大家也早就很熟悉了。人体无时无刻都在像四周散发出这些生物、化学物质、以及物理辐射,我们可以把它看成是个体的“气场”。
2、目前全世界有哪些地方在开展相关的研究?
蒋超: 全球范围内,欧盟、美国国立卫生院(NIH)、耶鲁大学、艾默里大学、纽约西奈山医学院等机构已经开始了一系列基于多组学技术的暴露组学相关的大型研究项目,而我国暴露组研究相对缺乏,亟需加大投入。
以欧盟的人类暴露组计划为例(https://www.humanexposome.eu), 该项目在2020年初启动,有126个研究团队,24个国家,1.06亿欧元的初期投入,下设主要9个不同项目。其中的REMEDIA项目的目的是更好地了解人类环境暴露组对2种不可治愈的呼吸系统疾病的影响:慢性阻塞性肺疾病(COPD)和囊性纤维化(CF)。研究方法是从出生开始调查潜在患者所接触的各类环境物质,及其对以后疾病风险的影响。REMEDIA将开发一个工具箱,该工具箱将提供新的指南以更好地预测疾病风险,并应导致识别出可采取预防措施的可改变的风险因素。
3、和其他研究环境的方法相比,空气暴露组学有什么不一样?
蒋超:空气暴露组学的研究目的和环境毒理学和公共卫生学等领域有很大的共通点,即都是从环境因素入手去探究各类环境暴露对健康的影响。但是采取的方式有所不同,前者首先是尝试用非靶向的高通量的检测方法对尽量多的不同种类的生物和化学物质进行探索,进而用靶向方法深入研究,涉及到比较多的大数据统计分析,更加侧重方法学研究和应用;后者的大部分研究都会集中在已知的有毒物质上,更加侧重于对毒性物质的如何影响健康的分子生理学机理的探究。
4、这种研究方法是否可以穷尽我们空气中的所有物质?
蒋超:我们的目的是穷尽环境中所有物质,但技术的限制环让我们对环境中很低量的物质无法检测,对完全未知的生物和化学物质也很难以准确鉴别。
图:空气中捕获的各类生物颗粒和无机颗粒的扫描电镜图片(引用自Jiang et al., 2018)
目前,我们的技术能让我们同时鉴别环境中几百到几千的生物物种和潜在化学分子。生物部分基本包括了所有已知生物大类,比如病毒、细菌、真菌、植物、原生动物、昆虫以及包括宠物在内的动物核酸分子,当然还有我们自己-人类。化学部分包括很多已知的有毒无毒合成物质比如杀虫剂、塑化剂、致癌物,还有不少自然界中植物或真菌合成的次级代谢产物,当然有很大一部分生物和化学物质都是完全未知的,这也是我们探索的主要目的之一。因为我们需要首先需要知道我们不知道什么,才能够去想办法知道和进一步了解这些“不知道”。
5、具体我们如何开展研究?是否可以把它理解为一个技术的集成?
蒋超:这个理解大致是正确的,目前空气暴露组的主要研究方式就是集硬件设计改造、分子试验新技术开发以及生信分析和计算机方法开发为一体。这几个步骤缺一不可,每一个步骤都需要创新。如实时检测空气的生物或者化学物质的方法,超微量提取建库流程和绝对定量的方法,以及超大物种数据库快速精准检索方法。同时,在对各类生物和化学物质进行精确测量后,我们也要探究这些不同物质对人类或者是其他物种的疾病和健康的影响。这个研究过程其实和早期的人类肠道微生物组,以及和现在的口腔、皮肤等一系列身体部位的微生物组,甚至器官组织里的微生物组研究过程很像。
比如,如果我们对浙大不同校区的空气暴露组的异同感兴趣,我们就可以在紫金港、玉泉、舟山、海宁、之江、西溪、华家池校区布置我们的采样仪,通过短期或者长期采集获取空气样本,然后使用高通量测序或者质谱的方式对这些空气样本进行解析以分析这多个区域的差别,然后从不同校区的的各类环境因素如温度湿度风速等入手,尝试解释这些区别的来源。最后,我们可以结合不同校区师生的过敏或者上呼吸道疾病发病率,进一步探究这些不同的暴露组分是如何影响这些疾病的发病率和程度的。
6、能否以2018年您在CELL杂志的发表的研究是怎么进行的?
蒋超:该项研究主要是从精准医学的角度出发的,即我们是否可以在个体水平精准检测人类所接触的空气环境生物和化学暴露组成分。
为了实现这个目标,我们花了将近两年的时间摸索钻研,改造了一个可穿戴设备,并开发了一整套实验生物信息流程,对15位被试者的个体空气暴露组第一次进行了完全的描述。因为这个可穿戴设备可以跟着人走,所以我们发现个体所接触的空气生物物质和化学物质变动都是非常剧烈的,这种变动同时体现在空间和时间上,短时间内空间变化更重要点,而长时间内时间变化更重要些。
另外,就个体空气暴露组而言,我们所检测到的不少物质很可能是从人自身所释放出来的,这和平常我们在大众文化里所谓的“气场”在概念上有类似的地方,但从自身所散发出的生物和化学物质并非无形之物,而是客观存在的。
图:三位项目参与者的个体空气暴露组的采样地理位置分布(引用自Jiang et al., 2018)
7、这当中有什么超出我们预期的发现?
蒋超:空气中所接触的生物物质和化学物质复杂度和动态远超过我们的想象。无论是生物物种和潜在化合物都是几千种之多。其中有很多预期的比如花粉、细菌、杀虫剂、塑化物,也有很多想不到比如某些昆虫、真核原生生物、甚至是宠物相关的信息,当然更多的是还是处于未知状态的物质。另一个比较意外的发现是我们的数据中出现了不少与人有密切关系的生物组分,提示个体暴露组中除了显而易见的来自于环境的各种暴露组分,还有相当一部分暴露组分是来自于我们自身或者身边的亲朋好友的,而这一部分组分会和传染病相关。
由于我们的数据都是公开发表的,其他研究者也可以自由使用。比如我们发表之后就有美国疾控中心CDC的研究者联系我们,并用我们的数据研究他们一种感兴趣的真菌病原,以前他们不知道这种病原的传播方式,使用我们的数据他们分析出该真菌病原只能从某一人的暴露组里看到,而并不会在别的人的个体空气暴露组里看到。提示该病原应该是直接从人到人近距离传播的,并且这位参与者可能有潜在真菌病原感染但并不知情。
图:空气暴露组中很多生物组分或者物种具有明显的一年四季的变化(引用自Jiang et al., 2018)
在我们的样本中甚至发现了荷兰猪的相关信息,最后发现是携带者家里确实有荷兰猪这种不是那么常见的宠物。另外,我们发现很多空气中的物种信号和一年四季有着很强的关系,比如我们分析发现有一种真菌每到秋冬天就会有比较强的信号,经过调查发现该真菌其实就是是我们大家最喜欢吃的香菇类似物种,而其生长规律确实就是秋冬天开始释放孢子繁殖的季节。
8、对于我们生存的环境,我们还有哪些未知的事情?
蒋超: 人类在探索过程中,对”知道自己不知道”的事物往往可以进行有效探索,而对“不知道自己不知道”的事物却可能近在眼前也完全忽略,这是我们感知局限所导致的,比如各类辐射和微生物的存在,在相应检测方法出现之前,我们对其一无所知并忽略。一个很好的例子是人类在知道微生物的存在之前,人们对传染病传染就只能从“气味”来解释,尽管“气味”的传播在某些方面上确实和微生物的传播有一定关系,但不能直接划等号(比如接触和水源传播)。认识到微生物的存在之后,我们对传染病的防治取得了重大突破。
所以,对未知环境的探索不但是对新环境的探索,比如探索深海或者火星,也是对我们认为“已知”的环境的进一步探索,比如在我之前文章里研究所揭示的,我们日常生活中所接触的简简单单的空气,其实也可以被赋予多种多样变化多端的意义,而空气中各种物质和我们健康最直接的关联就是各种过敏症状、哮喘、各类肺炎以及心血管疾病。至于这些各种各样的生物、化学物质以及物理因素和我们的健康还有什么其他的联系,这是一个长期研究才能逐渐揭示的过程,就像历史上香烟、辐射、铅对我们健康影响的研究过程一样。
9、听起来您的研究仿佛是一个更高层面的环境博物学,而且不仅如此,它还要去研究这些因素如何与我们的生活健康发生关系?是否可以介绍一些与之关联的方向?
蒋超:和博物学的这个类比很好,我们现在对分子层面的很多探索,非常类似达尔文时期或者更早时候生物学家对世界多种多样生物的坚持不懈的探索,只不过我们现在所关注的变成了分子多样性。其实空气暴露组学同时也是属于环境DNA/RNA研究领域,即直接用测序的方法探究物种多样性,而不是通过照片、视频、声音的手段。
在完善对空气环境等其他环境各类因素的检测后,下一步自然是我们如何把这些多样化数据与人和环境的健康联系起来并探寻其因果关系。这个过程中会用到严谨的实验设计、还有和疾病相关的大量细胞系以及模式动物、以及分子层面的实验和互作分子结构的解析。举个最直接的例子, 目前过敏和哮喘这两种疾病给世界各国都带来很严重的健康问题和经济损失,其中一个很关键的问题就是如何精准鉴别过敏源。目前已有的方法主要是通过血液测和皮肤测,最多只能测试数十种(血液)或数百种(皮肤)且假阳性率非常高。如果能把这些病人周围的环境暴露组解析,结合他们的过敏或者哮喘症状,那么有望通过数据分析直接找到潜在的过敏源。之后可以用逐步脱敏的方法来减轻病人的痛苦,而不是现在通用的对免疫系统的直接压制,给其他病原可趁之机。
10、目前你正在开展怎么样的研究?
蒋超:由于我的学科背景结合分子微生物、进化、微生物组、环境暴露组、精准医学以及生物信息等多个领域,我的研究理想是以微生物为中心,基于交叉学科知识对人类自身和人类生存环境的探索。
当然,学科领域本身就是一个相当主观的定义,自然世界和疾病本身就是客观存在的复杂系统(complex system)问题。现代科学之母哲学本身也是一个标准的“交叉学科“,在现代科学的发展过程中,因为时代的原因,不同学科被细化分化,导致隔行如隔山的情况出现,但是我认为这个情况只是暂时的。
图:个体暴露组中生物组分之间的生态关系网络,不同颜色代表不同类别的物种。红色,细菌;深黄色,真菌;绿色,植物;深蓝色,昆虫;浅蓝色,动物(图片来自于蒋超)
在现代数据科学帮助下,我们已经开始打破这些阻隔,使不同学科能融汇在一起。我目前的研究主要集中在探究微生物组以及化学物质组(代谢组)在不同环境下精确测量方法、微生物的进化、不同种类微生物之间的互作、以及微生物和各类环境交互的机理和结果。这里需要说明的是,人体表面或者人体内部对我来说也是一种特定环境。微生物和人体这个特定环境的交互作用会对健康有很多正面以及负面的影响,这些正是现在微生物组研究的一个主要目标。目前实验室研究主要涉及的微生物环境是空气、人体、土壤。