机器之心
中国科学院神经科学研究所、中国科学院脑科学与智能技术卓越创新中心、香港科技大学生命科学部和分子神经科学国家重点实验室、中国科学院自动化研究所在 《Neuron》上联合发表了一篇概述论文《China Brain Project: Basic Neuroscience, Brain Diseases, and Brain-Inspired Computing》,介绍了「中国脑计划」在基础神经科学、脑疾病和脑启发计算上的研究进展。以下是我们的完整编译。
论文作者简介:
蒲慕明(Mu-ming Poo):中国科学院上海生命科学研究院神经科学研究所(ION)所长,中国科学院脑科学与智能技术卓越创新中心(CEBSIT)主任
杜久林(Jiu-lin Du):中国科学院上海生命科学研究院神经科学研究所副所长,中国科学院脑科学与智能技术卓越创新中心(CEBSIT)副主任
熊志奇(Zhi-Qi Xiong):中国科学院上海生命科学研究院神经科学研究所副所长及该所脑疾病机理(Brain Disease Mechanisms)部门负责人
叶玉如(Nancy Y. Ip):香港科技大学生命科学部和分子神经科学国家重点实验室主任,香港科技大学Research and Graduate Studies副校长
徐波(Bo Xu):中国科学院自动化研究所所长,中国科学院脑科学与智能技术卓越创新中心(CEBSIT)副主任
谭铁牛(Tieniu Tan):中国科学院脑科学与智能技术卓越创新中心(CEBSIT)首席科学家,中国科学院副院长
中国脑计划(The China Brain Project)涵盖了对神经机制的基础研究和对脑疾病的诊断干预以及对脑启发智能技术的转化型研究。我们将讨论一些新出现的主题,同时会对特定的一些方面进行强调。
简介
在过去的几年中,全球各地的人们都意识到了对大脑进行研究的重要性,例如欧洲、美国和日本都启动了对大脑进行研究的项目。
中国科学家在由中国科学技术部和自然科学基金会组织举办的许多战略会议上进行了讨论,最终达成了一个共识,即:神经科学的一个普遍目标——理解人类认知的神经基础——应该成为「中国脑计划(China Brain Project)」的核心。
此外,中国也应该投入她的资源和研究能力,以满足迫切的社会需求。由主要脑疾病造成的社会压力逐渐上升,所以现在迫切需要一种预防、诊断和治疗脑疾病的新方法。在大数据的新时代,受大脑启发而得的计算方法和系统对于实现更强的人工智能和更好地利用越来越多的信息至关重要。
正是由于对这些问题的考虑,中国脑计划项目提出了「一体两翼」战略(图1)。其中对基本神经回路机制的认知的基础研究提供了输入并且接受来自脑疾病的诊断/干预和脑启发智能技术(两翼)的反馈。
标题为「脑科学与脑启发智能(Brain Science and Brain-Inspired Intelligence)」的中国脑计划项目被制定为了一个十五年计划(2016-2030年),其中前五年与中国国家社会经济发展第十三个五年计划相符。
作为中国一个相对较新的研究学科,神经科学还处在小范围领域内,几乎在所有领域都需增加政府支持来建设研究能力。另一方面,鉴于目前能力有限,该项目还需要选择一些侧重的领域进行研究,特别是那些中国科学家具有优势并且更可能作出重大贡献的领域。
认知的神经回路机制
理解人类的认知过程是人类理解自然的一个终极挑战。它不仅需要描述与不同层面的认知相关的现象(从行为到神经系统和回路再到细胞和分子),而且需要对在不同层面观察到的现象之间的因果联系的机械理解(mechanistic understanding)。
由于脑成像技术和分子与细胞生物学的快速发展,在宏观和微观层面上对脑的理解已经取得了很大的进展。然而,由于我们在介观层面的知识有一个巨大的漏洞,所以我们很少知道特定类型的神经元是如何在大脑的不同区域组装成神经回路的,我们也不太清楚特定的神经回路在认知过程和行为中是如何执行它们的信号处理功能的。对这些活动的理解都需要神经回路在单细胞分辨率和神经元活动的时空模式的体系结构的详细信息。
为了理解脑的介观层面,我们必须识别所有神经元的类型,在一个多世纪以前,Ramon y Cajal发起了一个仅仅基于神经元的形态学(neuronal morphology)的项目。单细胞RNA测序方法的最新进展通过基于其独特的蛋白质表达形式对神经元进行分类加快了细胞类型鉴定的步伐。然而,蛋白质的表达具有神经元状态依赖性,并且在一些情况下可能难以从相同神经元类型的新状态中区分新细胞类型。由于给定脑区域中相同类型的神经元可能通过其不同的输入和输出连接性来执行相同的回路功能,映射每个神经元的所有局部和远程连接(「单神经元连接组(single-neuron connectome)」)变得对于定义神经元类型而言很重要。
在这里,通过单细胞RNA测序分析描绘相对特定的分子标记划分,并且可以反复使用一种通过输入输出连接和分子标记的独特模式的单神经元连接组分析的方法来最终定义神经元的类型。一旦定义了细胞类型,在神经元中表达的特异性分子探针就可用于监测和扰乱它们的活性,以便剖析基于脑认知和行为的神经回路机制。
我们中的乐观主义者可能期望在接下来的二十年内完成对神经回路及其活动模式的介观测绘(mesoscopic mapping),甚至完成对动物模型(如果蝇、斑马鱼和啮齿动物)认知过程的基本逻辑和机制的理解。在这些小动物模型中我们可以调查对外部世界的基本认知,包括感觉知觉、感觉运动变换、分类、概念形成和决策。这些研究可以为在介观水平理解保守认知机制提供基础。
另一方面,自我和非自我、共情和心智理论(self and non-self, empathy, and theory of mind)的认知可能仅存在于非人类灵长类动物(NHP)中。这些高级认知功能是语言进化的前奏,是人类的独特认知能力。灵长类动物大脑皮层的爆发性增长被赋予了新的连接性,其可以限定许多新的神经元类型和在其它动物模型中不存在的回路。在啮齿动物研究中开发的许多技术现在适用于非人类灵长类动物(Stauffer et al., 2016)。
我们认为,鉴于中国NHP的资源丰富,中国脑计划项目对猕猴(macaque)脑的介观回路分析应该有一个基本的NHP组件,与其它关注非灵长类动物模型的项目并列。虽然NHP项目可能需要比啮齿动物项目持续更长的时间,但它是脑部科学必须达到的最终目标。
和日本的Brain/MIND项目中对狨猴(marmosets)的关注一样,中国脑计划可以在研究猕猴(macaque monkeys)的认知方面做出重要贡献。如上所述,猕猴神经回路的介观结构和功能映射将需要通过单细胞RNA-seq和单神经元连接组分析的细胞类型鉴定。还有一个迫切需要研究的内容是:NHP在认知过程中的回路机制,因为在NHP中发现的介观和宏观成像之间的关系将有利于在神经回路水平对人类大脑成像数据的解释,可以极大地促进人类脑部疾病的诊断/治疗方法的发展,同时也有利于人工神经网络和多用途智能设备的新架构的设计。
脑部疾病的早期诊断和干预
据估计,目前在中国的13亿人口之中,约有五分之一患有慢性精神疾病或者神经衰退性疾病(Phillips et al., 2009, Chan et al., 2013)。中国脑计划旨在研究致病机制并为发展性(例如自闭症和智力迟钝)、神经精神性(例如抑郁症和成瘾症)和神经衰退性(例如阿尔兹海默病[AD]和帕金森病[PD])的脑科疾病开发出有效的诊断和治疗方法。这些疾病相关的、不断升级的社会负担的紧迫性和当前疗法对于在症状前和前驱期的早期诊断的无效性的减少,使得可以引入早期干预来停止或者延迟疾病的发展。
早期的诊断将受益于在分子、细胞和神经回路层面上解开疾病病理生理学的研究。基于组学的方法(omics-based approaches)将有助于识别遗传因素、细胞类型特异性表观遗传因子、蛋白质的表达和修饰、脂质的组成和代谢。大量样品的高通量分析将有助于鉴定疾病特异性预后标志物(prognostic markers),并阐明遗传和环境因素之间的相互作用。对于发展型疾病(developmental disorders)而言,确定神经的形成、神经元迁移和分化、突触的形成及其可塑性以及神经回路的发育的机制是非常关键的。患者衍生的诱导多能性干细胞(iPSC/induced pluripotent stem cell)可用于开发体外模型(例如,3D脑培养、类器官),其复制了人类病症以验证遗传风险的因素和并破译其特异性细胞疾病表型。
对患有疾病症状的患者的脑成像研究将有助于识别各种脑区域的结构和功能异常。基于所识别的分子靶标(molecular targets)的基因编辑的脑疾病NHP模型将提供用于理解发病机制和用于开发药理学和生理干预方法的进一步信息。早期使用药物来干预疾病进展——特别是对于神经衰退性疾病(比如AD)——是未来药物开发的希望的方向,如被最近使用前驱或轻度AD的抗体治疗的临床试验的进展所启发的(Sevigny et al., 2016)。
鉴于大多数脑疾病由于常见的神经回路障碍而显示出重叠的症状(overlapping symptoms),特定的脑功能定量测试将提供有价值的信息,用于识别高风险人群的特定大脑功能的早期干预。使用旨在增强特定脑功能的广泛训练方案的生理干预已经显示出预防许多神经和精神病症的希望。物理刺激的使用(涉及到诸如经颅刺激和经颅直流电刺激的工具)已经引起了对脑疾病的治疗处理的广泛关注,但是这些工具的使用却缺乏特异性和生理健康的基本条件。识别基于各种功能障碍的特定神经回路以及空间和时间上更精确的刺激方法将促进防止特定回路功能恶化的神经调节作用。
早期的诊断和干预方法的开发需要从大量健康和高危受试者收集纵向数据。这只有通过科学家、临床医生和公共卫生组织之间的良好的协调努力才能办到。中国拥有世界上最大的几乎所有种类的主要脑部疾病的患者群体,所以迫切地需要早期诊断和干预。随着生活水平的不断提高和公共卫生系统的不断完善,政府对所有公民的充分医疗保障的坚定承诺以及社会动员的传统,中国脑计划很好地组织了大规模的项目,旨在发现有效的早期诊断和干预的方法。这包括为大量人群建立长期脑部健康记录,将定量脑功能测试作为定期健康检查的一部分,以及脑成像数据库、基于血液的生物库和健康以及患病的脑部的国家存储库。只有当许多研究中心的能力与标准化数据收集和处理相结合并且数据共享和信用分配的机制已经建立时,大型患者群体用于脑疾病研究的优势才会变得明显。
中医的引入
基于精神病学和神经变性疾病的致病机制的复杂性导致在过去几十年当中在开发有效药物上一直难有进展。已经表明:用多靶点(multi-target)药物而非单靶点(single-target)药物靶向这些疾病可能更加有效。几百年来,有很多文献很好地记录了中医(CM/Chinese medicine)成功治疗各种疾病的例子,尽管其基本机制在很大程度上都是未知的。
作为多组分药物,CM制剂可能通过作用于多种效应物而显示出治疗效果,因此它成为了潜在的神经药物的宝库。然而,现代医学实践当中CM的使用受到其对经验积累的依赖性而非基于证据的研究的阻碍,在许多基于CM的药物中难以复制草药提取物的标准化混合物的剂量和组成,导致了缺乏治疗效果的精确信息。并且只有非常少的设计良好的临床试验来提供有效的证据或安全研究来确保药物满足其所需的相同的监管标准。
为CM的实践提供科学依据所做的努力包括在生药学(pharmacognosy)、植物化学和药理学等领域进行的系统的研究,以收集大量不同药材的信息和发展其应用的关键理论(Qiu, 2015)。但是还需要更多的协调努力来建立各种草药配方的治疗效果的临床证据,并且许多研究人员现在正在从药用草药中分离活性成分,从粗制成分化为单一化合物(Fan et al., 2006)。
这些分离的化合物的天然产物库也已经被开发来容易地筛选具有特定生物活性的分子,包括在神经系统的分子,其中鉴定的化合物面临着严格的临床前开发,类似于药物的最佳选择。最近也有使用这种方法来鉴定AD的潜在神经药物前导(neuro-drug leads)(Fu et al., 2014)。
现在技术的进步有助于我们理解中医草药是如何发挥效用的。例如,基因转录分析可用于提取表征草本提取物、化合物或制剂的作用机制,以便测量它们在分子、细胞和身体层面上的作用。收集这些信息以开发连通性图谱(connectivity map)并扫描不同疾病状态的分子标记,可以促进这些活性组分的特定作用机制和生理过程的识别(Lamb et al., 2006)。
利用CM的临床潜力的其他创新方法包括数学模型和算法,来设计不用CM成分的最佳混合物。基于闭环反馈反馈控制过程,可以智能方式利用CM大量的数据,这大大降低了费用和劳动密集型分析,同时提高鉴定有效协同药物组合的可能性(Nowak-Sliwinska et al., 2016)。临床设计、质量控制和安全性研究的改进将进一步是现代医学发掘CM难以发现的好处,释放其在临床药物治疗中的内在价值。通过有组织地全国性努力,中国脑计划可以将这种独特的资源用于神经药物的发现和发展。
非人类灵长类动物研究
由于NHP的系统发育最接近人类,它们是研究人类认知功能以及探索发病机制和脑疾病治疗方法的杰出动物模型。中国科学家对NHP的使用兴趣日渐增强,而新的NHP研究设施正在许多科研机构中建立起来。例如中国科学院昆明动物学研究所(CAS),其用于研究目的的猕猴数量已相当庞大,该所是NHP向国家灵长类动物资源中心进行转移的一个环节,可能是中国最大的NHP研究资源。云南昆明的灵长类生物医学研究重点实验室目前拥有一批基因编辑型猴,它们可以作为杜氏肌营养不良症、自闭症和PD的模型。
CAS用于疫苗开发所维护的一个NHP设施目前正将其兴趣转向开发脑部疾病的NHP模型。最后,中国科学院上海神经科学研究所已为猕猴和狨猴以及致力于生殖生物学、基因编辑模型、系统神经生理学和NHP认知行为理论的十个研究实验室建立起华东地区最大的NHP研究设施。
在过去,外科手术和化学诱导已被用来生成NHP模型,用于治疗如药物成瘾、脊髓损伤、癫痫、PD和AD(Zhang et al., 2014)等大脑疾病。近年来,转基因和基因编辑方法已开始被用于开发NHP模型来研究这些带有明显遗传因素的疾病,包括亨廷顿病、PD、杜氏肌营养不良症和自闭症谱系障碍(Chen et al., 2016, Liu et al., 2016a)。
病毒介导的基因传递(virus-mediated gene delivery)是产生能够合成α-突触核蛋白与MeCP2的转基因猴的主要方法。新的基因编辑技术已被用来生成基因编辑型NHP模型(Chen et al., 2016):TALEN技术被用来揭开MeCP2中的人类突变之谜,对MECP2基因缺失引起的雷特综合征进行建模,而CRISPR-Cas9方法在对猕猴非神经元基因、抗肌萎缩蛋白的删除实验中被首次实现,该方法同样也实现了单细胞阶段猕猴胚胎的Ppar-γ和Rag1 γ双基因敲除。值得注意的是,p53等位基因被敲除的同时也导致了一代纯合突变型猴子(homozygous mutant monkeys)(Chen et al., 2016)。
虽然目前可以使用睾丸异种移植技术(testis xenografting technique)促进精子成熟,使猕猴生成F1的时间(5–6年)被缩短到2.5年,但猕猴漫长的性成熟期及妊娠期对需要种系传播的转基因NHP模型的开发形成一道巨大障碍(Liu et al., 2016a, Liu et al., 2016b)。
丰富的NHP资源以及对NHP浓厚的使用兴趣并不意味着人们对NHP实验的道德标准在中国会更加宽松(Zhang et al., 2014)。中国脑计划旨在为与国际标准兼容的NHP实验建立全国道德规范,并促使人们认识到NHP研究对于开发人类疾病(特别是脑功能紊乱)的有效治疗方法以及提高人们对人类大脑进化和功能的了解是不可缺少的,鉴于欧洲和美国NHP研究的减少,亚洲国家的脑计划还肩负着脑神经科学领域维持NHP研究传统、培养新一代灵长类动物神经生物学家的重任。
脑启发计算
神经科学专注于神经编码、神经动力学和神经回路的详细研究,而机器学习倾向于追求成本函数的蛮力(brute-force)优化,通常使用简单和相对均匀的初始架构(Marblestone et al.2016)。最近的研究进展显示:人工智能和深度学习完全有能力在有限的特定领域承担认知任务。
尽管AI系统(如AlphaGo)在某些任务中胜过人类(Silver et al., 2016),但他们仍然缺乏概括能力和将所学到的知识从一个(领域)迁移到另一个任务(领域)的能力。此外,深度学习模型数量庞大的参数需要劳动密集的标记数据来调整。另一个关键问题是训练数据运行这些AI系统需要很大的计算代价和高吞吐量的数据。人类大脑是目前唯一真正的智能系统,能耗极低,且具有的不同认知功能。显然,学习大脑的信息处理机制,去建立更强大和更通用的机器智能是非常有前景的。
虽然我们远不能完全理解大脑的工作原理,但当前来自神经科学的发现可以从若干角度影响人工智能的研究。
从结构的角度看,不同类型的神经元的形态,在发育和学习期间的稳定连接和修整,大脑皮质的分层体系结构,脑区域内、区域间的前馈和反馈连接,以及多层脑构建块的模体(motifs)为人工神经网络的建立设计提供了新的见解。从机制角度看,尖峰信息编码和解码,具有不同功能的不同类型的尖峰神经元,多种突触类型和可塑性机制,用于从短期到长期记忆的转换的规则,以及在不同级别的信息处理的集成(神经元、微电路、脑区域)为通用人工智能设计高效计算模型和算法的操作理论带来了灵感。
从行为角度来看,不同的认知功能是如何由大脑协调和整合?通过对这一问题进行观察和分析,将为那些在认知表现方面类似大脑的智能系统带来灵感和评估标准。
大脑通过进化成为一个高能效系统。其结构和底层机制可能为未来计算基础设施的设计提供灵感。与传统的计算不同,神经系统以计算和存储绑定的方式处理信息。
在设计神经形态芯片方面,通过应用神经回路一些微观层面的原理,如Integrate-and-Fire非线性神经元性质、放电时序依赖可塑性、集成计算和存储,人们正专注设计研发高能量效率的脑启发芯片(Tuma et al., 2016)。未来,为了在信息处理中实现高效和高吞吐量,模拟有组织结构的皮层柱、脑区和神经通路连接多个脑区来构建芯片模块,这是更高层次的架构。
中国脑计划旨在在多个层次更深入地了解大脑的机制和原则,并促进神经科学家和AI研究人员之间的深入和密切的合作。认知计算模型和脑启发芯片将是智能方面的主要焦点。在计算模型层面,将探索更多具有生物可行性的学习机制的人工神经网络算法。在网络架构层面,典型的人类认知行为将通过引入网络内的大脑样域和子域来建模,这些域将通过学习被协调,整合和修改。目标是在多个层面,理论上模拟大脑的机制和结构,开发一个更具有普遍性的AI以满足大型挑战,包括多任务,学习和自适应。
机器与人类智能
人工智能在过去几十年中的成就,包括最近的深度学习模型,已经受到了一部分神经科学的启发。最近的发展主要集中在目标的单一优化原理,例如最小化分类误差。所以它在多层和递归网络形成了丰富的内部表示,产生了强大的算法(LeCun等,2015)。
在过去五年中,深度学习在解决各种问题,如语音识别,图像识别和分类以及自然语言处理方面取得了巨大的成功。在语音识别领域,IBM和Microsoft已经宣布,在人类电话呼叫会话测试中,已经达到了95%的精度,大大超过了已经稳定了十年的水平。
在计算机视觉领域,ImageNet分类挑战赛中,深度学习网络在定位和识别数百种对象时超越了人类的表现。在自然语言处理领域,基于LSTM的序列对序列模型几乎达到人类级别。从互联网收集的数百万个图像文本对进行训练之后,机器甚至可以使用自然语言来标注图像。在所有上述示例中,都在使用结构化的架构,包括用于注意,递归和各种形式的长短期存储器的专用系统。
然而,由大规模训练数据驱动的模型将面临更加开放性和不明确的任务所带来的巨大挑战,如自然语言理解、人类对话系统(human dialog system)、通用视觉信息检索(general visual information retrieval)以及能适应复杂环境的机器人。向大脑机制过渡,人工智能系统将展示更强的智能,逐步减少训练数据量甚至实现无监督学习。
此外,它们预期可以加工和整合多模态信息(multimodal information),同时能够并行处理多个任务。已经出现了很多新型的更专一化的神经网络来应对这些挑战,例如它们会随着层和时间的推移而改变。对抗网络(adversarial network)的新进步(其代价函数(cost function)的定义来自另一网络)使得生成模型(generative model)基于梯度的训练成为可能(Goodfellow等人,2014)。这种由一系列相互作用的代价函数实现的非均匀优化的系统,使得机器学习非常高效和精确,它是机器智能的未来方向之一。
开发机器智能的另一个重要课题是建立可以有效地与人类和本地环境进行交互的人工智能平台,使人与机器都能参与问题的解决。认知机器人(cognitive robotic)可以作为这种集成平台,它整合了很多大脑类研究的工作。传统的机器人研究侧重于控制理论和数学优化。这些模型在结构化环境和特定任务(例如,工厂中的机器人臂)条件下工作良好,但跳出这个范围,即使在不太复杂的环境中也无法正确行动。
通过协调和整合多感官输入,并且根据信息具有更灵活的执行机制,机器人技术已经取得了巨大的进步。但对于认知机器人,可以从网络结构、操作原理和大脑中感觉运动转换的电路机制(包括多感觉集成、决策、运动规划、运动协调和执行)学习到更多的内容,这些内容是基于学习的行动和来自经验的自我修正。
中国脑计划(The China Brain Project)将致力于开发认知机器人,并将其作为一个集成脑相关计算模型和设备的平台。该项目的目标是建立能与人类高度互动并在不确定的环境中恰当反应的智能机器人,这些机器人具有通过交互式学习积累的解决各种问题的能力,以及迁移和总结从不同任务学习到的知识——甚至与其它机器人共享学来的知识。人与机器之间的接口是必不可少的;机器人不仅需要了解人的意思并灵活反应,而且还需要学习理解人类的潜在意图以及人类做出决策的方式。因此,当我们能够建立一个能够情感上共鸣和达到心智标准、具有人类和少数灵长生物认知标志的机器人,那将是认知机器人的一个里程碑。
结语
基础和应用神经科学的未来突破不仅取决于个人实验室里的原始发现和技术发展,而且还取决于来自不同学科的大型研究团队的合作努力。
正如物理学和天文学前沿的最新进展所例证的,成功的关键往往在于团队工作的有效组织,这要求参与者在公平分担义务和信用方面达成共识。这对团队工作特别重要,它需要科学家将他们主要的研究工作和资源投入到项目中。此外,对于合作工作与独立成就,在评估科学家的成就时,我们的研究机构赋予合作工作越来越重要的权重,尤其是对于正建立自己的研究生涯的年轻科学家来说。在生物科学方面,我们的机构尚未采用有利于团队工作的评价制度,例如任期审查制度。
完全理解人类大脑的结构和功能是神经科学的一个有吸引力但遥远的目标。然而,神经科学已有的对大脑的有限理解已经有助于解决我们社会面临的一些紧急问题。
例如,在我们充分理解阿尔兹海默症(AD)的发病机制之前,我们可以鉴定阿尔兹海默症的早期分子或功能性标志。中国大脑项目希望在基础和应用神经科学之间实现平衡,使得一部分研究科学家能够追求他们的兴趣探索大脑的秘密,同时其他人可以应用我们已经获得的研究成果,来预防和治疗脑疾病并开发脑相关智能技术。
(来源:Neuron 机器之心编译2017年2月8日)
综合信息