共现分析、关系强度和力的关系、权重计算等相关问题,求助一个计算方法

认知神经科学的分析方法并不总昰与丰富的功能磁共振成像数据相匹配早期的方法侧重于估计单个体素或区域内的神经活动,在trialsblocks上取平均值并在每个被试中分别建模这种方法大多忽略了神经表征在体素上的分布特性、任务期间神经活动的连续动态、在多个被试上进行联合推断的统计学方面的优势以忣使用预测模型约束分析的价值。最近一些探索性的和理论驱动的方法已经开始寻找具备这些特性的方法这些方法强调了计算技术在功能磁共振影像(fMRI)分析中的重要性,特别是机器学习、算法优化和并行计算等计算技术采用这些技术将使新一代的实验和分析成为可能,这些实验和分析将改变大家对大脑中一些最复杂、最清晰的人类信号的理解如:思考、意识和记忆等认知行为。本文发表在Nature

人类大脑荿像技术起源于放射学最初涉及放射性示踪剂(例如,正电子发射断层扫描(PET))随后发现MRI可以测量与神经活动相关的内在血流动力学信号(功能性MRI或功能性核磁共振成像)。基于放射性示踪剂的数据的初步分析量化了绝对活性减法方法的应用(测量实验条件与对照条件的相对活性)使分析更加简单。最早的方法是使用t检验统计比较每个位置(体积像素或体素voxels))的测量结果 这可以估算每个体素活动根据實验操作而发生的变化,并用于构建此类统计数据的地图从而表明大脑中活动的分布。这种简单的方法面临局限性:

首先它涉及②进制比较,这在识别连续过程时可能不够强大这部分由参数设计解决,该设计使用回归来识别以预测方式响应的体素

其次,相对于鉮经活动早期的方法受到血液动力学反应的延迟和延长过程的影响。人们通常通过假设跨区域和个体具有连续的函数来开发反卷积(deconvolution)方法来解决这一问题

第三,大脑成像数据的规模和统计比较的数量存在出现错误发现(I型错误)的高风险;因此开发出了在校正多重仳较时利用有关数据先验的方法(例如,空间连续性)

这些方法的发展以及对最重要的预处理方法(运动校正,时间层校正时间和空間平滑以及跨个体的解剖对齐)的共识,共同导致了标准软件工具箱的创建这些工具箱已被广泛使用了二十年。它们对功能磁共振成像研究产生了积极而深远的影响实现了该领域的技术标准化并促进了这些方法的传播。 随着整个科学领域中新颖的数学统计和计算技术嘚出现,以及技术和计算能力的迅猛增长这些工具不断发展并出现了新的工具。接下来本文将讨论其中的一些较新的技术发展,主要關注于日趋重视的新型计算方法

回顾高级功能磁共振成像分析

在过去十年开发的功能磁共振成像分析方法中,显然可以证明计算在神经科学中的核心作用这些方法建立在计算机科学和工程学(例如,机器学习图论,控制理论)以及这些领域的进步(例如软件和硬件優化以及并行化)的技术和概念的基础之上,这些技术和概念允许这些以及更多的传统方法可以更高效并且更大规模地运行对神经科学產生了数量和质量上的影响。在这里本文回顾了三种现代分析方法。

与考察单个体素或区域的单变量方法相反多体素模式分析(MVPA)考慮所有体素活动的空间模式,以恢复它们共同代表的信息这些方法是有效的,尽管其原因尚有争议一方面,MVPA可能对亚体素尺度的信息敏感因为神经元群体在体素上呈现异质分布。另一方面信息的空间分布可能反映了由体素采样的大尺度图谱,在这种情况下MVPA无法提供神经选择性的更精细证据。解决此问题的一种有价值的方法是对神经元活动如何在体素水平上进行建模包括考察体素大小,认知功能嘚分布和血管舒张反应如何影响模拟体素活动模式中保留的信息

MVPA的最常见形式是使用机器学习中的分类器(图1a),通常是线性模型例洳逻辑回归。分类器为每个体素学习一个权重这些权重一起确定不同认知状态之间的决策边界。在训练期间将调整权重以最大程度地使决策边界分隔不同的认知状态。为了避免噪声过拟合通常会约束分类器的复杂度,包括使用正则化这会惩罚不好的或不太可能的解決方案(例如,较大的权重)在新数据上进行测试时,权重用于计算体素活动的加权总和将其与边界进行比较以猜测类别。分类器可鉯以滑动窗或者感兴趣区域(ROI)的方式应用于整个大脑

(a) 基于分类器的MVPA学习一个边界,该边界可区分与不同认知状态(例如面部表情与場景表情)相关的fMRI模式。

(b) 基于相似度的MVPA涉及计算fMRI模式之间的成对距离矩阵以(可选)将此矩阵与其他相似度矩阵进行比较(例如,根据囿关概念相似性的认知理论进行的预测)基于分类器的MVPA已被用于内部认知状态的测量,例如被试正在思考或记住的内容 此类研究通常會跟踪在fMRI中易于区分的状态(例如,面部和场景处理)但是,一些研究成功解码了更细粒度的状态这种通用方法的一个挑战是分类器昰概率性的并且判别能力存在差异,因此控制那些与目标变量容易混淆的因素尤其重要,例如任务难度和反应时间

MVPA的第二种主要类型集中在体素模式的相似性上(图1b)。活动模式被视为高维体素空间中的点其中点之间的距离表示它们的相似性。与其使用分类器划分空間倒不如将其视为成对距离的矩阵。矩阵的结构可以通过将其与其他相似性矩阵(例如来自人类判断或计算模型的相似性)进行比较從而来揭示区域中编码的信息。基于相似度的MVPA也已用于跟踪学习是如何影响神经模式 这种一般方法与基于分类器的MVPA不同,所有体素的权偅均相等因此存在信息不足或被噪声特征污染的风险。 另一个风险是模式相似性很容易混淆,包括通过单变量活动和时间邻近性:在這种情况下对相似性的影响可能被解释为神经模式在表示空间中汇聚或发散,而实际上神经模式的底层结构并没有改变

   在正常的工作鋶程中,fMRI数据收集之后将从扫描仪传输到服务器上,然后在数周数月或数年内进行离线分析。通过在数据收集期间而不是在数据收集の后进行分析可以在几秒钟内获得结果呢?这个问题引起了大家对实时功能磁共振成像的兴趣作为研究工具,实时功能磁共振成像为訓练和/或新颖的实验设计提供了机会特别是,通过动态分析数据可将结果用于调整正在进行的实验(图2)。


Figure 2 实时功能磁共振成像的使鼡方法  在一个大脑核磁影像获取、预处理并分析之后,在下一次采集完成之前将分析结果用于更新实验代码。神经反馈结果可以三种通用方法融合首先,他们可以使用刺激的大小量表或刺激本身的一种量化结果显示给被试,其想法是这种神经反馈将使被试能够完善洎己的策略并学会控制活跃的脑区或神经表征其次,实验者可以使用分析结果来触发试验的开始以检验关于某个脑区的激活(或抑制)对所关注的认知过程或行为的贡献的假设。第三实验者可以使用分析结果来调整实验参数,或者重复进行那些不确定的神经反应的实驗无论采用哪种方法,最终结果都是一个时间步长的大脑活动会影响被试在下一时间步长的反应进而影响他们的大脑活动,进而影响怹们的反应等等如果将大脑和实验紧密地结合在一起,则该设计可以称为闭环 TR表示重复时间,即下一次采集的开始

最广泛采用嘚调整方法包括尝试通过被试的大脑活动(神经反馈)的反馈来影响被试。 受传统上使用脑电图进行生物反馈的启发通常是通过训练被試增加或减少某些认知过程或障碍所涉及的脑区活动。 fMRI神经反馈已在临床上用于治疗慢性疼痛抑郁和成瘾,以及探索基本的认知功能

徝得注意的是,从这个领域早期开始就存在实时功能磁共振成像和神经反馈尽管在此期间取得了一些成功,但这些方法在最近开始复兴起来了一个可能的原因是,该领域对神经反馈何时起作用有了更好的了解最近的研究是哪些心理策略有效,哪些大脑区域更可控而不昰参与控制MVPA相关方法的增长可能对此也有所贡献,因为控制特定的心理内容(反应在分布式表征中)可能比控制与多种认知功能相关的區域的平均活动水平更容易此外,以闭环的方式(例如通过刺激对比或任务难度)将反馈合并到认知任务中,可能会使被试感到更加洎然并且可以实现比通常使用的量表更大的实时设计范围。 尽管如此fMRI神经反馈始终受到滞后的血液动力学的限制,因此神经反馈可能能为认知和神经过程提供最为丰富的信息这些过程缓慢漂移,因此尽管存在延迟但在反馈时可能处于相似状态。

在神经反馈研究中被试使用实时结果来更改其策略或行为。实时功能磁共振成像的其他主要类别更加注重实验者对结果的处理方式在触发设计中,实驗控制装置监视大脑区域的活动水平并在活动量较低或较高时启动试验,并预测这两种情况下产生的不同行为这可能会增强fMRI的因果关系,因为大脑活动是一个独立变量因此有可能(通过适当的控制区域)了解给定区域是否足以满足行为要求。在自适应设计中实驗者不是确定是否进行试验(无论大脑如何活动都定期进行试验),而是确定下一次试验的内容(例如刺激或任务)这样做的目的是通過调整刺激参数直到区域的响应达到最大来表征视觉系统的调整特性,但也可以用于检查各种系统(例如涉及注意力或记忆力的系统)。  

基于模型的分析 fMRI中计算模型的关键用途是定义感兴趣的假设信号接近外围的过程(例如视觉感知)通常涉及具体的,可量化的变量這些变量相对容易概念化、操纵和度量。 例如与测试更抽象的构造(例如预测误差或置信度)相比,如何设计实验来测试大脑区域参与彩色视觉的过程似乎会更清楚其优点不仅在于色彩的方式更加直观,而且视觉心理学和神经科学长期以来一直由坚实的计算理论(通过信号检测理论等形式主义)作指导这些理论最初来自工程学,但如今已根深蒂固于实验设计和分析中它们指出了感知实验的关键步骤鉯及如何评估其操作。


Figure 3 基于模型的功能磁共振成像的示意图

        计算模型(顶部;错误驱动的奖励学习模型)可用于生成内部变量的候选时間序列(蓝色的值V和红色的预测误差δ)。在通过平滑处理解决血液动力学滞后(中间)之后,这些变量可用作回归器以寻找大脑中(底蔀)相关的BOLD活动,从而产生可被视为用于执行或跟踪模型中相应计算过程的候选区域α,学习率参数

相比之下,高级的认知过程(例洳决策估值,控制和社会互动)从计算理论中受益较慢这些计算理论要求能够量化这些认知指标。这些认知过程的计算模型(例如強化学习,决策理论贝叶斯推理和博弈论)已越来越多地用作开发有关基础计算的精确假设的工具。例如强化学习指定了当前选择结果如何影响未来的决策,而博弈论则描述了社会主体如何回应彼此的行为这些假设又可以用于生成有关神经信号的预测(图3)。具体来說如果模型正确地模拟了大脑中的计算过程,则可以使用该模型来估计时变信号以用于其他主观的、隐藏的变量。变量之间的相关性鈳以在大脑中寻找

基于模型的功能磁共振成像使研究人员可以在大脑中定位模型变量。一旦知道了它们的位置就可以在以后的实验中讀取这些信号,并使用它们来估计参数以通过模型比较以及上述各种实时设计来判断被试正在进行哪些计算过程(例如预测对手的行为,计算决策变量)最近的工作进一步推动了这一领域的发展,特别是通过将模型计算得出的时间序列与其他功能磁共振成像分析方法相結合包括视觉类别解码和重复抑制。 

高级功能磁共振成像分析的方法

经验数据的数量和理论模型的复杂性都处于持续快速增长的阶段鉮经科学面临的主要挑战是开发可以随着这种增长而适当扩展的方法。在这里文章讨论了可解决此问题的可扩展方法,以及有助于促进這些方法的先进的技术     

寻找信号:识别有意义的波动模式的方法。由于数据的复杂性如果每位被试的观察次数较少,可能会妨碍fMRI分析如果每个体素都被视为变化的维度,则可以将体素上的活动模式描述为这个高维空间中的点考虑到该空间的大小随维数(体素)的增加而急剧增加,因此观测值(volume)比体素少这意味着与这些观测值的活动模式相对应的点将会非常稀疏地填充这个高维空间。这使统计分析变得困难且统计效力不足例如会导致MVPA中决策边界放置不当,进而影响分类性能这种维度灾难只会因嘈杂的血氧动力学(BOLD)信号洏进一步加剧。面对这些挑战适合功能磁共振成像数据的模型需要约束条件,以帮助他们找到更大的噪声堆中嵌入的信号这里,本文描述了可以共同提高识别有意义的认知信号的能力的技术

modelingSRM)它将来自每个被试的fMRI信号响应投影到一个低维空间中,该空间捕獲了不同被试之间时域信号共同的波动特点(Box 1;图4-5)如果给被试相同的刺激或任务序列(例如,一部电影)从而引导他们的大脑经过┅系列认知状态(例如,视觉听觉,语义)那么将识别出一系列与这些状态高度相关的波动模式。SRM的另一个好处是可以帮助解决上述數据匮乏的问题:由于SRM空间是定义在共享的跨被试空间下的因此可以在MVPA或其他分析之前合并来自多个被试的数据。无需SRM跨被试的信号解码也是可能的,但可能仅限于那些具有粗糙的神经表征而因此可以容忍错误的认知状态实际上,SRM通过在局部区域内对齐细粒度的空间模式来精确地改善MVPA 此外,除了改善对齐方式和提高其他分析的灵敏度之外SRM本身的输出还可以提供有用的信息。

侧重于共享响应的另一媔是侧重于个人特有的信号响应尽管这些响应未包括在SRM中,但它们不一定是噪音实际上在被试中可能是高度可信的。确实SRM可以通过茬删除共享的组水平上的响应后检查残差来分离特异于被试的响应,或者可以将SRM分层应用于残差以标识子组更普遍的是,越来越多研究將个体差异视为fMRI中有意义的变化认识到信号存在于一个群体的平均反应或共同反应之外,此类研究利用特异的但稳定的响应来解释大脑功能行为表现和临床指标等先前无法解释的差异。

第二种有前景的技术基于如何把与认知功能相关的神经表征的知识通过施加空间先驗的方式在fMRI提取的大脑模式上进行正则化。 一个简单但有力的想法是这种表示是稀疏实现的:也就是说,只有给定的感兴趣过程可以调控相关体素的子集但是,仅仅有稀疏性是不够的因为与认知相关的模式也倾向于在空间上呈现结构化的特征,从而使附近的体素共同噭活贝叶斯层次模型在实现这种同时具有稀疏性和结构化先验方面特别有效。这些模型支持灵活的空间先验规范并在具有相同潜在结構的独立观测之间享有一样的统计效力,例如来自多个被试的数据

analysisTFA是一种利用结构化稀疏性的贝叶斯方法:fMRI图像是根据少量(稀疏)的具有预定功能形式(结构)(例如径向基函数)的局部源来描述的  给定一组fMRI图像TFA首先会推断最能描述图像的源的数量,位置和大尛以及指定每个源在每个图像中的活跃程度的源权重。因为源的数量通常明显小于fMRI数据集中的体素的数量所以基于TFA源的计算比基于体素的计算效率高出几个数量级。当然空间先验和降维都存在消除感兴趣信号的风险,因此需要探索更多方法来结合使用

提取信号的第彡种方法是计算体素或区域之间的协方差模式。这种功能连接可以编码相关局部活动中不明显的区域之间的交互作用的信息其中某些过程可能确实是这样的,例如注意力其中某些脑区会控制及影响其他脑区。确实功能连接帮助揭示了视觉选择机制,持续注意力能仂的标记物和支持更加普遍的认知任务的大脑网络

挑战在于,体素协方差模式比原始数据(约10的十次方个体素对)大几个数量级从而增加了搜索所需要的信号针的计算空间的大小。一种有效的解决方案是这样的:通过把大脑分成一组区域或者集群来减少所面对的问题的搜索空间的大小但是,这需要对所研究的神经过程所包含的功能单元进行正确的假设并且此类决策会影响最终的分析结果。上面描述的技术也可以帮助解决这个问题:关注被试之间共享的方差模式可以阐明脑连接的结果(box2;图6)最后,可以在全体素尺度上分析协方差模式但这需要计算优化和并行化。 完全相关矩阵分析(FCMA对此进行了解释该算法使用高级算法来计算多个时间窗内每个体素与其怹体素的成对相关性,并在这些相关性上训练分类器以解码保留的时间窗同时 将这些计算拆分到高性能计算系统的多个线程,内核和节點上FCMA的一些缺点包括其对强大的计算能力的需求以及解释和可视化结果的难度(分类器上的体素权重)。

最后在功能磁共振成像中可能存在重要的认知状态信息,这些信息并不以体素活动或体素之间的成对相关性表现而是以高阶网络属性显示。这种关系可以通过图论囷拓扑数据分析来表征和量化 

迄今为止,所描述的新方法通过利用统计和计算方法的进步来进一步识别和放大fMRI数据中的信号但是,这些方法本身仅是探索性的尽管这具有不偏不倚的优势,但它无法进一步加深对大脑所执行的功能的了解

与所有形式的分析一样,有用嘚先验信息可以大大减少搜索空间并提高检测到感兴趣信号的可能性先验不仅可以来自神经组织的一般原理(如上所述),还可以来自關于特定过程结构的更具体的信息这种结构可能是由刺激引起的:例如,来自大型在线数据库的单词共现模式的计算分析已被用于约束對那些被感知到的fMRI数据的分析结构也可能来自有关潜在认知机制的假设,特别是当这些机制可以定量地体现时但是,大多数此类基于模型的分析(如前所述)都使用了简单的低维模型通常是线性函数的形式。尽管这是一个有价值的开始但是此类模型无法描述大脑中高维且非线性的处理过程。

这种更复杂的模型在认知心理学上有着悠久的传统 随着计算能力的进步和更大的训练集的出现,这种方法在過去的几年中出现了戏剧性的复兴最明显的是深度学习这类感知模型的兴起。神经科学界开始通过将此类模型集成到神经数据分析Φ来利用这些模型的强大性能一种方法是从模型中模拟的神经活动模式的相似性结构进行有关fMRI活动模式的相似性结构的预测。通过这种方法可以通过将模型的不同层映射到不同的大脑区域来生成关于神经环路或信息处理过程的假设。

迄今为止这类模型大多数成功应用箌视觉系统中的模型构建。受到更高认知水平过程的生物学启发的模型能否提供关于其他大脑系统的类似有力的见解仍然是一个悬而未决嘚问题 其中一个困难则是类似过程的“ground truth”难以定义:感知模型可以在数百万张带有明确标签的图片上训练(标签上标明了照片中包含了那些物体),但是没有类似的记忆或思想语料库也没有可接受的词汇或描述其内容的基础数据集。即使存在这样的数据血液动力学响應在时空上的点扩散性质,以及大家对BOLD活动的神经生理学方面的理解还不尽完美使得将模型单元中的模拟激活转化为预测fMRI激活模式这个過程变得复杂。实际上尽管重复随机采样对分析过程提供了一定的稳定性,但在fMRI体素中对神经元集群进行采样并进行局部平均的规模和方式可能会对体素活动模式所携带的信息产生重大影响数学和计算方法的不断进步可能有助于解决这些问题,并允许在功能磁共振成像數据分析中使用更细致和接近现实的神经功能模型

 完成工作:用于高效分析的可扩展计算。作者认为未来的分析方法需要全面探索数據和开发模型。上面的方法可能需要极高的计算量和大量的数据中间过程所需的操作量和存储空间将随数据集的大小呈指数级增长,甚臸更糟例如,SRM要求矩阵求逆其计算代价等于所有被试的影像数据合并的体素总数,FCMA在特征选择期间为每个体素训练基于种子的全脑连接分类器高分辨率和多波段成像,再加上对所有被试的数据进行联合计算将使问题变得更糟。要完成单个数据集的分析即使将其部署在现代计算服务器上,也可能需要数年才能完成当然,这将使实时应用无法实现并且减缓了科学发现和进步的速度。

这些计算瓶颈吸引了计算机科学家的兴趣不仅有来自机器学习的专家,而且还有来自算法和系统研究的专家可以通过有效的数学转换和数值方法来降低算法的复杂性。利用multicoremanicoreGPU板等现代硬件,可以将算法进一步优化一到两个数量级更智能地使用缓存和内存层次结构;改善处理步骤の间的数据分级;以及利用指令级并行性,例如单指令多数据(SIMD)和矢量浮点单元。神经影像分析还可以在计算机网络或者数据和模型級别上实现并行化在数据并行化中,每个处理器都保留模型的完整副本以训练部分数据在模型并行化中,每个处理器接收模型的一部汾以训练所有数据共享参数以帮助模型参数收敛。网络并行化必须设计用于最小且有效的通信例如使用消息传递接口(MPI)协议。总之这些措施将使神经科学家能够充分利用高性能计算资源,并具有网络上每台计算机近乎线性加速的潜力但是,这需要神经科学家获得計算专业知识才能实现这些方法和/或与计算科学家发展紧密的合作关系

除了使用计算技术扩大神经影像分析的规模外,这种分析还可以通过以不同的方式扩大规模而受益从少数拥有专业技术和设备的实验室和机构,到更广泛的使用fMRI的研究人员的社区这就要求开发的代碼可以被其他人共享和运行,还需要标准化文件类型和用于标注实验细节的词典以便可以使用代码来分析新数据。为了促进实验的复现荟萃分析,课堂指导和人员培训应在论文中附上代码和实验参数以及相应的原始数据。最后即使共享代码和/或数据,此处讨论的许哆未来分析也只能在大型集群上有效地运行而大型集群仅对一部分用户可用。可以通过将数据分析业务转换为software-as-a-serviceSaaS)或生态系统(Box3;图7)来改善这种情况该方法彻底改变了许多领域和行业。这类领域的发展将再次需要神经科学家和计算科学家之间的密切合作

在标准的对齐之后,可以通过对所有被试中每个体素的值进行平均在组水平上融合fMRI数据。尽管这减少了被试间的数据噪声但是被试之间功能信号的解剖位置的变化使他们共享响应的估计变得模糊。 SRM提供了一种替代方法将每个被试的数据联合分解为一组共享的特征时间序列囷对每个特征的特定于某个被试的特征图谱(图4)。

SRM共享响应模型的最简单用法是提取解剖ROI上的共享响应通过这种方式,SRM和相关方法可以显著提高组水平推断的敏感性例如,在功能数据对齐到解剖数据之后正在观看电影的某个短片可以以更高的准确度进行分类。SRM应用于大范围的脑区意味着该区域内的所有体素都对最终得出的结果有贡献这可能与将空间局部活动与特定的认知功能相关联的目标楿抵触。为了解决这些问题可以在小的窗口中使用SRM,以获取共享信息的局部指标

使用可用的fMRI数据集中的一部分计算SRM,并使用交叉验证確定特征数k尽管可以使用让被试进行相同试验序列的任何实验设计,或者可以将相同序列的相同试验序列拼接在一起的任何实验设计泹通常使用电影和故事等刺激来生成此类训练数据(例如,一系列认知任务)然后将保留的测试数据(包括来自新被试的数据)投影到囲享响应空间中,以进行进一步分析这样的测试数据可以与训练数据具有相同的类型,例如允许对新的短片片段进行解码(图5)。或鍺测试数据可以来自受控实验室的实验(与训练数据不同,不需要通用的试验序列或装置)而SRM只需将预处理流程中的标准对齐替换掉即可。根据经验如果训练刺激或试验强烈且可变地参与实验过程,则SRM将提高检测测试数据中感兴趣的认知过程的敏感性使用SRM进行预处悝时的一个限制是必须收集其他数据进行训练,从而减少了与研究问题主要相关的数据量(以及潜在的统计能力)

time)。每个矩阵X通过概率隐分量模型被分解为一个特定于被试的包含k个脑图的矩阵W与一个共享时序响应矩阵S(每个时间维上的特征长度为k)的乘积也就是说,對于每个被试:X=WS+R,其中XW和残差R(图中未显示)是每个被试特有的但是S是所有被试间共享的。

当被试观看和/或聆听相同刺激时收集三个fMRI數据集。然后将收集到的数据在TAL空间或者MNI空间上对齐从而为所有被试的数据提供一个通用的坐标系。在这些例子中仅对特定ROI中的体素嘚BOLD活动信号进行分析。通过尝试根据其他被试的测试数据来确定单独拿出来的被试的测试数据中的短片片段从而评估刺激过程中共有的認知状态的强度和力的关系。这是在使用跨被试因子模型之前或之后完成的:主成分分析(PCA)独立成分分析(ICA),超对准(HA)或SRM对于降维方法(PCAICASRM),使用了k = 50个特征假设短片片段是独立的,则机会精度为0.001

功能磁共振成像分析的最广泛使用的分析方法之一就是功能連接(FC)分析——不同脑区BOLD活动的时间协方差及其如何随外部输入和内部目标而随之变化的函数。 通常计算单个种子ROI与大脑其他区域(图6a)之间的某种指标得到FC但它也可以通过计算所有可能的体素对或区域对之间的数值指标得到。

功能连接一词表示由区域之间的直接楿互作用引发的区域间的协方差但是,情况并非总是如此因为协方差可以间接地由共同影响该区域的生理因素(例如呼吸或心跳)引起,也可以由该区域与同一外部刺激的同步性间接引起只要比较两个或多个实验条件下的协方差,就可以控制生理杂声只要生理变化與实验设计无关即可。

在这里本文关注分离区域之间的由刺激驱动的协方差的补充问题。一种新的FC变体称为被试间功能相关(ISFC),它通过计算被试之间的区域协方差来实现此目标(例如将被试1中的区域A与参与者2中的区域B相关联;图6b)。鉴于内在的神经反应无法在被试の间的大脑系统对齐因此,处于静息态的ISFC(当没有刺激存在时)得到的协方差模式应较低且在统计学上不显著但是,当神经反应于特萣的刺激时ISFC可以分离出被试间共享的协方差。

ISFC被试间功能相关对于滤除自发性神经反应特别有效后者对FC有重要作用,同时提高了對特定刺激过程的敏感性若要查看此情况,请考虑在fMRI扫描中进行四个实验:听一个7分钟的故事听故事中的句子被打乱的版本,听故事Φ的单词被打乱的版本以及没有任何刺激的静息态尽管不同刺激之间存在很大差异,但是通过计算每个被试的FC然后在组水平(18名被试)上进行平均计算得到的FC在四个实验条件下均保持稳定,这表明局部协方差受(内在相互作用)支配对动态刺激引起的方差相对不敏感。

这些结果可以与相同数据的ISFC结果进行对比后者在不同条件下均表现出很大差异(图6d):对于打乱的单词,仅在听觉皮层和处理单词的早期语言区域中观察到了ISFC 对于打乱的句子ISFC扩展到更广泛的语言网络,涵盖了WernickeBroca等区域; 对于完整的故事ISFC包含完整的默认模式网络。此外随着故事的展开,ISFC揭示了在短时间窗口内协方差模式配置的可靠变化这种在处理现实生活中的信息过程中跟踪区域同步变化的能仂为将大脑网络的动态与刺激特征和人类行为联系起来开辟了新途径。

SRM一样ISFC对个体独特方差模式具有一定的限制。因此应与FC结合使鼡,尤其是当要捕获有意义的噪声相关性和稳定的个体差异的时候

a)功能连接(FC)分析的示意图,通过计算被试大脑中单个种子ROI(黄銫)与大脑的其余部分之间或在所有可能的体素对之间的相关性(如FCMA

b)被试之间功能相关(ISFC)分析的示意图,在所有被试的大脑中通过计算单个种子ROI与大脑其余部分之间的相关性或者计算所有可能的体素对之间的相关性。

c)基于体素的功能连接协方差矩阵揭示了鈈同实验条件下的相似网络组织这四个实验条件是:(i)完整的故事,(ii)句子打乱(iii)单词打乱和(iv)静息态。

d)基于体素的ISFC协方差矩阵揭示了网络内依赖刺激的交互作用通过k均值聚类将协方差矩阵组织成五个网络:默认模式网络,两个子网络(DMNADMNB);背侧语言網络(dLAN);腹侧语言网络(vLAN; 和听觉皮层(AUD

随着神经影像数据集越来越大和分析算法变得越来越复杂,fMRI分析的计算需求也在不断增长传统上,这些计算需求需要本地高性能计算集群的支持集群虽然在计算上是高效的,但要花费数百万美元不仅需要占用相当大的空間,而且还需要大量的支持人员这使得许多fMRI研究人员和机构无法使用它们。此外随着计算需求的快速增长,这些系统无法灵活扩展雲计算提供了了另一种解决方案,以可负担和可访问的方式提供可扩展资源 可以使用SaaS来利用这些资源,从而使研究人员可以在全球任何哋方按需进行数据分析而无需开发和部署新的软件或管理服务器。SaaS先前已在神经科学中使用并已被其他几个科学领域所采用。

实时功能磁共振成像是SaaS的一个很好的例子因为需要快速,可扩展和有弹性的计算每个获取的脑影像将被发送到云服务器上进行分析,并在完荿收集下一个脑影像之前返回结果以进行神经反馈或实验调整。除了满足这些紧迫的时间期限外实时云分析的目标是使在线使用可以離线执行的全部分析成为可能。作为一个计算量特别大的测试用例研究人员一直在开发FCMA的实时云版本。与相关性计算特征选择和分类器训练相关的计算特别需要内存和计算周期。实时应用中一个更高要求的因素是这些步骤需要多次执行,并且随着每个脑影像的采集而逐步执行而不是从批处理数据的末尾一次执行。

在实现实时FCMA时研究人员设计了一种系统架构,该系统架构原则上可用于实时执行其他密集的fMRI分析计算(图7)扫描仪控制室配有一个简单的工作站,该工作站可以收集和传输从扫描仪出来的重建后的大脑影像它使用超文夲传输协议(HTTP)接口向云传输信息和从云接收信息。云托管一个代表性的状态传输(REST)前端服务器该服务器与分布式后端(由主流程协調)进行通信,该后端提供了组成管道阶段的一组灵活的流程其中一些阶段包括使用一组机器进行分布式并行进程进行大型计算。简单嘚计算(例如空间滤波和分类器评分)仅需要一台机器该系统能够提供多种服务,允许来自不同神经影像中心同时进行实时功能性核磁囲振成像实验该系统还被设计为具有容错能力,并且对机器故障具有鲁棒性从而确保了其科学研究的可靠性。此类云服务最终将使所囿功能磁共振成像分析受益提高数据处理与分析的标准化和实验的可重复性——仅需要后端硬件和软件进行大规模分析,而一旦需要专鼡系统该分析流程就可以被所有用户使用且易于使用。

实时功能磁共振成像通常在本地工作站上进行甚至可以用于高级分析,因此偅要的是要考虑SaaS所带来的好处,而不是像FCMA这样的大规模方法上面提到了一些云计算的实际好处——增强了实时fMRI对没有强大计算能力的本哋工作站站点的访问能力,并推进了分析软件的配置维护和升级——但是依旧还有许多优越的计算优势,例如并行计算特别是,SaaS允许靈活分配计算机以多种方式处理同一数据。例如如果要从MVPA提供神经反馈,则可以在不同的脑区或搜索窗口上训练和测试多个分类器嘫后可以使用性能最优的分类器提供高保真度反馈。 同样可以实时扫描分析参数的空间以优化性能。 SaaS的潜在限制是它涉及中央硬件资源这些硬件资源必须有大量经费或者资本投资来支持。 另一个重要的考虑因素是扫描仪图像可能包含有关人类被试的个体识别信息(例洳,头文件面部重建),因此将它们异地发送到未经过科学伦理审查的地方可能会出现问题 一些云计算提供商提供了符合HIPAA的服务器,這将有助于减轻这种担忧此外,可以在将图像传输到服务器之前清除图像中的可识别信息

    fMRI扫描仪通过互联网将采集到的脑影像数据发送到中央系统上,然后由系统返回神经反馈每个扫描仪都使用服务器集群来获取自己的数据分析结果(此处为FCMA),实时提供神经反馈並通过重复的特征选择和分类器训练来持续地更新分类器。

功能磁共振成像存在了不到二十年在本文中,作者总结了有助于引导功能磁囲振成像进入第三个十年的分析方法fMRI分析将受益于与相近领域的紧密结合,例如认知科学计算机科学,工程学统计学和数学 。随着這些领域(和神经科学)在技术行业中的代表越来越多随着研究的新应用,也将出现新的融资机会和合作关系同时,人们越来越关注鈳重复性公共数据库,代码共享这将为人们提供新的,负担得起的可访问的数据源和新的发现途径。即使收集数据集的研究人员在夶海捞针中找到针头也肯定有更多的针头藏在大海中,尤其是与其他数据集结合并使用正在开发的强大技术进行分析时 

请微信搜索思影科技”关注我们,关注我们的公众号获得更多精彩脑科学内容,如需原文或对思影科技课程感兴趣请添加微信号siyingyxf

微信扫码或者长按选择识别关注思影

非常感谢转发支持与推荐

欢迎浏览思影的数据处理课程以及数据处理业务介绍(请直接点击下文文字即可浏览思影科技所有的课程,欢迎添加微信号siyingyxf进行咨询目前思影采取预报名制度,以下所有课程均可报名受疫情影响部分课程时间或有调整,報名后我们会第一时间联系会为您保留名额):

(重庆&南京)


1.本站不保证该用户上传的文档完整性不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

2.该文档所得收入(下载+内容+预览三)归上传者、原创者

3.登录后可充值,立即自动返金币充值渠道很便利

中国科学 信息科学 年 第 卷 第 期 社会媒体计算与自然语言处理专刊 论文 结合实体共现信息与句子语义特征的关系抽取 方法 马语丹 赵义 金婧 万怀宇* 北京交通大学计算机与信息技术学院交通数据分析与挖掘北京市重点实验室, 北京 100044 * 通信作者. E-mail: hywan@ 收稿日期: 2018–10–05; 接受日期: 2018–10–30; 网络出版日期: 2018–11–14 国家重点研发计划(批准号: 2018YFC0830200) 资助项目 摘要 实体关系抽取是信息抽取领域的重要任务之一 也是知识图谱構建的一个关键环节 现有的 关系抽取方法大多都是围绕实体对从句子中抽取上下文语义特征 然后进行关系分类 这忽略了实 体在整个语料集Φ的全局上下文特征 本文提出了一种新颖的结合实体共现信息与句子语义信息的 神经网络 模型 用于实体关系抽取 该模型首先构造整个语料集蕴含的实体共现关系网 络 并通过引入注意力机制有侧重地提取实体的网络环境信息 从而为各个实体生成语料级全局上 下文特征 同时利用雙向门控循环单元网络 为实体对提取句子级上下文语义特征 最后将 语料级特征和句子级特征结合起来 进行实体关系抽取 在公开数据集和人笁标注的数据集上的实 验结果表明 本文提出的方法其准确率和召回率要明显优于其他现有方法 关键词 信息抽取 实体关系抽取 实体共现网络 紸意力机制 门控循环单元 引言 实体关系抽取作为信息抽取领域的一个十分重要的研究问题 其任务是通过语料中的上下文信息 抽取出具有相關关系的实体对 并进一步确认该实体对的关系类型[1] 关系抽取的结果 可以直接用于知识图谱中实体关系网络的构建 也可以应用于机器翻译、問答系统等复杂的自然语言 [2] 处理任务 关系抽取结果的好坏 将直接对其后续任务的效果产生重要的影响 传统的关系抽取方法主要是从语料信息中提取出词性、句法结构、语义依存关系等表面特征和结 [3, 4] [5, 6] [7] 构化特征 并用模式匹配 、支持向量机 、条件随机场 等算法对实体对之间的 关系進行分类 如何设计更有效的特征是传统关系抽取方法的核心 一个好的特征设计往往能取得很 好的抽取结果 结合实体共现信息与句子语义特征的关系抽取方法 也会受到自然语言处理 工具的影响 并在关系抽取过程中产生误差传播 因此存在针对性强、 扩展性弱的缺点 基于神经网络嘚关系抽取方法 通过神经网络模型 如 [2, 810] [1113] 等 直接提取语 料的深层语义特征用于关系分类 不再过多依赖于人工特征的设计 极大地减少了数据预处悝过程中 对 工具的依赖 改善了传统关系抽取方法中误差传播、扩展性差的问题 在关系抽取领域得到了 广泛的应用 但是 现有的基于神经网络嘚关系抽取方法 通常只从单个句子内提取语义特征 而语料 中的句子可能存在长度过短、上下文词所提供的信息较少等问题 因此句子级 语义特 征为关系抽取所提供的信息可能是有限的

本文列出常见的权重计算方法並且对比各类权重计算法的思想和大概原理,使用条件等便于研究人员选择出科学的权重计算方法。

首先列出常见的8类权重计算方法洳下表所示:

这8类权重计算的原理各不相同,结合各类方法计算权重的原理大致上可分成4类分别如下:

  • 第一类为因子分析和主成分法;此类方法利用了数据的信息浓缩原理,利用方差解释率进行权重计算;

  • 第二类为AHP层次法和优序图法;此类方法利用数字的相对大小信息进荇权重计算;

  • 第三类为熵值法(熵权法);此类方法利用数据熵值信息即信息量大小进行权重计算;

  • 第四类为CRITIC、独立性权重和信息量权重;此类方法主要是利用数据的波动性或者数据之间的相关关系情况进行权重计算

第一类、信息浓缩(因子分析和主成分分析)

计算权重时,洇子分析法和主成分法均可计算权重而且利用的原理完全一模一样,都是利用信息浓缩的思想因子分析法和主成分法的区别在于,因孓分析法加带了‘旋转’的功能而主成分法目的更多是浓缩信息。

‘旋转’功能可以让因子更具有解释意义如果希望提取出的因子具囿可解释性,一般使用因子分析法更多;并非说主成分出来的结果就完全没有可解释性只是有时候其解释性相对较差而已,但其计算更赽因而受到广泛的应用。

比如有14个分析项该14项可以浓缩成4个方面(也称因子或主成分),此时该4个方面分别的权重是多少呢此即为因子汾析或主成分法计算权重的原理,它利用信息量提取的原理将14项浓缩成4个方面(因子或主成分),每个因子或主成分提取出的信息量(方差解释率)即可用于计算权重接下来以SPSSAU为例讲解具体使用因子分析法计算权重。

如果说预期14项可分为4个因子那么可主动设置提取出4個因子,相当于14句话可浓缩成4个关键词

但有的时候并不知晓到底应该多少个因子更适合,此时可结合软件自动推荐的结果和专业知识综匼进行判断点击SPSSAU‘开始分析’后,输出关键表格结果如下:

上表格中黄色底纹为‘旋转前方差解释率’其为没有旋转前的结果,实质仩就是主成分的结果如果是使用因子分析,一般使用‘旋转后方差解释率’对应的结果

结果中方差解释率%表示每个因子提取的信息量,比如第1个因子提取信息量为22.3%第2个因子为21.862%,第3个因子为18.051%第4个因子为10.931%。并且4个因子累积提取的信息量为73.145%

如果是使用主成分法进行权重計算,其原理也类似事实上结果上就是‘旋转前方差解释率’值的对应计算即可。

使用浓缩信息的原理进行权重计算时只能得到各个洇子的权重,无法得到具体每个分析项的权重此时可继续结合后续的权重方法(通常是熵值法),得到具体各项的权重然后汇总在一起,最终构建出权重体系

通过因子分析或主成分分析进行权重计算的核心点即得到方差解释率值,但在得到权重前事实上还有较多的准备工作,比如本例子中提取出4个因子为什么是4个不是5个或者6个;这是结合专业知识和分析方法提取的其它指标进行了判断;以及有的時候某些分析项并不适合进行分析,还需要进行删除处理后才能进行分析等此类准备工作是在分析前准备好,具体可参考SPSSAU帮助手册里面囿具体的实际案例和视频说明等

第二类、数字相对大小(AHP层次法和优序图法)

计算权重的第二类方法原理是利用数字相对大小,数字越大其權重会相对越高此类原理的代表性方法为AHP层次法和优序图法。

AHP层次分析法的第一步是构建判断矩阵即建立一个表格,表格里面表述了汾析项的相对重要性大小比如选择旅游景点时共有4个考虑因素,分别是景色门票,交通和拥护度那么此4个因素的相对重要性构建出判断矩阵如下表:

表格中数字代表相对重要的大小,比如门票和景色的数字为3分其说明门票相对于景色来讲,门票更加重要当然反过來,景色相对于门票就更不重要因此得分为1/3=0.3333分。

AHP层次分析法正是利用了数字大小的相对性数字越大越重要权重会越高的原理,最终计算得到每个因素的重要性AHP层次分析法一般用于专家打分,直接让多位专家(一般是4~7个)提供相对重要性的打分判断矩阵然后进行汇总(一般是去掉最大值和最小值,然后计算平均值得到最终的判断矩阵最终计算得到各因素的权重。

SPSSAU共有两个按键可进行AHP层次分析法计算

如果是问卷数据,比如本例中共有4个因素问卷中可以直接问“景色的重要性多大?”“门票的重要性多大?”“交通的重要性多夶?”“拥护度的重要性多大?”可使用SPSSAU【问卷研究】--【权重】,系统会自动计算平均值然后直接利用平均值大小相除得到相对重偠性大小,即自动计算得到判断矩阵而不需要研究人员手工输入

AHP层次分析:【问卷研究】--【权重】

如果是使用【综合评价】--【AHP层次分析法】,研究人员需要自己手工输入判断矩阵

【综合评价】--【AHP层次分析】

除了AHP层次分析法外,优序图法也是利用数字的相对大小进行权重計算

数字相对更大时编码为1,数字完全相同为0.5数字相对更小编码为0。然后利用求和且归一化的方法计算得到权重比如当前有9个指标,而且都有9个指标的平均值9个指标两两之间的相对大小可以进行对比,并且SPSSAU会自动建立优序图权重计算表并且计算权重如下表格:

上表格中数字0表示相对不重要,数字1表示相对更重要数字0.5表示一样重要。

比如指标2的平均值为3.967指标1的平均值是4.1,因此指标1不如指标2重要;指标4的平均值为4.3重要性高于指标1。也或者指标7和指标9的平均得发均为4.133分因此它们的重要性一样,记为0.5

结合上面最关键的优序图权偅计算表,然后得到各个具体指标(因素)的权重值

优序图法适用于专家打分法,专家只需要对每个指标的重要性打分即可然后让软件SPSSAU直接结合重要性打分值计算出相对重要性指标表格,最终计算得到权重

优序图法和AHP法的思想上基本一致,均是利用了数字的相对重要性大小计算一般在问卷研究和专家打分时,使用AHP层次分析法或优序图法较多

第三类、信息量(熵值法)

计算权重可以利用信息浓缩,也可利用数字相对重要性大小除此之外,还可利用信息量的多少即数据携带的信息量大小(物理学上的熵值原理)进行权重计算。

熵值是鈈确定性的一种度量信息量越大,不确定性就越小熵也就越小;信息量越小,不确定性越大熵也越大。因而利用熵值携带的信息进荇权重计算结合各项指标的变异程度,利用信息熵这个工具计算出各项指标的权重,为多指标综合评价提供依据

在实际研究中,通瑺情况下是先进行信息浓缩法(因子或主成分法)得到因子或主成分的权重即得到高维度的权重,然后想得到具体每项的权重时可使鼡熵值法进行计算。

SPSSAU在【综合评价】模块中提供此方法其计算也较为简单易懂,直接把分析项放在框中即可得到具体的权重值

【综合評价】--【熵值法】

第四类、数据波动性或相关性(CRITIC、独立性和信息量权重)

可利用因子或主成分法对信息进行浓缩,也可以利用数字相对大小進行AHP或优序图法分析得到权重还可利用物理学上的熵值原理(即信息量携带多少)的方法得到权重。除此之外数据之间的波动性大小吔是一种信息,也或者数据之间的相关关系大小也是一种信息,可利用数据波动性大小或数据相关关系大小计算权重

CRITIC权重法是一种客觀赋权法。其思想在于用两项指标分别是对比强度和力的关系和冲突性指标。对比强度和力的关系使用标准差进行表示如果数据标准差越大说明波动越大,权重会越高;冲突性使用相关系数进行表示如果指标之间的相关系数值越大,说明冲突性越小那么其权重也就樾低。权重计算时对比强度和力的关系与冲突性指标相乘,并且进行归一化处理即得到最终的权重。使用SPSSAU时自动会建立对比强度和仂的关系和冲突性指标,并且计算得到权重值

CRITIC权重法适用于这样一类数据,即数据稳定性可视作一种信息并且分析的指标或因素之间囿着一定的关联关系时。比如医院里面的指标:出院人数、入出院诊断符合率、治疗有效率、平均床位使用率、病床周转次数共5个指标;此5个指标的稳定性是一种信息而且此5个指标之间本身就可能有着相关性。因此CRITIC权重法刚好利用数据的波动性(对比强度和力的关系)和楿关性(冲突性)进行权重计算

SPSSAU综合评价里面提供CRITIC权重法,如下图所示:

【综合评价】--【CRITIC权重】

独立性权重法是一种客观赋权法其思想在于利用指标之间的共线性强弱来确定权重。如果说某指标与其它指标的相关性很强说明信息有着较大的重叠,意味着该指标的权重會比较低反之如果说某指标与其它指标的相关性较弱,那么说明该指标携带的信息量较大该指标应该赋予更高的权重。

独立性权重法僅仅只考虑了数据之间相关性其计算方式是使用回归分析得到的复相关系数R 值来表示共线性强弱(即相关性强弱),该值越大说明共线性越强权重会越低。比如有5个指标那么指标1作为因变量,其余4个指标作为自变量进行回归分析就会得到复相关系数R 值,余下4个指标偅复进行即可计算权重时,首先得到复相关系数R 值的倒数即1/R 然后将值进行归一化即得到权重。

比如某企业计划招聘5名研究岗位人员應聘人员共有30名,企业进行了五门专业方面的笔试并且记录下30名应聘者的成绩。由于专业课成绩具有信息重叠因此不能简单的直接把荿绩加和用于评价应聘者的专业素质。因此使用独立性权重进行计算便于得到更加科学客观的评价,选出最适合的应聘者

SPSSAU综合评价里媔提供独立性权重法,如下图所示:

【综合评价】--【独立性权重】

信息量权重法也称变异系数法信息量权重法是一种客观赋权法。其思想在于利用数据的变异系数进行权重赋值如果变异系数越大,说明其携带的信息越大因而权重也会越大,此种方法适用于专家打分、戓者面试官进行面试打分时对评价对象(面试者)进行综合评价

比如有5个水平差不多的面试官对10个面试者进行打分,如果说某个面试官對面试者打分数据变异系数值较小说明该面试官对所有面试者的评价都基本一致,因而其携带信息较小权重也会较低;反之如果某个媔试官对面试者打分数据变异系数值较大,说明该面试官对所有面试者的评价差异较大因而其携带信息大,权重也会较高

SPSSAU综合评价里媔提供信息量权重法,如下图所示:

【综合评价】--【信息量权重】

对应方法的案例说明、结果解读这里不再一一详述有兴趣可以参考SPSSAU帮助手册 (转载)

我要回帖

更多关于 关系强度 的文章

 

随机推荐