网站管理员登陆后缀,牛商网做的包装盒网站,云服务器如何搭建,学校网站建设基本流程论文内容概述
AI要90分钟学会的游戏#xff0c;人脑细胞竟在5分钟搞定了。Cell在2022年的研究中#xff0c;使用80万体外神经元细胞(DishBrain)竟然学会玩70年代经典街机游戏Pong#xff01;
论文链接#xff1a;In vitro neurons learn and exhibit sentience when emb…论文内容概述
AI要90分钟学会的游戏人脑细胞竟在5分钟搞定了。Cell在2022年的研究中使用80万体外神经元细胞(DishBrain)竟然学会玩70年代经典街机游戏Pong
论文链接In vitro neurons learn and exhibit sentience when embodied in a simulated game-world (基于生物神经元的模拟游戏世界感知学习)
虽然现在人工智能发展迅速但是人工神经网络依然难以高效地完成许多复杂任务而这些复杂任务往往在生物神经网络上表现优异。如果我们将生物神经网络整合到数字计算机系统中或许可以解决当前人工神经网络面临的一些困境。
在这篇文章中作者开发了DishBrain盘中大脑这是一种在结构化环境中利用神经元固有的自适应计算能力的系统。该系统使用生物神经网络神经元为人类神经元或老鼠神经元以高密度多电极阵列为信息交流媒介与计算机系统相结合然后计算机系统输出模拟游戏世界的相关信号通过电生理刺激和记录给DishBrain进行信号交互以模仿街机游戏“Pong”。
应用自由能原理的主动推理理论作者发现在实时游戏五分钟内出现了明显的学习现象这是在对照条件下未观察到的。进一步的实验表明闭环结构化反馈在引发长期学习中起着重要作用。DishBrain显示出在稀疏的感官信息反馈下出现了以目标导向方式自组织活动的能力称之为人工生物智能未来的应用可能进一步揭示与智能密切的细胞关联。
准确来说DishBrain(盘中大脑)是一个实时合成生物智能平台演示了生物神经元通过调整放电活动来进行学习。在提供的模拟游戏世界中当提供简单的电信号输入和电信号反馈时它有能力学习执行特定目标任务。
随着实验的进行如果没有提供电信号反馈将观察不到明显的表现改善如果完整提供电信号反馈将看到因为学习而得到的表现改善。观察到的人类神经元和老鼠神经元均有学习能力并且人类神经元的学习能力高于老鼠神经元。实验过程中观察到神经元放电活动一直在变化一开始的游戏表现可能不太好但随着实验的进行会越来越好。
基本原理介绍
合成生物智能SBI(Synthetic Biological Intelligence)合成生物学与人工智能交叉领域是未来脑科学发展一个可能大热的风口这篇论文属于SBI领域。
生物神经网络BNN(Biological Neuronal Network)生物神经网络基于动物神经元发展人工神经网络基于神经元数学模型发展两者原理上存在较大差异。
生物智能主要分两方面体内生物智能和体外生物智能。像脑机接口等等更多像体内生物智能生物神经网络主要存活在生物体内而合成生物智能更多探索体外生物智能比如这篇文章就是体外培养生物神经网络来与计算机系统结合。
自由能原理Free Energy Principle, FEP是由卡尔·弗里斯顿Karl Friston提出的理论框架它试图解释生物系统是如何维持其内部稳态并预测外部环境的。该理论的核心思想是生物系统通过最小化其预测误差即观察到的与预期的状态之间的差异来降低自由能从而保持生存和繁衍。
自由能的概述
自由能原理认为所有生命系统都在不断地试图降低它们的自由能以保持一种低熵状态即维持内部稳态。自由能可以被视为一个代理用来衡量一个系统与它期望状态之间的不匹配程度。当系统能够准确预测其环境时自由能就会降低。如果系统不能准确预测则需要通过学习或改变行为来减小预测误差从而降低自由能。
主动推理理论
主动推理Active Inference是自由能原理的一个重要组成部分它关注的是生物系统如何通过行为来影响其周围环境以最小化预测误差。主动推理理论认为生物系统不仅被动地适应环境而且还通过积极的行为来塑造环境以使自身预测更加准确。
主动推理观点
预测编码生物系统通过构建关于世界的内部模型来进行预测并根据这些预测采取行动。最小化预测误差生物系统通过感知输入和主动行为来最小化预测误差即观察到的状态与预测状态之间的差异。感知行为的一致性感知和行为被视为同一过程的不同方面都是为了最小化自由能。行为选择行为的选择是基于对未来状态的预测来最小化未来自由能的期望值。
主动推理应用
主动推理理论已被应用于多个领域包括认知科学、心理学、神经科学以及人工智能。它为理解生物系统如何进行决策、规划行为以及如何与环境互动提供了理论基础。
感知行为一致性当你伸手去拿一个杯子时你的大脑会根据过去的经历预测杯子的位置和重量。如果预测与实际感受不符比如杯子比预期轻你会调整握力以减少预测误差。决策制定在面对不确定情境时生物体会基于其内部模型对未来状态进行预测并选择能够最大化降低未来自由能的行为路径。
实验整体设计
神经细胞获取
要想有一个生物神经网络BNN芯片第一步就是获取很多的神经细胞论文里主要使用两类神经细胞即人类神经细胞和老鼠神经细胞那么要怎么获得呢
如果想要获取的是人类的神经元细胞那么需要从干细胞开始培养然后刺激干细胞分化成神经细胞干细胞分化成神经细胞之后数量就会稳定了后续实验过程只需要给人类神经细胞提供营养即可整个神经细胞的制备周期是30天。
如果使用老鼠的神经细胞那就比较简单了没有道德问题可以直接培养老鼠胚胎然后把脑子摘出来然后直接用就完事了基本不需要培养制备周期也短了很多。 左图为人类神经细胞HCC右图为老鼠神经细胞MCC。
智能芯片生态
有了神经细胞之后下一步就是把神经细胞放到芯片上培养继续给神经细胞提供养分。
可以看到该智能系统有两个子系统细胞芯片系统HD-MEA Chip和计算机系统Pong两者通过物理线路进行信息传输。
信息交互过程
先给出细胞芯片子系统的平面图 在图片中神经细胞是均匀分布在芯片上面的蓝点代表电极用于神经细胞与计算机之间交换信息。明显图中存在上半左下右下三块电极区域上半电极区域是感知区用于接收屏幕信息输出由此得到小球和平板的位置状态左下和右下电极区域是运动区用于输出平板移动信息具体设置如下 action1为向上运动action为向下运动左下电极区域得到一组向上运动和向下运动的信号右下电极区域得到另一组向上运动和向下运动的信号两组数据求平均得到最终的运动控制信号。
实验过程分析
学习方法的原理特别简单就是不停的让这个生物芯片玩Pong这个游戏并且在玩的好的时候奖励它玩的不好没接住球的时候惩罚他。
当BNN犯了一个错误的时候比如没有接到球的时候就给他一些无法预测的电信号惩罚他可能是随机生成而当BNN接住了球的时候那应该奖励他就给他一些可以预测的电信号可能是固定模式。
相关参考资料
https://www.cell.com/neuron/pdfExtended/S0896-6273(22)00806-6 https://zhuanlan.zhihu.com/p/648547119 https://baijiahao.baidu.com/s?id1746550954055561171wfrspiderforpc