首页 >热点 > > 正文

OpenAI用GPT-4解释了GPT-2三十万个神经元:智慧原来是这个样子 环球播资讯

清一色财经 2023-05-10 16:02:13

这就是 GPT 的「抽象」,和人类的抽象不太一样。

虽然 ChatGPT 似乎让人类正在接近重新创造智慧,但迄今为止,我们从来就没有完全理解智能是什么,不论自然的还是人工的。


(资料图片仅供参考)

认识智慧的原理显然很有必要,如何理解大语言模型的智力?OpenAI 给出的解决方案是:问问 GPT-4 是怎么说的。

5 月 9 日,OpenAI 发布了最新研究,其使用 GPT-4 自动进行大语言模型中神经元行为的解释,获得了很多有趣的结果。

可解释性研究的一种简单方法是首先了解 AI 模型各个组件(神经元和注意力头)在做什么。传统的方法是需要人类手动检查神经元,以确定它们代表数据的哪些特征。这个过程很难扩展,将它应用于具有数百或数千亿个参数的神经网络的成本过于高昂。

所以 OpenAI 提出了一种自动化方法 —— 使用 GPT-4 来生成神经元行为的自然语言解释并对其进行评分,并将其应用于另一种语言模型中的神经元 —— 此处他们选择了 GPT-2 为实验样本,并公开了这些 GPT-2 神经元解释和分数的数据集。

论文地址:https://openaipublic.blob.core.windows.net/neuron-explainer/paper/index.htmlGPT-2 神经元图:https://openaipublic.blob.core.windows.net/neuron-explainer/neuron-viewer/index.html代码与数据集:https://github.com/openai/automated-interpretability

这项技术让人们能够利用 GPT-4 来定义和自动测量 AI 模型的可解释性这个定量概念:它用来衡量语言模型使用自然语言压缩和重建神经元激活的能力。由于定量的特性,我们现在可以衡量理解神经网络计算目标的进展了。

OpenAI 表示,利用他们设立的基准,用 AI 解释 AI 的分数能达到接近于人类的水平。

OpenAI 联合创始人 Greg Brockman 也表示,我们迈出了使用 AI 进行自动化对齐研究的重要一步。

具体方法

使用 AI 解释 AI 的方法包括在每个神经元上运行三个步骤:

步骤一:用 GPT-4 生成解释

给定一个 GPT-2 神经元,通过向 GPT-4 展示相关文本序列和激活来生成对其行为的解释。

模型生成的解释:对电影、角色和娱乐的引用。

步骤二:使用 GPT-4 进行模拟

再次使用 GPT-4,模拟被解释的神经元会做什么。

步骤三:对比

根据模拟激活与真实激活的匹配程度对解释进行评分 —— 在这个例子上,GPT-4 的得分为 0.34。

主要发现

使用自己的评分方法,OpenAI 开始衡量他们的技术对网络不同部分的效果,并尝试针对目前解释不清楚的部分改进技术。例如,他们的技术对较大的模型效果不佳,可能是因为后面的层更难解释。

OpenAI 表示,虽然他们的绝大多数解释得分不高,但他们相信自己现在可以使用 ML 技术来进一步提高他们产生解释的能力。例如,他们发现以下方式有助于提高分数:

迭代解释。他们可以通过让 GPT-4 想出可能的反例,然后根据其激活情况修改解释来提高分数。使用更大的模型来进行解释。随着解释模型(explainer model)能力的提升,平均得分也会上升。然而,即使是 GPT-4 给出的解释也比人类差,这表明还有改进的余地。改变被解释模型(explained model)的架构。用不同的激活函数训练模型提高了解释分数。

OpenAI 表示,他们正在将 GPT-4 编写的对 GPT-2 中的所有 307,200 个神经元的解释的数据集和可视化工具开源。同时,他们还提供了使用 OpenAI API 上公开可用的模型进行解释和评分的代码。他们希望研究界能够开发出新的技术来生成更高分的解释,同时开发出更好的工具来通过解释探索 GPT-2。

他们发现,有超过 1000 个神经元的解释得分至少为 0.8 分,这意味着根据 GPT-4,它们占据了神经元的大部分顶级激活行为。这些得到很好解释的神经元中的大多数都不是很有趣。然而,他们也发现了许多有趣但 GPT-4 并不理解的神经元。OpenAI 希望随着解释的改进,他们可能会迅速发现对模型计算的有趣的定性理解。

以下是一些不同层神经元被激活的例子,更高的层更抽象:

看起来,GPT 理解的概念和人类不太一样?

OpenAI 未来工作

目前,该方法还存在一些局限性,OpenAI 希望在未来的工作中可以解决这些问题:

该方法专注于简短的自然语言解释,但神经元可能具有非常复杂的行为,因而用简洁地语言无法描述;OpenAI 希望最终自动找到并解释整个神经回路实现复杂的行为,神经元和注意力头一起工作。目前的方法只是将神经元的行为解释为原始文本输入的函数,而没有说明其下游影响。例如,一个在周期(period)上激活的神经元可以指示下一个单词应该以大写字母开头,或者增加句子计数器;OpenAI 解释了神经元的这种行为,却没有试图解释产生这种行为的机制。这意味着即使是得高分的解释在非分布(out-of-distribution)文本上也可能表现很差,因为它们只是描述了一种相关性;整个过程算力消耗极大。

最终,OpenAI 希望使用模型来形成、测试和迭代完全一般的假设,就像可解释性研究人员所做的那样。此外,OpenAI 还希望将其最大的模型解释为一种在部署前后检测对齐和安全问题的方法。然而,在这之前,还有很长的路要走。

上一篇:观速讯丨哈弗枭龙EV续航曝光:蜂巢铁锂电池 续航500/600km 下一篇:最后一页
x
推荐阅读

OpenAI用GPT-4解释了GPT-2三十万个神经元:智慧原来是这个样子 环球播资讯

2023-05-10

观速讯丨哈弗枭龙EV续航曝光:蜂巢铁锂电池 续航500/600km

2023-05-10

今日热文:枯瘦的近义词和反义词 深奥的近义词和反义词

2023-05-10

【天天热闻】新车机太难用?大众:团队全部开除,推倒重来

2023-05-10

新一批整改结果来了!多项重大生态环境问题得到有效解决

2023-05-10

靴子落地!7月1日起国六b排放标准全面实施 新一轮价格战会掀起吗?

2023-05-10

全球观热点:中原银行新乡分行:推进“469”工作计划,扎实开展“行长进万企”活动

2023-05-10

2023年怀化医保报销流程、缴费方法介绍:90%的人没搞懂_世界头条

2023-05-10

维信诺首发ViP屏幕技术:AMOLED像素密度提升至1700 ppi以上 全球消息

2023-05-10

全球首个犬猫细胞系保藏中心亮相 全国首套宠物食品科学与技术著作发布_焦点要闻

2023-05-10

OpenAI开源3D模型生成器Shap-E

2023-05-10

世界新消息丨地方实践|大货车保险风险减量服务见成效

2023-05-10

天天最新:各地集中力量稳步推进重大项目建设

2023-05-10

用阅读治愈心灵 上海社会科学院出版社心理学图书出版的追求和发展

2023-05-10

即时看!60分钟旋转71度!武汉绕城高速万吨桥梁“华丽转身”

2023-05-10

民国常先生是谁-常先生是谁

2023-05-10

天天快讯:千亿级之后 汉派服装产业转型再出发

2023-05-10

永利度假村一季度运营营收14.2亿美元 高于预测 环球看点

2023-05-10

“太空快递”已打包 正等待火箭发货 点击查看快递详情

2023-05-10

滚动:曼城扳平进球惹争议!皮球已提前出边线,安切洛蒂愤怒抗议

2023-05-10

并不罕见的“负电价” 传递了怎样的信号?

2023-05-10

法媒:多队有意蒙彼利埃20岁前锋瓦希,球员上周末上演大四喜 天天聚看点

2023-05-10

伊戈尔(002922.SZ):实控人肖俊承拟增持1.5%-2%的公司股份 已增持1.49%股份

2023-05-10

起亚:网传内部人员变动为加速电动化转型的正常调整|天天速讯

2023-05-09

台立法机构:招募未成年人赴境外犯罪最重判十年半

2023-05-09

IPO参考:怡俊集团上市首日破发 娃茅酒业启动赴美上市计划 最新快讯

2023-05-09

世界速递!颐海国际:以约1045万港元回购50万股

2023-05-09

苏州:开展“爱国教育+防灾减灾日”主题活动

2023-05-09

天天热点!富士莱:感谢投资者的关注,公司与同禾药业在业务市场上侧重点有所不同,在各自领域都具有自己的优势

2023-05-09

【快播报】曝网红胡胖离开青春老男孩原因!利益分配25%,广告分成不到5000

2023-05-09

环球报道:ST冠福:股票简称变更为“冠福股份”

2023-05-09

何小冰:5月9日黄金站上2030切换区间,原油守低是关键

2023-05-09

5月9日黑龙江地区煤焦油市场价格

2023-05-09

如何制作史努比服装_送女生什么生日礼物比较实用的-全球微速讯

2023-05-09

全球微头条丨杞县城管局推行便民服务 优化燃气企业营商环境

2023-05-09

聚焦:邮政信报箱年久失修,有人嫌碍事,能随便拆吗?

2023-05-09

全球动态:小鹏汽车发布「扶摇」全域智能进化架构 标配国内首个量产800V高压SiC碳化硅平台

2023-05-09

新城市旗下宁波伯瑞特获余姚市服务业现代龙头奖,施南路表示祝贺-环球消息

2023-05-09

鞍重股份重组遭问询:要求说明收购金辉资源股权是否存在高估收入 低估成本以抬高估值的情形

2023-05-09

长春电动车上牌流程

2023-05-09

成都无房证明怎么查询打印?_世界观点

2023-05-09

环球即时看!拆书帮丨《匠心的逻辑》:触摸器物之外的工匠精神

2023-05-09

热点!甘肃新能源占比超半

2023-05-09

要闻:【调研快报】伟星股份接待南方基金等多家机构调研

2023-05-09

市场监管局:七彩人生儿童家具产品结构安全抽检不合格 焦点

2023-05-09

基层“变通”缘何变少了?背后潜藏着干部三种心态-每日报道

2023-05-09

cmcc无线网初始密码_cmcc无线网络密码

2023-05-09

视点!邓台村忆邓丽君:已去经年 仿佛从未走远

2023-05-09

同时爱上两个人都不想放手_同时爱上两个人

2023-05-09

加方要求中方一名领事官员限期离境,中使馆:将采取反制措施 天天新要闻

2023-05-09

奥比中光:连续3日融资净买入累计733.65万元(05-08)

2023-05-09

多人捉迷藏游戏《狡猾痕迹》现已开启抢鲜体验-环球热文

2023-05-09

世界快报:历久弥新是什么意思_历久弥新

2023-05-09

青海全面开展春季动物疫病防控 累计免疫各类畜禽1920余万头(只、羽)_世界快看

2023-05-09

砖混房屋施工

2023-05-09

今头条!2023年,很多银行都出现了这些现象,普通人务必要提前做好准备!

2023-05-08

高层应该选几楼_33层的楼应该买几楼最好 天天最新

2023-05-08

模拟电路新星中芯集成科创板上市:风雨砥砺五年路成绩斐然谱新篇

2023-05-08

海尔投资券商利润丰厚 有望实现收益超两百亿元

2023-05-08

快消息!三个交易日连涨超20%,中行、民生银行发交易异常波动公告

2023-05-08

每日焦点!减持不断!永泰运股东拟减持不超3%公司股份

2023-05-08

全球实时:被保险人是什么意思?和受益人可以是一个人吗?

2023-05-08

热搜爆了!杨幂官宣解约,公司估值一度高达50亿元,杨幂是第三大股东,曾与房企大佬发生纠纷|世界热点评

2023-05-08

2023年地理信息产业发展现状分析

2023-05-08

宁远:打造九疑山兔全产业链 助力乡村振兴“加速跑”

2023-05-08

聚焦:打新必看 | 5月9日一只新股上市,会破发吗?

2023-05-08

文件管理在手机哪里找_苹果手机的文件管理在-焦点速看

2023-05-08

焦点速递!综合评分都优秀,从细节看差距 最新中保研新能源SUV碰撞测试点评

2023-05-08

海南白沙长江村镇银行被合计罚没约164万:因关联交易审批不规范等

2023-05-08

天娱数科首部AI创作的科幻短篇《时间少女日志》上线 全球滚动

2023-05-08

“1.6亿”承重墙不能承受之重

2023-05-08

后溪穴的妙用|环球讯息

2023-05-08

全球快讯:“三方办”社区服务新模式实现基层治理新作为

2023-05-08

【天天报资讯】谷爱凌再拿大奖:当选劳伦斯年度最佳极限运动员 比肩姚明刘翔李娜

2023-05-08

什么?路虎没了!

2023-05-08

新车报讯:现代IONIQ6最新谍照曝光采用虚拟后视镜技术

2023-05-08

《银河护卫队3》全球周末票房超2.8亿美元,海外票房1.68亿美元

2023-05-08

世界观热点:敝组词读音_敝组词有哪些

2023-05-08

当前时讯:大亚圣象:5月5日融券卖出2.02万股,融资融券余额1.82亿元

2023-05-08

旅游人次收入双双暴涨 都市圈各大景区满是“鄂A”车

2023-05-08

焦点报道:国勘公司2022年度党建考核结果定为A档

2023-05-08

旱情严重!西班牙陷入残酷“水战争”,“欧洲菜篮子”面临威胁

2023-05-08

​撤离?车臣精锐部队接手?继续战斗?关于巴赫穆特,瓦格纳首领说法三天三变

2023-05-08

天天亮点!广东外观设计专利有效量连续9年居全国首位

2023-05-08

开水壶里的水垢怎么清理_开水壶里的水垢怎么去除|天天热资讯

2023-05-08

西安到甘南自驾游攻略详细路线_西安到甘南自驾游攻略 焦点要闻

2023-05-08

武汉黄陂查处3处黑气点,暂扣钢瓶42只

2023-05-07

西宁交警圆满完成2023年青海省西宁市事业单位面向社会公开招聘考试交通安保任务

2023-05-07

南方强降雨今日逐渐收尾,中东部明天开启晴朗升温模式 环球最新

2023-05-07

江西强降雨导致49.7万人受灾,直接经济损失5.2亿元

2023-05-07

会员管理系统哪个好用软件_会员管理系统哪个好

2023-05-07

中考游泳项目开考 热资讯

2023-05-07

格纳布里:这场胜利很重要,我为球队和自己感到高兴

2023-05-07

干竹笋怎么做好吃?

2023-05-07

新资讯:cdfi可见血流信号是什么意思_cdfi未见明显血流信号是什么意思

2023-05-07

领克08 更多信息 5秒内破百/纯电续航245公里

2023-05-07

天舟六号船箭组合体完成转运 潮新闻现场直击

2023-05-07

当前视讯!宜春有哪些敬老院?宜春敬老院名单

2023-05-07

透视公募REITs一季度数据:六大板块业绩喜忧参半,二级市场行情分化

2023-05-07

【世界新视野】瞎掰掰啥意思_瞎掰

2023-05-07