明敏 发自 凹非寺
量子位 公众号 QbitAI
DeepMind新AI登上Nature才一天,GPT-4就来打擂台了!
只通过两段提示,GPT-4就给出了和AlphaDev如出一辙的排序算法优化方法。
马斯克“路过看到”,也留下了句“因吹斯听”。
所以GPT-4怎么做到的?
2段提示就搞定带来这个新发现的是一位来自威斯康星大学麦迪逊分校的副教授,名叫Dimitris Papailiopoulos(下面简称D教授)。
他让GPT-4实现这一操作的步骤非常简单,一共就输入了两次提示。
首先,他和GPT-4说:
这有一段排序算法,我觉得它还能进一步优化。你能不能在下面几行,用*注明哪些指令可以删除或者改进?如果不需要修改,就什么都不动。一步一步解释原因,然后回去验证它是对的。
DeepMind方面对AlphaDev这通操作,让人想起当年AlphaGo的“第37步”——一种违反直觉的下法却直接击败传奇围棋选手李世石,让观众全都震惊不已。
同样,AlphaDev则是通过交换和复制移动,跳过了一个步骤,以一种看似错误但实际上是捷径的方式达成目标。
据介绍,AlphaDev是一种强化学习算法、基于AlphaZero打造,它的发现并非基于现有算法,而是从最底层的汇编指令开始摸索的。
它的创新主要在于两种指令序列:
(1)AlphaDev Swap Move(交换移动)
(2)AlphaDev Copy Move(复制移动)
原理上,DeepMind的研究员给它设计了一种单人“组装”游戏:
只要能够搜索并选择出合适的指令(下图A流程),正确且快速地排好数据(下图B流程),就能获得奖励。
不过话说回来,之所以这件事能够引起这么大的关注和讨论,很大一部分原因是AlphaDev登上Nature存在争议。
不少人觉得这也不是什么开创性的研究,DeepMind夸大其词。
你觉得呢?
参考链接:[1]https://chat.openai.com/share/95693df4-36cd-4241-9cae-2173e8fb760c[2]https://twitter.com/DimitrisPapail/status/1666843952824168465
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态