GPT-4把DeepMind整尴尬了你登上Nature的排序优化算法我也会

明敏发自凹非寺

量子位公众号 QbitAI

DeepMind新AI登上Nature才一天，GPT-4就来打擂台了！

只通过两段提示，GPT-4就给出了和AlphaDev如出一辙的排序算法优化方法。

马斯克“路过看到”，也留下了句“因吹斯听”。

所以GPT-4怎么做到的？

2段提示就搞定

带来这个新发现的是一位来自威斯康星大学麦迪逊分校的副教授，名叫Dimitris Papailiopoulos（下面简称D教授）。

他让GPT-4实现这一操作的步骤非常简单，一共就输入了两次提示。

首先，他和GPT-4说：

这有一段排序算法，我觉得它还能进一步优化。你能不能在下面几行，用*注明哪些指令可以删除或者改进？如果不需要修改，就什么都不动。一步一步解释原因，然后回去验证它是对的。

DeepMind方面对AlphaDev这通操作，让人想起当年AlphaGo的“第37步”——一种违反直觉的下法却直接击败传奇围棋选手李世石，让观众全都震惊不已。

同样，AlphaDev则是通过交换和复制移动，跳过了一个步骤，以一种看似错误但实际上是捷径的方式达成目标。

据介绍，AlphaDev是一种强化学习算法、基于AlphaZero打造，它的发现并非基于现有算法，而是从最底层的汇编指令开始摸索的。

它的创新主要在于两种指令序列：

（1）AlphaDev Swap Move（交换移动）

（2）AlphaDev Copy Move（复制移动）

原理上，DeepMind的研究员给它设计了一种单人“组装”游戏：

只要能够搜索并选择出合适的指令（下图A流程），正确且快速地排好数据（下图B流程），就能获得奖励。

不过话说回来，之所以这件事能够引起这么大的关注和讨论，很大一部分原因是AlphaDev登上Nature存在争议。

不少人觉得这也不是什么开创性的研究，DeepMind夸大其词。

你觉得呢？

参考链接：[1]https://chat.openai.com/share/95693df4-36cd-4241-9cae-2173e8fb760c[2]https://twitter.com/DimitrisPapail/status/1666843952824168465

— 完 —

量子位 QbitAI · 头条号签约

关注我们，第一时间获知前沿科技动态