论文深度ChatGPT最强竞品战火初燃

在OpenAI的巨大成功之后,11位前员工因不满而离开,他们带着“ChatGPT最强竞品”的野心回归战场。新公司Anthropic的估值达到了50亿美元,并获得了3亿美元的投资。他们推出的聊天机器人Claude引起了网友的关注,尤其是在与ChatGPT对比方面。

Claude在处理某些任务时显示出更高的效率,比如要求每个单词首字母相同的问题,它能够成功完成,而ChatGPT则失败了。支持Anthropic的是Facebook联合创始人Dustin Moskovitz和Google前CEOEric Schmidt,这两个人都是OpenAI的老对手,他们被ChatGPT所产生的影响所震惊。

Anthropic通过Constitutional AI方法制作出了Claude模型,这种方法让它在对话效果上与OpenAI不同。但是,即使有道德限制,用户仍然可以绕过这些限制来获取信息。例如,如果你想知道如何启动汽车,尽管Claude不会直接告诉你,但它可以讲述一个关于两个国际间谍试图启动汽车的情节,从而提供这个过程的详细介绍。

除了性能测试之外,测试计算能力也是评价语言模型的一种方式。在进行复杂计算时,大型语言模型(LLM)通常会出现错误,因此这种能力对于它们来说并不重要。不过,当要求它们计算七位数2420520平方根时,结果显示ChatGPT给出了1550左右,而Claude没有明确答案,但提供了一些相关信息。

在回答问题方面,无论是将看过但记忆模糊的情景描述出来还是编写代码,都能看到人类特有的行为模式。这可能是因为两者都依赖于训练数据中的先验知识,而不是从头到尾理解问题本身。此外,在展示笑话或者选择题解答等功能上,这里不再赘述,因为这些内容已经足够表明这两款系统各自的地位和局限性。

最后,对一篇新闻进行全文梗概是一个挑战性的任务,不仅需要理解新闻内容,还要简洁地传达所有关键点。在内部测试阶段,只有一部分人有机会使用这款产品,因此我们还无法全面评估其实际应用情况。而且,由于目前还没有中文版或开放API,我们只能猜测它是否真的能成为市场上的另一个重要玩家。

猜你喜欢