在OpenAI的巨大成功之后,11位前员工因不满而离开,他们带着“ChatGPT最强竞品”的秘密回到战场。新公司Anthropic估值50亿美元,并获得3亿美元的投资。其聊天机器人产品Claude引起了网友们的关注,尤其是在与ChatGPT对比方面。
Claude在一些特定任务上表现出了超出预期的效果,比如处理具有相同首字母单词开头的一句话请求时,它能够成功完成,而ChatGPT则失败了。支持Anthropic的是Facebook联合创始人Dustin Moskovitz和Google前CEOEric Schmidt,这两个人都是OpenAI的老对手,他们被ChatGPT所产生的影响所震惊。
Anthropic通过Constitutional AI方法开发了Claude,该方法不同于OpenAI使用的人工智能(RLHF),这导致了两个模型在对话风格上的差异。尽管如此,任何有心人都可以绕过这些道德限制,就像绕过任何技术一样。而且,试图让它们执行复杂计算或提供精确答案会发现它们并不擅长这一点。
测试计算能力是衡量语言模型能力的一个常用方式,但它并非设计用来进行精确计算。大型语言模型(LLM)通常用于回答问题,而不是进行数值计算。在尝试一个七位数2420520平方根的问题时,ChatGPT给出了一个接近1550的大致答案,而Claude则没有提供明确答案。
对于由美国作家侯世达提出的一系列问题,这些问题旨在挑战LLM对世界理解能力,结果显示两个模型都无法完美地回答这些问题。例如,当问及穿越英吉利海峡世界纪录时,Claude以讽刺态度回应:“英吉利海峡是水域,不可能徒步穿越。”
至于代码生成方面,Amazon已经开始在多个职能中使用ChatGPT,其中包括编写代码。当要求实现两种基本排序算法并比较它们执行时间时,虽然ChatGPT写得流畅并正确,但Claude也给出了正确答案,而且似乎猜测到了正确答案。这表明它就像处理其他类型的问题一样,在自己估摸着猜测的情况下生成代码。
最后,让我们看看如何将一篇新闻进行全文梗概。这项任务展示了两个模型如何处理复杂信息。此外,由于目前还未公布中文版,因此很难评估它实际应用中的表现。不过,从介绍来看,它似乎是一个功能性AI助手,可以帮助用户完成各种简单任务,如撰写文章、作业以及翻译等工作。