当前位置：首页 > 行业资讯 > 科技发展奇迹让人既好奇又害怕的ChatGPT智能对话的边界在哪里

科技发展奇迹让人既好奇又害怕的ChatGPT智能对话的边界在哪里

行业资讯
2024-12-09 03:03
0

对于ChatGPT的出现及火爆，你的感受是什么呢？本文作者的心情是“好奇又害怕”。为什么ChatGPT能引起如此大的震动呢？以后会对人类产生什么影响？本文作者从ChatGPT的相关概念、背后的技术、商业前景，对ChatGPT进行了深入分析，并分享了自己的一些独到的观点，一起来探索一下吧。

ChatGPT是一款基于大型语言模型（LLM）的聊天机器人，它通过理解用户输入的句子含义，掌握世界知识，生成语言和代码，以及上下文学习等多种功能，使得与之交流的人们体验到强大的智能能力。然而，这款科技产品并不是一蹴而就，其背后的发展时间线可以追溯至神经网络结构设计技术的成熟。

随着数据规模和模型规模不断增大，模型精度也得到了进一步提升。研究表明，当模型参数增加到一定程度，就会涌现出远超小模型的强大能力。这也是为什么我们看到的大型语言模型（LLM）能够在NLP领域取得巨大进展。

这些大型语言模型背后涉及复杂的技术，如提示学习（Prompt Learning），它能够通过在输入中添加一个提示词，使预训练模型性能得到显著提高。目前大家听到的深度学习、大型语言模型（LLM）等概念，本质上都是一种模仿人类神经系统的神经网络模式。这些网络由多层处理单元组成，上一层输出作为下一层带权重输入参数，不同信息输入经过处理可能得到各自结果。

使用现成的大型预训练语言模型再根据自己的需要微调，即所谓精调，是一种非常有效的手段之一。在这个过程中，我们还可以利用prompting来调整大型语言模式，而不需改变其任何参数，只需为其提供一定量提示即可提升其能力。这就是给予一个妻管严的人看几个非妻管严人的故事，让他摆脱原有状态一样简单的事情。

为了优化这种方法，我们采用了强化学习策略，其中包括收集演示数据并训练监督策略、收集对比数据并训练奖励模式以及使用概率加权随机策略搜索来优化策略。在实践中，我们主要依赖于我们的有监督策略，也有一部分来自PPO算法微调出的最佳策略，以此不断迭代优化奖励模式和目标模版。

思维链是一个离散式提示学习，在大规模上下文学习中增加思考过程，可以使得复杂推理表现更加出色。当使用思维链进行提示时，大型语言模式在复杂推理上的表现明显超过传统微调，在知识推理方面也有很好的竞争力，并且分布鲁棒性存在潜力。而要达到这样的效果只需要8个左右示例，这可能导致范式转变。如果想让思维链效果更佳，则至少需要62B以上或175B尺寸的大型语料库支持才行。