机器之心报道
机器之心编辑部
一年一度的谷歌 I/O 大会,总是吸引着全球开发者的关注。今年,AI 技术的重大突破,让大家对这场盛会更加期待。
当地时间 5 月 10 日上午,加州山景城的海岸圆形剧场座无虚席。就在这个充满活力的氛围中,PaLM 2 的新功能正式亮相。这款改进版模型在代码编写和调试方面展现出了巨大的优势,它被训练于包括 Python、JavaScript 等流行语言以及 Prolog、Verilog 和 Fortran 在内的20种编程语言。PaLM 2 是 Codey 的核心组成部分,是一款专门用于编码和调试的模型,也作为代码补全和生成服务的一部分推出。
皮查伊现场演示了 PaLM 2 的代码调试功能,当他输入指令“你能修复这段代码的一个 bug,并添加一行一行韩文注释吗?”时,结果令人印象深刻。
此外,在 Google Brain 和 DeepMind 合并之后,一种新的大型模型正在研发中。这款名为 Gemini 的多模态、高效的机器学习工具正成为谷歌研究重心转移的一个重要标志,就像 GPT-4 一样,你可以在自己的要求中加入图像和文本,以增强体验。
Bard 作为生产力工具与搜索引擎之间桥梁的大师级AI,其最新版本更是在易用性上取得了显著提升。首先,它引入了引用功能,现在 AI 生成的回答将通过展示特定代码块或叙述性内容来源来确保准确性。此外,还增加了导出按钮,使得用户能够快速将AI产生内容导出到 Colab、Replit 或者文字文件中,这些都极大地提高了工作效率。如果需要,可以直接使用 Gmail 发送邮件,或创建 Docs 文件。此外,未来还计划集成 Sheets、Slides、Calendar 等应用,以及 Adobe Firefly 图像生成等第三方扩展。
值得注意的是,由于之前只限于英国和美国地区使用,但现在 Bard 已经支持全球180个国家及地区,并且取消了候选名单,全世界用户都可以立即体验它。在语言支持方面,也新增加了日语和韩语,并预计在今年7月前支持全球“使用量排名前40”的语言之一。
I/O 大会上,还有一个让人耳目一新的消息:下一代移动操作系统 Android 14 新能力,其中 Magic Compose 将于夏天推出测试版,为用户提供基于 AI 模型的大量回短信提示。而且,不仅如此,还可以根据聊天内容改变回复语气或者风格,如莎士比亚般华丽。这一切都是通过谷歌独家的文本到图像扩散模型实现,而该模型使用公共领域数据进行训练,以保证不会侵犯版权保护下的作品。
此外,谷歌还发布了一系列新硬件产品,如 Pixel Tablet 和折叠屏手机 Pixel Fold 售价1799美元,将于夏天开售。此时,无疑是Google在大型语言模型应用领域与微软齐头并进甚至领先一步,而伴随这一变化,其股价也出现5%的大幅增长。不过,我们是否真的能够说Bard已经超越ChatGPT?答案可能只有当我们亲自体验后才能得到确认。