机器之心报道
机器之心编辑部
一年一度的谷歌 I/O 大会,总是吸引着全球开发者的关注。今年,AI 技术的重大突破,让大家对这场盛会更加期待。
当地时间 5 月 10 日上午,加州山景城的海岸圆形剧场座无虚席。就在这个充满活力的氛围中,PaLM 2 的新功能正式亮相。这款改进版模型在代码编写和调试方面展现出了巨大的优势,它经过了针对20种编程语言的训练,其中包括Python、JavaScript等流行语言,以及Prolog、Verilog和Fortran等更专业的语言。
PaLM 2构成了Codey的基础,这是一个专为编码和调试设计的人工智能模型,被用作代码补全和生成服务的一部分。在I/O大会上,皮查伊现场演示了PaLM 2如何处理代码调试任务。他输入了一条指令:“你能修复这段代码的一个bug,并添加一行一行韩文注释吗?”结果让人瞩目的动图展示了这一过程。
论文地址:https://ai.google/static/documents/palm2techreport.pdf
此外,在Google Brain与DeepMind合并之后,一款全新的大型模型正在研发中。皮查伊表示,现在谷歌研究团队正将重心转移到Gemini上,这是一种多模态、高效且强大的机器学习工具。
GPT-4也许能够提供类似的功能,但Bard作为生产力工具与搜索引擎之间桥梁的角色,其最新更新则更加注重易用性。首先,是引用功能;现在AI生成回答时,将通过显示特定代码块来源(通常是链接),以确保引用准确性。这同样适用于网络叙述内容。
其次,是导出按钮;如果AI生成内容实用化,我们就希望能快速使用这些结果。而现在,我们可以轻松导出到Colab或Replit上,以便进一步构建和迭代想法。此外,如果需要撰写邮件,Bard还能直接发送到Gmail,或创建一个Docs文件。
未来,还有许多应用待集成,如Sheets、Slides、Calendar、Keep、Tasks以及Maps等。此外,还计划支持第三方扩展,比如自动根据输入文本生成图像——利用Adobe Firefly技术:
尽管Bard一直仅限于英国和美国,但谷歌宣布它将覆盖全球180个国家及地区,并取消候选名单,使其立即可供所有人使用。此外,该系统增加了日语和韩语支持,并预计在今年7月前提供40种主要语言中的全部翻译服务。
最后,在I/O大会上,谷歌展示了下一代移动操作系统Android 14新能力之一,即Magic Compose测试版。这是一项基于AI生成模型的手助工具,让用户回短信时获得大量提示。不仅如此,它还可以学习用户说话方式,为回复内容添加不同的语气或莎士比亚风格等创意元素。
此外,还有一个令人惊叹的地方:谷歌利用其文本到图像扩散模型,可以帮助制作独一无二手机壁纸,只需描述最终愿景即可完成:
值得注意的是,该功能使用公共领域训练数据,从而保证不会产生受版权保护图片。但除了这些创新之举以外,Pixel系列设备也推出了新的硬件产品,如Pixel Tablet 和折叠屏手机 Pixel Fold,以1799美元起售,将于夏天开启销售模式。
随着新模型PaLM 2的大规模应用,全系列工具都迎来了AI化升级,而在大型语言模型应用方面,与微软持平甚至超越,这让人们对于是否真的能媲美ChatGPT感到好奇。在I/O进行期间,谷歌股价亦出现5%的大幅涨幅。但真正问题是:Bard是否真的能达到与ChatGPT相当的地步?只有当我们实际体验后,便可能揭晓答案。