机器之心报道
机器之心编辑部
一年一度的谷歌 I/O 大会,总是为全球开发者带来新技术的惊喜。今年,更是让人瞩目的AI领域取得了重大突破,吸引着无数开发者的关注。
在加州山景城举行的这场大会上,PaLM 2 在代码编写和调试方面表现出了巨大的进步。它经过训练于20种编程语言中,不仅包括流行的Python和JavaScript,还包含Prolog、Verilog和Fortran等专业语言。PaLM 2构成了Codey,它是一个专门用于编码和调试的模型,是代码补全和生成服务的一部分。
皮查伊现场演示了PaLM 2的代码调试功能,当他输入“你能修复这段代码的一个bug,并添加一行一行韩文注释吗?”时,系统即刻响应并提供解决方案。这不仅展示了PaLM 2在实际应用中的强大能力,也预示着未来的人工智能将如何更好地协助人类工作。
此外,在Google Brain与DeepMind合并之后,一款名为Gemini的大型多模态机器学习工具正在研发中。Gemini被描述为一种高效且灵活的工具,有望在各种任务上发挥作用,就像GPT-4一样,可以根据用户需求进行定制。
Bard作为生产力工具与搜索引擎之间桥梁的一员,其最新版本针对易用性进行了改进。在引用准确性的问题上,加上了引用功能,现在AI生成答案将通过链接显示特定代码块或叙述性内容来源,从而提高信息真实性。此外,导出按钮也得到了优化,现在可以直接导出到Colab、Replit等平台,便于快速迭代想法。而对于文字输出,如邮件发送,也可以实现自动化操作。
未来,谷歌计划集成更多应用,如Sheets、Slides、Calendar等,以及第三方扩展如Adobe Firefly,这后者能够根据用户输入文本自动生成图像。这表明Bard不仅只是一个简单查询工具,而是一项综合解决方案,对于提升工作效率具有潜在价值。
尽管Bard之前只限于英国和美国,但现在宣布已覆盖全球180个国家及地区,并取消候选名单,使其立即对所有人开放。此外,谷歌还增加了日语和韩语支持,以满足不同地区使用者的需求。预计今年7月,将推广至全球使用量排名前40位语言范围内。
I/O大会上的其他亮点还包括Magic Compose测试版,该功能利用AI技术帮助回复短信,让回复更加自然流畅,同时还可选择不同的风格或语气。此外,还有基于文本到图像扩散模型创作独特手机壁纸,这些都是通过公共领域数据训练而成,以避免版权问题。
最后,与微软同台竞技的情况下,无疑给予人们充分理由思考:新的硬件产品Pixel 7a、Pixel Tablet以及首款折叠屏手机Pixel Fold(售价1799美元)是否足以刺激市场;以及新模型PaLM 2及其系列工具所带来的升级是否能真正超越ChatGPT,为我们揭开未来的科技绘画。不过目前看来,只要这些创新持续推进,我们很快就会看到答案。在I/O期间股价飙升5%的情形下,这一切似乎都指向一个明确的事实:谷歌正迅速赶上甚至超越ChatGPT的地位。但究竟达到何种程度,还需时间去验证。