机器之心报道:谷歌 I/O 大会亮相新大模型,PaLM 2 和 Bard 全面升级,挑战 ChatGPT
一年一度的谷歌 I/O 总是吸引着全球开发者的目光,而在2023年的大会上,AI技术的重大突破让大家的关注度达到了新的高度。5月10日,上午,加州山景城的海岸圆形剧场座无虚席,这一次大会正式开幕。
与此同时,PaLM 2在代码编写和调试方面取得了显著进展,它在20种编程语言上进行了训练,不仅包括Python和JavaScript等流行语言,还有Prolog、Verilog和Fortran等更专业的语言。PaLM 2构成了Codey基础,是谷歌用于编码和调试的专用模型,与代码补全和生成服务紧密结合。
现场演示中,皮查伊展示了PaLM 2代码调试功能,他输入“你能修复这段代码的一个bug,并添加一行一行韩文注释吗?”结果显示出精准且详细的解决方案。论文地址为https://ai.google/static/documents/palm2techreport.pdf。
此外,在Google Brain与DeepMind合并之后,大型多模态机器学习工具Gemini正在研发中。皮查伊表示,现在谷歌研究重心正逐步转向Gemini,这将是一个具有前瞻性的创新项目。
Bard作为生产力工具与搜索引擎之间桥梁的一环,其最新版更新集中体现在易用性提升上。在引用方面,一旦AI生成内容接近实用化,就可以通过链接直接源自特定代码块来确保准确性。这同样适用于叙述性内容来源。
导出按钮也得到了增强,如果AI生成内容接近实用化,可以快速导出到Colab或Replit继续构建想法。此外文字输出同样支持,如邮件发送至Gmail或新建Docs文件。此次还计划集成应用包括Sheets、Slides、Calendar、Keep、Tasks、Maps、Photos、Messages、Flights、YouTube及 YT Music 等,以及Adobe Firefly图像创作工具。
值得注意的是,由于用户反馈问题,最大的抱怨之一就是Bard只能限于英国和美国使用。但是在I/O大会上宣布,将扩展到全球180个国家,并取消候选名单,使其立即对所有人开放。此外,还增加了日语和韩语支持,以期今年7月时能够实现全球40种主要语言支持。
下一代安卓操作系统Android 14也展示了一些新能力,其中Magic Compose将于夏天推出测试版,让回短信过程变得更加智能,用AI提供大量提示根据聊天内容学习说话方式,同时还能选择不同的风格,比如莎士比亚风格写回复短信。
除了这些创新之处,谷歌还利用文本到图像扩散模型帮助用户制作独一无二手机壁纸,只需描述创意愿景即可完成。而Pixel系列产品如Pixel 7a、三折屏手机Pixel Fold(售价1799美元)也迎来了新硬件版本,将于夏天正式市场发布。随着PaLM 2的大规模应用,全系列工具经过AI化升级,使得谷歌再次领先微软,并使其股票价格涨幅达到5%。然而,现在是否真的可以说Bard已经超越ChatGPT?只有当我们亲身体验后,我们才能得到答案。