在一年一度的谷歌 I/O 大会上,全球开发者们都聚焦于 AI 技术的重大突破。2023年5月10日,加州山景城的海岸圆形剧场座无虚席,开幕仪式正式拉开帷幕。在此背景下,PaLM 2 对代码编写和调试能力进行了显著提升,它不仅训练了20种编程语言,还包括了Python、JavaScript等流行语言以及Prolog、Verilog和Fortran等专业语言。PaLM 2是Google专门用于编码和调试的模型,其核心功能即将通过Codey推出,以提供代码补全和生成服务。
皮查伊现场演示了PaLM 2在代码调试中的应用,他输入了一条指令:“你能修复这段代码的一个bug,并添加一行一行韩文注释吗?”结果显示出了其高效准确性。此外,论文详细介绍了该技术,可以在https://ai.google/static/documents/palm2techreport.pdf查询。
此外,在Google Brain与DeepMind合并后,大型新模型正在研发中。皮查伊表示目前谷歌研究重心转向Gemini,这是一种多模态、高效的机器学习工具,与GPT-4类似,可以附加图像和文本。
Bard作为生产力工具与搜索引擎之间桥梁的一环,其最新版本着重于易用性方面。首先是引用系统,现在AI生成回答将通过展示特定来源来确保内容准确性。这同样适用于网络叙述性内容引用。此外,还加入导出按钮,让用户可以快速将AI生成内容导入Colab或Replit继续构建或迭代想法,不限于文字,也可直接发送到Gmail或新建Docs文件。
未来谷歌计划集成更多应用,如Sheets、Slides、Calendar、Keep、Tasks、Maps、Photos等,以及第三方扩展,比如使用Adobe Firefly自动根据文本生成图像。
然而,由于Bard起初只限英国及美国地区使用,这引发了一些问题。不过谷歌宣布Bard现在覆盖全球180个国家,并取消候选名单,使其立即对所有人开放。此外,增加了日语和韩语支持,并预计今年7月前支持全球“使用量排名前40”的语言。
I/O大会上还展示了下一代移动操作系统Android 14的新功能之一为Magic Compose,它将在今年夏天测试版推出至Message短信应用,让用户基于AI模型获得大量回短信提示。Magic Compose能够学习说话方式,让回复具有不同语气甚至莎士比亚风格。
除此之外,谷歌还利用生成式AI制作独一无二手机壁纸,而这些壁纸由公共领域数据训练产生,从而保证不会侵犯版权保护。这项功能归功于谷歌文本到图像扩散模型,在该领域也取得领先地位。
此次大会同时发布Pixel 7a、小屏平板电脑Pixel Tablet,以及首款折叠屏手机Pixel Fold售价1799美元,将于夏天正式上市。而随着新的模型PaLM 2及系列工具升级至全系列产品,对大型语言模型应用上的竞争力被认为达到了微软ChatGPT相当水平甚至超越。在I/O大会期间,谷歌股价亦有5%增长,但是否真的能够媲美ChatGPT则需要实际体验以得出结论。