在一年一度的谷歌 I/O 大会上,全球开发者们都聚焦于新一代的AI技术。5月10日上午,加州山景城的海岸圆形剧场座无虚席,大会正式开幕。此次大型活动中,有一个重大突破——PaLM 2模型对代码编写和调试能力的大幅提升。在20种编程语言中进行了训练,包括流行的Python和JavaScript,以及专业语言如Prolog、Verilog和Fortran。PaLM 2是谷歌用于编码和调试专用的模型,是Codey功能的一部分。
现场演示员皮查伊展示了PaLM 2代码调试功能,他输入指令“修复这段代码的一个bug,并添加一行一行韩文注释”,结果令人印象深刻。论文详情可访问https://ai.google/static/documents/palm2techreport.pdf。
此外,在Google Brain与DeepMind合并后,一款新的大型模型正在研发中。皮查伊表示,当前谷歌研究重心转向Gemini,这是一种多模态、高效的机器学习工具。
Bard作为生产力工具与搜索引擎之间桥梁之一,其最新版本主要集中于提高易用性。一项重要改进是引用系统,现在生成答案时,将显示特定代码块来源,以确保引用准确性。这同样适用于网络内容引用。此外,还增加了导出按钮,可以快速将AI生成内容导出到Colab、Replit等平台,或直接发送至Gmail或创建Docs文件。
未来计划集成应用还包括Sheets、Slides、Calendar、Keep、Tasks等,以及Maps、Photos、Messages等服务。此外,支持第三方扩展,如使用Adobe Firefly自动根据文本生成图像,也有所预见。
然而,由于Bard仅限英国和美国用户,此次宣布其覆盖全球180个国家及地区,并取消候选名单,现在即刻对所有人开放。在语言方面,不仅增加了日语和韩语支持,而且预计今年7月将支持全球「使用量排名前40」的语言。而下一代安卓操作系统Android 14也展示了一些新能力,如Magic Compose短信回复工具测试版,将在夏天推出默认短信应用Message中测试。
此外,谷歌还通过文本到图像扩散模型提供独特手机壁纸创意设计服务,该服务使用公共领域训练数据以避免版权问题。而Pixel系列设备,如Pixel Tablet、新折叠屏手机Pixel Fold(售价1799美元)也获得发布,将于夏天开始销售。大型全系列工具AI化升级使得谷歌在大规模语言模型应用领域达到与微软相当甚至领先的地位,而I/O会议期间股价也出现5%增长。但是否可以说Bard已经能与ChatGPT媲美?只有实际体验才能给出最终答案。