机器之心报道
机器之心编辑部
一年一度的谷歌 I/O 总是吸引着全球开发者的眼球,今年 AI 技术有重大突破,大家的关注度更高了。
当地时间 5 月 10 日上午,加州山景城的海岸圆形剧场座无虚席,今年的大会正式开幕。
与此同时,PaLM 2 改进了对代码编写和调试的支持,在 20 种编程语言上进行了训练,包括 Python 和 JavaScript 等流行语言以及 Prolog、Verilog 和 Fortran 等其他更专业的语言。PaLM 2 构成了 Codey 的基础,它是谷歌用于编码和调试的专用模型,作为代码补全和生成服务的一部分推出。
皮查伊现场演示了 PaLM 2 的代码调试功能,当他输入指令“你能修复这段代码的一个 bug,并添加一行一行韩文注释吗?”时,一系列精准、高效且具备语义上的操作步骤便在屏幕上展现出来,就像是在亲手指导一个经验丰富的程序员如何解决问题一样。这不仅展示了 PaLM 2 在处理复杂任务上的强大能力,也凸显出了它在未来软件开发领域中的巨大潜力。
论文地址:https://ai.google/static/documents/palm2techreport.pdf
另外,在 Google Brain 和 DeepMind 合并之后,新的大模型也在研制过程中。皮查伊表示现在谷歌研究重心正在转向 Gemini,这是一种多模态和高效的机器学习工具。在这个不断发展变化的情境下,每一次技术迭代都让人既期待又焦虑。
Bard 作为生产力工具和搜索引擎之间桥梁的一个新角色,其最新版改进主要聚焦于易用性提升。首先加入引用功能,使得 AI 生产回答更加准确透明,即便内容源自网络亦可通过特定链接追踪到原始来源。此外,还增加导出按钮,让用户可以快速将 AI 提供内容导入 Colab、Replit 或者文字格式,便于进一步构思或迭代想法。而文字输出同样灵活,可直接发送邮件或者创建新的 Docs 文件。
未来的集成应用还将包括 Sheets、Slides、Calendar、Keep、Tasks、Maps、Photos、Messages、Flights、YouTube 以及 YT Music。此外,将来还可能支持 OpenTable,以及 Adobe Firefly 等第三方扩展,比如自动根据输入文本生成图像,这些都是基于 Adobe Firefly 技术实现。
人们反映最多的问题是 Bard 之前一直限于英国和美国使用,但这次谷歌宣布 Bard 将覆盖全球180个国家与地区,并取消候选名单,现在立即人人可用。在语言方面,此次增加日语和韩语,并计划在今年7月之前使其支持全球「使用量排名前40」的语言,为不同文化背景的人提供更加贴合需求的地面服务。
I/O 大会上,还展示了下一代移动操作系统 Android 14 的新能力,其中 Magic Compose 将于夏天推出测试版,以一种基于 AI 模型创造出的智能回短信工具,让回复变得更加自然而然。Magic Compose 能够学习你的说话风格,你甚至可以让自己的回复看起来像是莎士比亚笔下的作品,或许这种方式能够让沟通变得更加生动有趣?
同时,该公司还利用生成式 AI 来帮助用户制作独一无二手机壁纸,可以通过描述自己的创意愿景来完成这一任务,而不会侵犯任何版权。这项功能依赖公共领域数据,不会产生受版权保护的事物,因此保证安全性与创新性并存。
此外,Pixel系列产品继续升级,其中 Pixel Fold 是首款折叠屏手机,其价格为1799美元,将于夏天正式销售进入市场。随着新模型 PaLM 2 引入,全系列工具AI化升级,再加上大规模应用实验室(Google’s Applied Computing Lab)的努力,无疑证明了谷歌已经超越微软成为另一个领先的大型技术企业之一,同时股价也随之飙升5%。但是否真的能媲美 ChatGPT?只有等待实际体验才能给出答案。但目前看来,从技术层面来说,它们正逐渐接近甚至超过彼此。在未来的岁月里,我们期待这些科技巨头如何继续发挥他们所掌握的大脑力量,为人类社会带去更多惊喜与改变。