机器之心报道
机器之心编辑部
一年一度的谷歌 I/O 大会,总是为全球开发者带来一场科技盛宴。今年,更是以AI技术的重大突破而震撼全场。当地时间5月10日上午,加州山景城的海岸圆形剧场座无虚席,大会正式拉开帷幕。
PaLM 2在代码编写和调试方面取得了显著进展。在20种编程语言中进行了训练,不仅包括Python和JavaScript,还包括Prolog、Verilog和Fortran等专业语言。PaLM 2构成了Codey模型,这是一款专用于编码和调试的工具,其作为代码补全和生成服务的一部分推出。
皮查伊现场演示了PaLM 2代码调试功能,以韩文注释修复bug并成功展示其强大的能力。此外,论文地址已公布于网络供大家深入研究。
此外,在Google Brain与DeepMind合并之后,一款新的大型模型正在研发中。皮查伊表示,现在谷歌研究重心转向Gemini——一种多模态、高效的机器学习工具,就像GPT-4一样,你可以在自己的要求中添加图像和文本,使其更加生动有趣。
Bard作为生产力工具与搜索引擎之间桥梁的一员,其最新版改进关注易用性。一是引用功能,现在AI生成回答将通过展示特定代码块来源确保引用准确,并适用于叙述性内容。此外,导出按钮也被加入,让用户能够快速将内容导出到Colab、Replit或文字文件中,无论是在撰写邮件还是直接发送到Gmail,都能实现一键操作。
未来,谷歌计划集成更多应用,如Sheets、Slides、Calendar、Keep、Tasks等,以及Maps、Photos、Messages等服务。这还包括YouTube音乐库及图片搜索系统,以及Adobe Firefly图像生成扩展功能。而且,Bard很快就支持第三方扩展,比如自动根据输入文本生成图像使用Firefly神奇技术。
人们反映的问题之一就是Bard一直只限于英国与美国使用。但这次谷歌宣布Bard覆盖全球180个国家与地区,并取消候选名单,使其立即对所有人开放。此外,除了英语,还增加了日语和韩语支持,将在今年7月全面支持全球“使用量排名前40”的语言。下一代安卓操作系统Android 14新能力也被展示,其中Magic Compose将于夏天测试版推出,是基于AI生成模型的一种短信回复辅助工具,它能学习你的说话方式,并提供不同风格回复选项,或甚至莎士比亚风格创作短信内容。
更令人兴奋的是,用语言提示完成独一无二手机壁纸功能,这利用公共领域数据保证不会创建受版权保护的图像。这一切都归功于谷歌文本到图像扩散模型。在硬件方面,该公司发布Pixel 7a、小屏平板以及首款折叠屏手机Pixel Fold,将于夏天正式销售新硬件,而这些创新让Google股价大涨5%;但至今是否真的能媲美ChatGPT?只有实际体验才能给出答案。