Google I/O 2025 全面盘点:AI 再升级,Gemini 与 Veo 引爆全场

Google I/O 2025 发布 Gemini 2.5、Veo 3、AI Agents、Android XR 等重磅 AI 产品,AI 能力全面渗透至搜索、Workspace、视频、开发与硬件生态。

阅读时长: 4 分钟
共 1835字
作者: eimoon.com

Google I/O 2025 大会已于 2025 年 5 月 20 日至 21 日成功举行,不出所料,今年的大会再次将焦点集中在人工智能(AI)领域,发布了大量令人瞩目的新产品和功能,预示着一个由 AI 深度驱动的未来。

AI 模型与能力提升

Google 在 AI 基础模型方面取得了显著进展,并推出了多项创新:

Gemini 2.5 系列更新

进一步增强了 Gemini 2.5 Pro 和 Gemini 2.5 Flash 模型。其中,Gemini 2.5 Pro 引入了实验性的 Deep Think 模式,旨在实现更高级的推理能力,而 Gemini 2.5 Flash 则以其轻量、快速和低成本的特点,适用于更广泛的应用场景。

新一代生成式媒体模型

  • Imagen 4:作为最新的文本转图片模型,Imagen 4 在图像生成质量和真实感方面实现了飞跃,尤其在处理文本渲染方面表现出色。
  • Veo 3:全新的文本转视频模型,不仅支持生成高清视频,还增加了原生音频生成功能,可以为视频自动添加环境音和角色对话,极大地提升了视频创作的便捷性和真实感。
  • Gemini Diffusion:一项新的研究模型,专注于文本扩散技术,有望在内容生成领域带来更多突破。
  • Gemma 3n Preview:Google 推出了新的开源 Gemma 模型,强调其灵活性、隐私保护以及在移动设备上的多模态能力,进一步降低了 AI 开发的门槛。
  • LearnLM 深度整合:基于 Gemini 的 LearnLM 模型家族将更深入地融入到 Gemini 2.5 中,旨在通过 AI 驱动提供更个性化、更有效的学习和教学体验。

AI 在 Google 产品中的深度应用

AI 的强大能力被深度整合到 Google 的核心产品和服务中,为用户带来前所未有的智能体验:

  • AI Overviews (AI 概览) 全面推广:Google 搜索中的 AI 概览功能已向美国所有用户推出,并逐步推广到全球 200 多个国家和地区,通过 AI 对搜索结果进行总结,提供更高效的信息获取方式。
  • Ask Photos 增强:Google 相册的 AI 功能进一步强化,用户可以通过更复杂的提问来查找和理解照片内容,例如识别照片中的特定信息。
  • AI Agents (AI 智能体) 的进展:Google 大力推进 AI 智能体,它们能够执行更复杂的、多步骤的任务,例如自动完成在线购物流程、管理日程,甚至在 Gemini 应用中提供实验性功能。
  • Gemini for Workspace 智能化升级:Gemini 深度集成到 Gmail、Docs、Drive 等 Workspace 应用中,提供个性化的智能回复、协助长文档的深度研究和内容创作,显著提升工作效率。
  • Google Beam (原 Project Starline):Google 将 Project Starline 正式更名为 Google Beam。这是一个革命性的 3D 视频通话平台,通过 AI 和先进的 3D 渲染技术,旨在提供更沉浸式、更真实的远程交流体验。Google 正与 HP 等合作伙伴共同将其推向市场。
  • Android XR 平台:Google 宣布了 Android XR 平台,旨在为智能眼镜和头戴式设备提供支持,并将 Gemini 模型引入这些设备,实现 AI 驱动的扩展现实体验。
  • Google AI Ultra 订阅服务:面向高级用户,Google 推出了 Google AI Ultra 订阅计划,提供最高级别的 AI 服务访问权限和高级功能。
  • SynthID Detector:一项新的门户工具,旨在帮助用户和开发者识别 AI 生成的内容,以应对内容真实性挑战。
  • Flow:AI 电影制作工具:一款基于 Veo、Imagen 和 Gemini 模型构建的 AI 电影制作工具,为创作者提供 AI 驱动的电影创作能力,包括相机控制、场景构建等。
  • AI 购物体验:新增的 AI 购物功能包括虚拟试穿(用户可以使用自己的照片进行虚拟试穿)和智能代理购物(当商品达到目标价格时,AI 可以自动下单)。
  • Gemini Live 增强:Gemini Live 进一步融入了 Project Astra 的能力,使用户能够通过摄像头和屏幕共享与 AI 助手进行更自然的实时互动。
  • Jules 编码助手:Google 推出了自主编码代理 Jules 的公开 Beta 版本,它能够理解开发者的意图并执行复杂的编码任务,极大地提升了开发效率。
  • Android 中的 AI 增强:Android 设备上的 AI 功能得到进一步提升,包括设备端诈骗电话检测,以及 Gemini 在视频播放时回答相关问题,甚至处理 PDF 文档的能力。
  • Chrome 中的 AI 集成:Chrome 浏览器将集成更多 AI 助手功能,例如基于 Gemini Nano 的 Summarizer API、Language Detector API 等。

开发者工具与平台

Google 持续为开发者提供强大的工具和平台,赋能 AI 创新:

  • Android 开发工具更新:在 Android Studio 和相关工具中引入了许多新功能和改进,旨在加速 Android 应用开发,例如分析器的性能提升、IntelliJ 平台更新(包括粘性行功能)等。
  • Android XR SDK Developer Preview:面向 XR(扩展现实)设备的开发者预览版 SDK,为开发者构建下一代沉浸式应用提供了基础。

总结

Google I/O 2025 大会再次明确了 Google 在人工智能领域的领导地位和坚定承诺。从基础模型的突破到产品功能的深度集成,再到开发者工具的全面升级,Google 正在构建一个以 AI 为核心的生态系统,旨在让技术更加智能、个性化,并最终为每个人带来更具价值和沉浸感的体验。大会发布的各项创新预示着 AI 将在我们的日常生活中扮演越来越重要的角色。

关注我获取更多资讯

公众号
📢 公众号
个人号
💬 个人号
使用 Hugo 构建
主题 StackJimmy 设计