Gemini成为谷歌产品新大脑，新视频模型对标Sora，XR智能眼镜惊喜亮相

更新时间：2025-05-21 14:46:57 发布时间：5小时前评论：0

内容摘要来源：DeepTech深科技“它不仅看得见、听得到，还记得你说过的话，知道什么时候做出反应。”去年的谷歌 I/O 开发者大会上，多模态 AI 助手 Project Astra 首次亮相。当时它更像是一种概念验证。而在今天的谷歌 I/O 大会

来源：DeepTech深科技

“它不仅看得见、听得到，还记得你说过的话，知道什么时候做出反应。”

去年的谷歌 I/O 开发者大会上，多模态 AI 助手 Project Astra 首次亮相。当时它更像是一种概念验证。

而在今天的谷歌 I/O 大会上，Project Astra 以一种更令人惊叹的方式进化了，谷歌 DeepMind 展示了它在实时感知、语境理解、边缘设备运行等方面的全新能力：它能通过手机或智能眼镜识别物体、追踪用户语音指令，并对环境中的动态变化做出快速反应，真正融入人类的现实生活。

“Astra 可以根据它看到的事物选择何时说话。”DeepMind 研究总监 Greg Wayne 表示，“实际上，它一直在持续观察，然后发表评论。”

这意味着：它能够代表你完成任务，即使你没有明确要求；它还可以根据所看到的内容选择性“发言”，比如指出作业中的错误。

Project Astra 仍然是一个试验项目，公众或许很久都没有机会体验它，但它的升级，代表着谷歌的 AI 战略野心。它的背后，是谷歌正在以 Gemini 为核心，构建一个贯穿搜索、创作、办公、助手系统的 AI 应用世界。

从文本生成图像与视频，到智能回复邮件和工作流整合，再到与用户实时对话的语音交互——Gemini 已不只是聊天工具，而是逐渐成为谷歌全产品线的大脑。

因此，在 I/O 2025 大会上，谷歌用来打头阵的就是 Gemini。

歌）

谷歌CEO Sundar Pichai 表示，最新的 Gemini 2.5 Pro 模型（preview-05-06 版）已经在 LMArena“屠榜”，所有测试均排第一。

同时，谷歌还带来了新的模型升级。Gemini 2.5 Pro 新增了一种名为 Deep Think 的强推理模式，该模式专为与数学和编程相关的复杂查询而设计，能够在回应前考虑多种假设，但目前仅向可信测试者开放。

开启 Deep Think 模型的模型在多模态推理测试 MMMU 中获得了 84% 的准确率。

该公司还补充说，该模式在 2025 年美国数学奥林匹克竞赛 (USAMO) 中取得了“令人印象深刻的成绩”，但并未公布确切分数。

此外，上个月发布在 Pixel 手机上的 Gemini Live 应用将登陆所有兼容的 Android 和 iOS 设备，可通过 Gemini 应用程序使用（谷歌透露该应用已拥有超过 4 亿月活跃用户）。

该应用允许用户询问 Gemini 关于截图的问题，以及手机摄像头正在捕捉的实时视频内容。

Gemini 重塑搜索体验

另一个新进展是，谷歌宣布将 Gemini 进一步集成到 Chrome 浏览器中。

从5 月 21 日开始，Google AI Pro 和 Ultra 订阅用户可以看到 Chrome 中的 Gemini 按钮，以跨网页总结信息，并帮助他们更好地浏览网站。谷歌计划今年晚些时候让 Gemini 能够同时处理多个标签页。

在此基础上，谷歌宣布了搜索引擎将加入新功能，AI Mode。

这项功能位于单独的标签页中，旨在处理比传统搜索更复杂的查询。用户可以利用它比较不同品牌的同类商品，或寻找最便宜的门票。该功能将首先向美国用户开放。

AI Mode 还为购物功能带来了重大升级。用户很快就能上传一张自己的照片，来虚拟试穿衣服，查看服装在真实人物上的效果。谷歌正在测试这一新功能，该功能利用“了解人体和服装细微差别”的 AI 模型来实现试穿效果。

据谷歌透露，每月已有超过15 亿人次看到 AI 生成的搜索概览（AI Overviews），而且绝大多数用户都以有意义的方式与之互动。

AI Mode 将使用 Gemini 2.5 模型，并将很快能够根据特定查询生成自定义图表和图形。它还能够处理后续问题，使搜索体验更加连贯自然。

同时谷歌还推出了名为 Search Live 的功能，允许用户通过选择 AI Mode 或 Lens 中的 Live 图标，实时讨论手机摄像头看到的内容。这项功能未来将从谷歌 Astra 项目中汲取灵感，进一步扩展搜索引擎的能力范围。

作为安全增强措施，Chrome 的密码管理器也将得到更新。如果 Chrome 检测到您的密码已被泄露，浏览器将很快能够“生成强大的替代密码”，并在支持的网站上自动更新它（如果用户同意）。此功能将于今年晚些时候推出。

AI 创作工具升级：Imagen 4、Veo 3 和 Flow

接下来，谷歌宣布了图像生成和视频生成模型的更新。

AI 创作工具是本次大会的另一大亮点。谷歌推出了全新图像生成模型 Imagen 4，在输出图像的细节、构图和风格控制上“实现了明显提升”，更擅长处理布料和毛皮等精细细节。

图 | Imagen 4 生成的图片（来源：谷歌）

“Imagen 4 可以创建各种宽高比的图像，分辨率高达 2k，更适合打印或演示。它在拼写和排版方面也得到了显著提升，让用户可以更轻松地创作自己的贺卡、海报甚至漫画。”谷歌表示。

而新一代视频生成模型 Veo 3 不仅提高了生成质量，而且首次可以生成带有音频的视频，包括城市街道场景背景中的交通噪音、公园里鸟儿的歌唱，甚至人物之间的对话。

| Veo 3展示（来源：谷歌）

结合上述模型的进步，谷歌还推出了一款名为 Flow 的新型 AI 电影制作应用，类似于 OpenAI Sora。

它是 VideoFX 的升级版，使用 Veo、Imagen 和 Gemini 来创建基于文本提示和/或图像的视频片段。该工具还提供场景构建工具，可将剪辑拼接在一起，创建更长的 AI 视频。

Flow 具备摄像机移动和透视控制等功能，允许编辑和扩展现有镜头，还能将 Veo 模型生成的 AI 视频内容融入更复杂的项目中。

Flow 从今天开始向美国的谷歌 AI Pro 和 Ultra 订阅用户开放，很快将扩大到其他市场。

为了帮助用户确定内容是否由 AI 工具生成，谷歌设计了一种工具，名为 SynthID Detector，它可以扫描图像、音频、视频或文本中的 SynthID 水印，并让用户知道哪些部分可能带有水印。早期测试人员将从今天开始尝试使用这一工具。

Project Aura：新的 XR 眼镜

谷歌还展示了自己在 Android XR 领域取得的新进展。

| Project Aura 新智能眼镜（来源：谷歌）

Android XR 平台是谷歌为增强现实、混合现实和虚拟现实开发的平台，希望能复制 Android 系统在智能手机领域的成功。

基于此，谷歌宣布了第二款官方 Android XR 设备：Project Aura，一款智能眼镜。

Xreal 和谷歌正在合作开发 Project Aura，它将是一款使用 Android XR 平台的新型智能眼镜。目前关于这款眼镜的信息不多，但它将集成 Gemini，拥有大视场，预计将使用高通芯片，以及内置摄像头和麦克风。

| 新眼镜演示（来源：谷歌）

在 Android XR 的演示中，谷歌展示了实时翻译功能，但使用的是与三星共同开发的智能眼镜（Project Moohan）于今年初公布的）。

除了上述大更新外，谷歌还在生产力场景中加入了 AI 技术。

Gmail 将大规模引入基于 Gemini 的智能回复功能，可从用户过往邮件、谷歌云盘文件中提取背景信息，生成更精准、定制化的回复内容。用户在阅读邮件时，也可调出 Gemini 侧边栏，获取总结、要点提取和后续操作建议。

谷歌 Workspace 中的 Docs、Sheets、Slides 等工具也将陆续集成 Gemini，帮助用户更高效地处理长文档、制作数据报告或撰写内容提案。

谷歌还宣布了一个新的 3D 视频会议项目，Google Beam。目前仅面向企业客户。

这套系统也集成了 AI 技术。它使用光场显示技术，不需要佩戴任何特殊设备，而是通过六个摄像头阵列捕捉不同角度，然后用 AI 将这些图像拼接在一起，使用头部跟踪功能跟踪用户的动作，并以每秒最高 60 帧的速度传输。

最后，谷歌推出了高达每月 250 美元的 AI Ultra 订阅计划。这个价格比 OpenAI 的 200 美元 Pro 计划还要贵。

谷歌表示，该计划将包括对其最新 AI 工具的早期访问权限，以及无限使用对谷歌来说成本高昂的功能，如 NotebookLM、Deep Research 和最新推出的 Flow，都将解除使用次数上限。此外，它还提供 30TB 的存储空间，以及 YouTube Premium 服务。

可以看出，与尝试统治 AI 代理生态系统的微软不同，谷歌在此次 I/O 大会上更多展示的是应用层面的更新，将以 Gemini 为核心的 AI 技术全面拓展到自家产品中。

对于普通用户而言，这样或许能够更直观地感受到 AI 带来的价值。

参考资料：

2025/

models/project-astra/

news/669408/google-io-2025-biggest-announcements-ai-gemini

ai/google-io-2025-recap-ai-updates-android-xr-google-beam-and-everything-else-announced-at-the-annual-keynote-175900229.html

排版：初嘉实

举报收藏打赏 评论 0

版权声明 本文仅代表作者观点，不代表本站立场。
如遇本文系为网络转载到本站发表，图片或文章有版权问题的请联系客服确认后会立即删除文章。
如遇本文系作者授权本站发表，未经许可，不得转载。

--结束END--

有问题投稿请发送至: 邮箱/

本文标题: Gemini成为谷歌产品新大脑，新视频模型对标Sora，XR智能眼镜惊喜亮相

本文链接: http://31dou.com/news/show-762218.html (转载时请保留)

0 条

雷军预热小米YU7：配色灵感来源大揭秘还直呼YU7不可替代

科技 jiuhong999 ⋅ 7阅读量 ⋅ 0评论 ⋅ 34分钟前

2025-05-21
胖都来回应改名盈都来：“盈”和集团“盈中控股”名字有关

科技 yuyao410 ⋅ 5阅读量 ⋅ 0评论 ⋅ 34分钟前

2025-05-21
马斯克超硬核采访：那些破坏特斯拉的人和背后金主、我找你们算账了

科技 porlun ⋅ 5阅读量 ⋅ 0评论 ⋅ 34分钟前

2025-05-21
神舟二十号航天员乘组将择机第一次出舱要漫步太空了

科技 zd773654802 ⋅ 2阅读量 ⋅ 0评论 ⋅ 34分钟前

2025-05-21
《人民日报》点赞华为鸿蒙PC、小米自研3nm芯片：科技兴国

科技 chenfengchem ⋅ 10阅读量 ⋅ 0评论 ⋅ 34分钟前

2025-05-21
深圳首创为新人搭乘直升机高空发结婚证当事人：非常激动深刻一辈子忘不了

科技 hch1000 ⋅ 10阅读量 ⋅ 0评论 ⋅ 34分钟前

2025-05-21
民营火箭5天3连发全成功！力箭一号发射一箭六星

科技 tsseroem ⋅ 10阅读量 ⋅ 0评论 ⋅ 34分钟前

2025-05-21
自研玄戒O1+首款SUV亮相！小米15周年战略新品发布会

科技 wangxiaohui5572 ⋅ 10阅读量 ⋅ 0评论 ⋅ 34分钟前

2025-05-21
余承东：明天要回母校带上最新鸿蒙折叠电脑请清华学弟体验

科技 liushibing2012 ⋅ 18阅读量 ⋅ 0评论 ⋅ 34分钟前

2025-05-21
全球唯一兼容5大动力系统！长城全动力智能超级平台一图看懂

科技 gzyudie ⋅ 17阅读量 ⋅ 0评论 ⋅ 34分钟前

2025-05-21

雷军回应小米YU7能否突出重围：它为先进时代精英打造有不可替代独特魅力

行业 ⋅ 19阅读量 ⋅ 0评论 ⋅ 2小时前

2025-05-21
群联E28 PCIe 5.0 SSD主控狂飙14.9GB/s！功耗却只有5W

行业 ⋅ 17阅读量 ⋅ 0评论 ⋅ 2小时前

2025-05-21
2.5K档内最强性能！真我Neo7 Turbo首批搭载天玑9400e

行业 ⋅ 14阅读量 ⋅ 0评论 ⋅ 2小时前

2025-05-21
官宣！小米将同时采用高通/玄戒处理器：小米16首批搭载下一代骁龙8 Elite

行业 ⋅ 8阅读量 ⋅ 0评论 ⋅ 2小时前

2025-05-21
尊界S800活动用埃尔法接机、配依云矿泉水博主分享遭吐槽韩路：都想多了



行业 ⋅ 10阅读量 ⋅ 0评论 ⋅ 2小时前

2025-05-21
十年前爆款迭代！酷态科CP超级户外风扇发布：69元、38000转电机

行业 ⋅ 18阅读量 ⋅ 0评论 ⋅ 2小时前

2025-05-21
雷军官宣小米YU7全新配色宝石绿：晶莹透亮、一眼高级



行业 ⋅ 16阅读量 ⋅ 0评论 ⋅ 2小时前

2025-05-21
全球第一！中国已有超3000万辆新能源汽车纯电超2000万辆

行业 ⋅ 2阅读量 ⋅ 0评论 ⋅ 2小时前

2025-05-21
四种体验：冈本进口超薄套14只发车19.9元

行业 ⋅ 11阅读量 ⋅ 0评论 ⋅ 2小时前

2025-05-21
打工人狂喜！快手开启员工带薪刷短视频每天须刷一小时

行业 ⋅ 7阅读量 ⋅ 0评论 ⋅ 2小时前

2025-05-21

移远通信拟定增募资不超23亿 2019上市两募资共20亿

经济资讯站长 ⋅ 11阅读量 ⋅ 0评论 ⋅ 2025-04-01 18:01

2025-04-01
华资实业终止不超过2.96亿元定增 2024年扣非亏损

经济资讯站长 ⋅ 18阅读量 ⋅ 0评论 ⋅ 2025-04-01 18:01

2025-04-01
破发股盛泰集团股东拟减持 2021年上市两募资共12.6亿



经济资讯站长 ⋅ 19阅读量 ⋅ 0评论 ⋅ 2025-04-01 18:01

2025-04-01
破发股井松智能某股东拟减持上市即巅峰华安证券保荐

经济资讯站长 ⋅ 5阅读量 ⋅ 0评论 ⋅ 2025-04-01 16:01

2025-04-01
破发股汇宇制药第二大股东拟减持上市即巅峰募24.7亿

经济资讯站长 ⋅ 15阅读量 ⋅ 0评论 ⋅ 2025-04-01 16:01

2025-04-01
子公司项目节能审查亮“红灯” 新和成：或涉环保问题非设备风险

经济资讯站长 ⋅ 8阅读量 ⋅ 0评论 ⋅ 2025-04-01 16:01

2025-04-01
收评：三大指数涨跌不一化学制药板块涨幅居前



经济资讯站长 ⋅ 1阅读量 ⋅ 0评论 ⋅ 2025-04-01 16:01

2025-04-01
厦门环能终止上交所主板IPO 原拟募11亿海通证券保荐



经济资讯站长 ⋅ 7阅读量 ⋅ 0评论 ⋅ 2025-04-01 12:01

2025-04-01
宝钛股份拟发不超35亿元可转债 2021年定增募20亿元

经济资讯站长 ⋅ 20阅读量 ⋅ 0评论 ⋅ 2025-04-01 12:01

2025-04-01
晶华新材不超2.27亿定增获上交所通过东方证券建功

经济资讯站长 ⋅ 20阅读量 ⋅ 0评论 ⋅ 2025-04-01 12:01

2025-04-01

小米集团CEO雷军：小米YU7是为先进时代精英潜心打造的先进SUV！我相信，YU7 有着不可替代的独特魅力

汽车 haozhisheng8888 ⋅ 3阅读量 ⋅ 0评论 ⋅ 2小时前

2025-05-21
Gemini成为谷歌产品新大脑，新视频模型对标Sora，XR智能眼镜惊喜亮相

科技 haozhisheng8888 ⋅ 11阅读量 ⋅ 0评论 ⋅ 5小时前

2025-05-21
Apple iPhone 16 Plus 256GB 白色 5G 手机活动价4652元

科技 haozhisheng8888 ⋅ 3阅读量 ⋅ 0评论 ⋅ 3天前

2025-05-18
日本一季度实际GDP环比下降0.2%

新闻资讯 haozhisheng8888 ⋅ 9阅读量 ⋅ 0评论 ⋅ 4天前

2025-05-17
2025年05月15日江苏废纸回收价格查询

五金 haozhisheng8888 ⋅ 4阅读量 ⋅ 0评论 ⋅ 5天前

2025-05-15
（2025年05月14日）今日丙烷价格行情最新报价

农村致富 haozhisheng8888 ⋅ 6阅读量 ⋅ 0评论 ⋅ 6天前

2025-05-14
群联 E28 SSD 主控实测数据：顺序读写 14500 MB/s，随机读写霸榜

科技 haozhisheng8888 ⋅ 8阅读量 ⋅ 0评论 ⋅ 7天前

2025-05-14
剧集“N连扑”，芒果TV能否破解爆款依赖症？

科技 haozhisheng8888 ⋅ 6阅读量 ⋅ 0评论 ⋅ 8天前

2025-05-13
今日方管价格行情查询（2025年5月9日）

农村致富 haozhisheng8888 ⋅ 19阅读量 ⋅ 0评论 ⋅ 11天前

2025-05-10
爱达·地中海号邮轮首次停靠深圳国际邮轮母港

商业与经济 haozhisheng8888 ⋅ 6阅读量 ⋅ 0评论 ⋅ 11天前

2025-05-09

陈浩鑫

去ta空间

24小时热闻

今日推荐