作者|周雅
刚刚,Google带来了它今年的The Android Show,但这次更新的Android 17,并非只是一场常规的操作系统更新。
为什么这么说?
操作系统的形态在过去很多年其实没有真正变过——人下指令,机器执行。设备越来越聪明,但繁重的输入、切换、复制、粘贴、填表、寻找,仍然由人工完成。
但到了 Agentic AI 时代,用户的痛点变了。App 太多,工具之间要自己来回切换,信息散落在邮件、网页、日历、消息、照片、文件和各种平台里。
Google 给出的答案,是“让 Android 从一个 operating system(操作系统),演进成一个 intelligence system(智能系统)。”只有两字之差,但变化其实非常大——AI 这一层不再以 App 的形式出现,而是下沉到 OS 本身,并开始反过来调用 App。
App 与 AI 的关系被翻转了,人机交互体验也随之变化。
如果用一个直白的词来概括这种体验,或许可以是「代劳」:系统替你打开 App,替你填表,替你订车、订餐、订门票;替你整理语音里的长上下文;替你生成一个本属于设计师工作量的 UI 组件;替你省掉一切原本会消耗注意力的中间环节。这是与以往完全不同的逻辑。
【01】大模型「代劳」:Gemini Intelligence如何接管日常琐碎小事?
Google 这次专门给 Android 设备打造了一个智能层,名字就叫做 Gemini Intelligence。注意,Gemini 在这里不是一个 App,而是一种智能,是一种属性。
Android 核心体验产品管理总监Ben Greenwood 用一句话来形容它:Gemini Intelligence 的目标,是让设备更主动、更个性化、更高产,在需要时出现,不需要时退到后台。
这就带来了Android的第一个变化——「任务自动化」。Ben 举的例子是:当你在度假,在酒店大堂看到一张旅游传单,你拍下来以后对 Gemini 说:“帮我找一个类似的行程,明天有空位,适合六个人,评分还不错。”Gemini 要理解图片内容,也要理解用户偏好和时间约束,还要进入 Expedia 这类应用去寻找合适的选项。用户唯一需要做的,就是最后的一步「确认」。类似的任务自动化,还有安排晚餐、叫车、抢健身课位置、订活动票等等。
但可以明确的是,这些指令,都不是发生在 Gemini 的对话框里,而是能在任何界面直接调用 Gemini,因为它已经被融入进操作系统。Ben 特别提到,为了让这个体验更丝滑,Google 过去几个月在 Galaxy S26 和 Pixel 10 上专门微调了订餐和打车类 App 的多步自动化。
这跟过去的语音助手完全不是一个量级。过去的助手更像「问答入口」,你问一句,它答一句;现在 Google 想做的是「任务流入口」,你表达一个意图,它去拆解流程。
当然,这里也会带来一个敏感问题:AI 替你操作 App,到底能不能被信任?
Google 在这里反复强调控制权:Gemini 只会在用户发出指令后行动,只会作用于用户允许的 App,任务完成后就停止,最后仍然需要用户确认。
Android的第二个变化,是把代劳从 App 延伸到整个浏览器。其中有两个更新,Gemini in Chrome 和 Chrome Auto Browse,
从 6 月底开始,Gemini in Chrome 会基于 Gemini 3.1 模型,登陆部分 Android 设备,用户点击工具栏右上角 Gemini 图标,Gemini 会出现在屏幕底部,理解网页内容、总结长文章、解释复杂话题等。这一步其实还比较好理解,现在很多 AI 浏览器都在做类似的事情。
更值得看的,是 Chrome Auto Browse。Google 给的例子很生活化:你要去看脱口秀,但忘了预约停车位,Chrome 可以根据票务确认信息帮你找停车位;你的狗长大了,Chrome 可以帮你把狗粮订单从幼犬粮改成成犬粮。
这意味着 Chrome 的角色变了。以前,浏览器是搜索的入口。现在,Google 想让浏览器变成一个能理解网页内容、连接 Google 应用、跨网页执行任务的智能体入口。
同时,Google 也把安全问题摆到了台面上。Google 明确提到,这些能力沿用桌面端的安全保护,以防御 prompt injection 等新型威胁;涉及购买付款或者社交媒体发布等敏感动作,Auto Browse 会主动停下来征求确认。
据悉,Gemini in Chrome 会先面向美国、英语、Android 12 及以上、4GB 内存以上的部分设备推出;Auto Browse 则面向美国、AI Pro 和 Ultra 订阅用户中的部分设备。
Android的第三个变化,是代劳一些日常琐碎的小事。
比如 Autofill,可以代劳填信息。过去,自动填充更多是基础便利功能,帮你填姓名、地址、信用卡号;但现在,Google 把它接入了 Gemini,可以自动填充更多个性化数据、更多复杂的字段。
Ben 把他的朋友 Dina 拉出来当例子:Dina 总是记不住自己的护照号、驾照号、或者租车的车牌号,导致每次订票,或者用停车软件,他都要在多个 App 之间来回切换查信息。而最新的 Autofill 会调用 Gemini 的「个人智能(Personal Intelligence)」,如果用户选择开启,系统可以调用用户主动保存的个人信息,自动填进任何一个 Android 应用和 Chrome 表单里。
关于 Gemini 的「个人智能(Personal Intelligence)」,Google 在会后的问答环节进一步解释了数据来源:Autofill 是设备端技术和云端 Google Personal Intelligence 的组合,数据来自用户选择存储并分享给 Google 的内容,比如 Drive、Photos、Gmail 里的驾照、证件等信息,用户可以选择是否连接 Gemini,也可以在设置里关闭。
再比如 Rambler,可以代劳输入法。现在的输入法,语音转文字已经很成熟,但人说话和写字并不是一回事,人类会停顿、重复、临时改口,会夹杂各种“嗯”“啊”“这样那样”。Rambler 要做的不是逐字转写,而是把自然语言,整理成可发送的文字。
Ben 做了一段现场演示:
- “嘿,如果你要去商店,能不能帮我买点鳄梨、鸡蛋、面包、香蕉和草莓?啊不,不要香蕉了。谢谢。”
- Rambler 会识别出用户改了主意,自动把“香蕉”从清单里去掉,再把杂乱的口语整理成一条清晰的消息。Ben 说话的同时,Rambler 把这条消息改成列表、加 emoji、加感叹号,让它看起来更像Ben的语言习惯。即便是切换多种语言,它也能丝滑转写。
Google在采访中特别指出,Rambler 是内置于 Gboard的,能在任何输入场景使用。而它的语音转写是云端处理,但也只是“ephemerally”——临时性的,没有存储、没有记忆,处理完即返回到设备。
Google 对 UI 的重构,也在沿着代劳的方向走,Create My Widget 就是一个典型例子。用户可以用自然语言生成自定义小组件:健身餐备餐者可以要求每周推荐三个高蛋白食谱;骑行者可以创建只显示风速和降雨的天气组件;一位刚搬到美国的家长,也可以让 Gemini 持续跟进适合孩子的周末活动、演出信息、票价变化,这个小组件不是给所有人准备的,而是为他的家庭场景生成的。
Google 把这称为“生成式 UI 的第一步”。过去 UI 是预设的:产品经理定义功能,设计师定义布局,用户只能选择。生成式 UI 的逻辑是:界面也可以根据用户的意图临时生成,Android 的桌面也可能变成一个持续更新、为个人任务服务的入口。
整个 Gemini Intelligence 的视觉语言也被重做。在 Material 3 Expressive 的基础上,新增了一套“思考态”动画——当 Gemini 在听、在想、在工作时,屏幕会有特定的光线变化。Ben 强调这套动画的意图是“引导注意力,但不分散注意力”。
至于代劳背后的数据隐私问题,Gemini Intelligence 是只在端侧工作,还是数据会上云?Ben 在采访中借这个问题阐述了一遍Google的产品思路:Gemini Intelligence 是设备端能力和云端能力的组合,设备端依赖 Private Compute Core 这种“已公开、可验证”的隐私技术;云端则使用 Private AI Compute,提供类似的隐私行为。这是一种刻意的克制——代劳越多,越要把数据隐私问题解释清楚。
据悉,Gemini Intelligence 的首发设备是今年夏天的 Samsung Galaxy 和 Google Pixel。其它能力会在年内陆续到位,最终延伸到手表、汽车、眼镜和笔记本。
【02】「代劳」的另一面:创作者的表达、平衡与连接
如果说前一部分的“代劳”,是系统替人处理那些繁琐的操作链路,那么 Android 17 接下来讲的是,代劳不该只指向效率。
一个真正的智能系统,不只是帮你点得更快、填得更准、跑得更自动;它也要让你更容易表达,更有意识地停下来,更少被设备和系统边界绊住。
所以 Android 17 的平台更新,被接过话筒的Android 平台产品经理 Ruchi Desai 拆成了三个很关键的方向:表达自我(expression)、找到平衡(balance)、保持连接(stay connected)。我们逐个来看。
首先,是面向短视频和社媒创作者的表达方面。Google 与 Meta 合作,把 Instagram 在部分 Android 设备上的体验进一步优化,包括 Ultra HDR 捕捉与回放、内置视频防抖、夜景模式,以及从拍摄到上传链路的优化。Ruchi 提到,基于 Universal Video Quality 模型的测试显示,Android 旗舰机拍摄并上传到 Instagram 的视频质量已经达到或更优于竞品。
这显然不是一个普通 App 适配问题。曾经,用户或许有过这样的困惑:同样的相机硬件,拍完传到社交平台上,不同手机的质量却不一样,尤其是视频。原因不只是手机厂商相机算法,而是拍摄、编码、压缩、上传、平台处理整条链路都要打通。
其次更进一步的是,创作工具的内嵌。
Screen Reactions让用户可以同时录制屏幕和自己,把自己的反应直接叠在热门视频、评论区或礼物清单前面,不需要绿幕、不需要复杂剪辑、也不用在多个 App 之间跳来跳去。
Instagram 的 Edits App 里被注入了 Android 的端侧 AI:Smart Enhance 可以一键把模糊老照片放大变清晰;Sound Separation 可以分析音频,把风声、噪音、音乐等声音分成不同轨道,让用户保留想要的声音,去掉不想要的干扰。这类功能的方向非常明确:把原来专业剪辑软件里才有的能力,压到移动端、设备端、社媒创作者的日常工作流里,是典型的“把创作者工作流系统化”。
Google 还宣布,Adobe Premiere 将在今年夏天登陆 Android,自带专门为 YouTube Shorts 设计的专属模板;Instagram 也将针对 Android 平板优化,利用更大的屏幕空间。
还有一个很小但很有意思的更新——新的 3D emoji。近 4000 个 emoji 都经过手工优化,纳入新的 Noto 3D 表情体系,年内先在 Pixel 手机上铺开,覆盖键盘、YouTube、Gmail 等产品。Richie 说自己在日本休假时,把这些emoji用在自动回复里,说那些图标真的像旅行本身一样鲜活。
这听起来像小更新,但放在 Android 17 的“表达自己”逻辑里是成立的:创作不只是拍大片,也包括每天发消息、发状态、用 emoji 表达微妙情绪,这些Google也考虑到了。
在找到平衡层面,Android 17 最有意思的设计,竟然是想让创作者更理智的玩手机。Bohn重新接过话茬,花了一段时间讲「数字健康助手」(digital wellbeing)。
其中最关键的更新是「Pause Point」,这是一个内置的暂停功能:用户可以把某个 App 标记为“分心应用”,每次点开它,系统会先弹出一个 10 秒的视图,用户可以在这 10 秒里做一次呼吸练习,翻几张更想看的照片,或者当场直接设一个定时器(比如“我就玩半小时”)。
Bohn解释说,它和App Timer 之类的工具不一样。App Timer 是事先给自己设限,但用的时候经常被忽略,完全锁定又不切实际。Pause Point 想做的,更像是在你点击 App 的瞬间按下“暂停键”,给你一次重新做决定的机会:你确定要点击吗?你是有意识地玩半小时,还是又要无意识刷一个小时?
Bohn强调,这个功能的目标不是禁止使用 App,而是帮助用户在下一次选择时更有意图,后续还会有更多类似的数字健康助手。比如屏幕使用时间、专注模式、睡眠模式、家长控制等功能的工具。
在连接层面,Android 17打破了跨系统的麻烦。Android系统的 Quick Share 将兼容iOS系统的AirDrop(隔空投送),该功能将首发 Pixel 手机,并在今年扩展到三星、OPPO、一加、vivo、小米、荣耀等更多设备。如果没有兼容硬件的设备,用户也可以用 Quick Share 生成二维码,通过云端与 iOS 设备分享文件。未来 Quick Share 还会嵌入 WhatsApp 等常用应用。
更具突破性的是从 iPhone 切换到 Android 的换机体验。Google明确表态——他们和苹果合作,重做了 iOS 到 Android 的迁移流程,密码、照片、消息、收藏的 App、联系人、甚至主屏布局,都可以无缝迁移;eSIM 也在迁移范围内。这个能力将首发于 Samsung Galaxy 和 Google Pixel。
这部分没有 Gemini 那么性感,但对 Android 生态非常重要,用户不一定因为一个 AI 功能换手机,但很可能因为“换机太麻烦”不换系统。Google 要让 Android 更像一个整体,就必须减少这些老问题:传文件、换设备、跨系统迁移、保留主屏习惯。
【03】「代劳」的延伸:当方向盘和键盘也开始替你工作
如果Android的智能只活在手机里,那它仍然是一个 App 的延伸,要让它成为真正的“智能系统”,它必须打破设备的边界。这次更新,还涉及到了手机之外的两块屏幕——汽车和PC。
Android 汽车业务高级总监Guemmy Kim 提到,Android Auto 的兼容车辆已经超过 2.5 亿台,搭载 Google built-in 的车型来自 16 家车厂、超过 100 款车型。
新一代 Android Auto 的体验做了三件事:它的界面可以适配任何形状的车机屏幕,长方形、圆形、异型屏都能呈现;把手机端的 Material 3 Expressive 设计语言延伸到车机,让仪表盘的字体、壁纸、动画都能和手机一致,看起来更像用户自己的设备;车机上也会加入小组件,比如常用联系人、一键开车库门、天气概览等,并且在导航时也能快速查看。
更具亮点的更新是 Immersive Navigation,Google甚至讲,这是 Google Maps 十多年来最大的更新之一。地图变成了一个真实感很强的 3D 视图,建筑物、立交桥、地形都被还原;车道、红绿灯、停车标识被高亮显示,让司机一目了然;换道、并线、复杂路口转弯,不再依赖语言描述,而是依靠空间感知。
车机也将变成一个娱乐中心。Android Auto 第一次支持用户在停车或充电时观看60fps 全高清视频,而进入驾驶状态后,视频不会粗暴中断,会切换成纯音频继续播放。
首发视频平台是 YouTube,首发汽车品牌包括11款车——BMW、Ford、Genesis、Hyundai、Kia、Mahindra、Mercedes-Benz、Renault、Škoda、Tata、Volvo。YouTube Music 和 Spotify 的界面专门为车机重做了视觉。
代劳在车上有更具体的表情。Guemmy 用了一个场景:你要和朋友去爬山,朋友发消息问集合地点,Magic Cue 会理解上下文,从短信、邮件或日历中找到地址,主动建议一键回复。爬完山开车回家路上,你让 Gemini 用外卖软件给两个人订一份常吃的餐,当你开到家时,餐也就到了。这是 Gemini Intelligence 在车上的延伸。
而搭载 Google built-in 的车,因为深度集成了车辆硬件,代劳能力更上一层。Gemini 可以回答专属于你这辆车的问题,比如仪表盘上那个奇怪的指示灯是什么意思?你刚买的电视能不能塞进后备箱?Google Maps 的 Immersive Navigation 在这些车上还会获得更精准的提示,比如调用车辆前置摄像头分析路况,实时告诉你在哪条车道、什么时候该并线,这部分功能完全在车机端侧运行。Google built-in 目前覆盖 16 个品牌、100 多款车型。
这里的分层很清晰:Android Auto 是把手机体验带进车里;Google built-in 则让汽车本身成为一个 Google 智能设备。手机上的 Gemini 可以理解消息和日历,车里的 Gemini 还要理解驾驶状态、车道、后备厢、仪表盘、停车和充电场景。
说到PC,整场发布最有战略意味的产品,是 Googlebook。
Google 笔记本与平板业务高级总监 Alexander Kuscher 先回顾了 Chromebook:15 年前,Google 用 Chromebook 重新定义了 cloud-first 笔记本。而现在,随着 Android 从操作系统转向智能系统,Google 认为笔记本也到了重新发明的时候。于是它把 Android 技术栈、Google Play 应用、Chrome 浏览器和扩展生态组合起来,Gemini Intelligence作为系统底座,做成一个新的笔记本品类:Googlebook。
这里有两个关键信息。
第一,Googlebook 不是简单的 Chromebook 改名,它的定位是“为 Gemini Intelligence 从底层设计的笔记本”。
第二,Googlebook 不只是跑 Android App,而是要把手机、文件、光标、桌面小组件这些交互入口重新组织一遍。
最有代表性的功能之一是 Magic Pointer。
Google 的切入点很极客:鼠标指针是笔记本上最常用的工具之一,但这么多年来最大创新可能还是右键,人们每天平均移动鼠标光标大约一公里,但它本身能做的事情并不多。Google 的想法是,既然 Gemini 可以理解上下文,那鼠标就不该只是一个选择工具,而应该变成智能入口。
Magic Pointer 的使用方式是:用户抖动光标,光标周围会浮现 Gemini 给你的上下文建议,比如指着邮件里的一个日期,可以一键创建会议;比如选中两张图,一张是你的客厅照片,一张是新沙发产品图,系统会建议你“放在一起看看搭不搭”,然后直接进入 Gemini 帮你完成可视化。
Alexander 在现场还列举了一个更有趣的例子:假设他要组一个朋克乐队(“虽然我不会唱”),他有一张乐队照片和一张乐队 logo,用 Magic Pointer,他抖一下光标,光标识别出两张图片,给出选项“把它们组合可视化”,直接送进 Gemini 输出海报。这在传统流程里,你要下载图片、找上传按钮、写提示词给大模型解释你要什么;Magic Pointer 把这一整套流程压成几次点击。
Create My Widget 也被带到了 Googlebook,但在PC上,小组件可以利用更多桌面信息,比如旅行数据、会议、预订等。如果你在筹备一次柏林的家庭聚会,Gemini 可以把所有航班、酒店、餐厅预订和倒计时聚合成一个桌面dashboard(仪表盘)。
跨设备协同被做得很彻底,Googlebook 支持直接在PC上使用手机 App。比如你正在PC上工作,突然想点外卖,或者收到学英语单词打卡提醒,不用把手机拿出来,也不用在PC上又下载一堆软件,直接在PC上操作即可。
文件浏览器也被重做。Quick Access 可以让用户在 Googlebook 文件浏览器里直接查看、搜索、插入手机文件,不需要 Quick Share,不需要把文件发邮件给自己,也不用到处翻设备。
硬件上,Google 将与 Acer、ASUS、Dell、HP、Lenovo 等伙伴合作推出首批 Googlebook,不同产品会有不同形态和尺寸,但都会带一个共同标识——glowbar,一个发光的物理标识。
以上,就是这次Android 17的所有更新。不难看出,当 AI 下沉到 OS 本身,App 就不再是用户体验的入口,而更像是被系统调用的能力模块,一切都是为更智能的体验铺垫。
所以,Android 17 表面上是在更新功能,实际上是在重写一个问题:当设备越来越懂你之后,所谓的“操作系统”,还需要被你一步步操作吗?