Chrome 推出 Skills 新功能, Agent 重塑上网方式

发布日期：2026-04-30 10:10 点击次数：124

浏览器正经历从"展示窗口"到"AI代理"的范式转变——GoogleChrome推出Skills功能让用户保存复用AI提示词，OpenAIAtlas以"BrowserMemories"实现跨会话上下文延续，微软Edge将Copilot升级为"AutoBrowse"自主操作网页。三条路线殊途同归：Chrome赌用户惯性（渐进叠加AI能力），Atlas赌迁移意愿（AI原生浏览器接管80%日常运营），PerplexityComet赌场景切入（多模型协作做深度研究）。

2026年4月14日，Google给Chrome浏览器加了一个Skills的新功能——用户可以把常用的AI提示词存下来，下次在任何网页上一键复用。同一周，OpenAI的AI原生浏览器Atlas在macOS上开放使用，微软也正在把Edge里的Copilot，从能聊天的AI继续往能代做网页任务的AI推进，原来的“ActionsinEdgePreview”被改成了“AutoBrowse”。

这一连串动作背后指向的是同一件事：浏览器正在经历一次范式转变。过去二十多年里，浏览器的基本工作模式基本没怎么变——用户输入网址或关键词，浏览器展示网页内容，剩下的靠用户自行阅读、点击、填写。

无论是从Netscape到Chrome的霸主更替，还是从桌面端到移动端的平台迁移，浏览器的角色始终是一个展示窗口。但现在，科技巨头和新兴公司正在竞相回答一个全新的问题：浏览器的下一步，是继续帮用户看网页，还是直接替用户操作网页？

ChromeSkills背后的战略布局

乍一看，ChromeSkills并不复杂。你在Chrome里跟GeminiAI聊天时，觉得某个提示词好用，就能直接从聊天记录里把它存成一个“Skill”。之后只要输入/斜杠命令或者点+按钮就能调出来，它会在你当前看的网页上运行，也能同时跨多个标签页工作。

Google还配套上线了一个Skills预设库，覆盖了生产力、购物、食谱、预算管理这些常见场景，你可以直接拿来用，也可以改提示词让它更贴合自己的需求。用户访问chrome://skills/browse就能浏览所有可用的Skills。

但这个功能的战略意义，远不止表面看到的那么简单。

先看时机。Chrome推Skills的背景，是一堆新对手正在涌入浏览器赛道。TechCrunch指出，Gemini在Chrome里的深度集成，就是在OpenAI、Perplexity、TheBrowserCompany等公司扎堆推AI原生浏览器的压力下加速的。Chrome的全球市占率虽然还是第一，但它的优势从来没像现在这样，被AI赛道的新物种从根基上动摇过。

再看路径选择。Google没有另起炉灶搞一个全新的AI浏览器，相反，它在Chrome的庞大用户盘子上一层层叠AI能力。2025年底嵌入Gemini侧边栏，2026年初上线AutoBrowse，4月又推出Skills——每一步都很克制，降低用户的学习成本的同时，一点点扩大AI在浏览过程中的参与度。

值得一提的是Skills在安全上的考量。跟其他Gemini功能一样，Skills在执行敏感操作，比如发邮件、加日历之前，都会先弹窗找你确认。这个设计说明Google心里很清楚，Skills不只是一个辅助工具，它其实在为更深层的Agent操作铺路——只不过眼下选了一条更稳、更可控的渐进路线。

Google在早期测试中发现，用户最常创建的Skills集中在三个方向：健康营养（快速算食谱里的蛋白质含量）、购物比价（跨标签页生成规格对照表）、文档处理（扫描长文提取关键信息）。这三类场景正好对应了普通人上网最高频的需求，也间接验证了可复用AI工作流这件事确实有真实的用户需求在支撑。

三条路线的不同赌注

如果说ChromeSkills代表了”在老地基上盖新楼”的思路，OpenAI和Perplexity则分别代表了另外两种截然不同的战略选择。

Atlas：另起炉灶，AI就是浏览器本身

OpenAI的Atlas已经在macOS上可以用了，它把ChatGPT直接做进了浏览器的底层。根据CNET的评测，Atlas最大的差异化功能叫“BrowserMemories”——AI能记住你在不同网页上的浏览上下文和任务进度，下次打开还能接着来。

更核心的是它的“AgentMode”。开启这个模式后，AI可以在你的监控下自主完成一系列网页操作：扫内容找灵感、起草文案、把产出整理成文档、审计落地页、清理收件箱、采购前自动对比不同工具，甚至根据你的历史操作重建整套工作流。

此外，Atlas瞄准的痛点很明确——上下文切换。传统方式下，用户得在搜索引擎、AI对话窗口、文档编辑器、邮件客户端之间来回跳，每跳一次上下文就断一次，信息要手动搬来搬去。这个问题对独立创业者和小团队尤其致命：一个人同时要管策略、做内容、跑运营、回客户，任务之间频繁切换成为了巨大的效率黑洞。

Atlas想做的事很简单——把研究、写作、编辑、任务管理全揉进一个连续的AI浏览环境里，从根上消灭上下文断裂。根据其早期用户反馈显示，Atlas可以接管一个独立创业者大约80%的日常运营工作。

Comet：从”搜索”到”研究”的跃迁

Perplexity的Comet走的是第三条路，专注于帮使用者理解互联网上的信息。如果说Atlas的核心价值是操作自动化，那么Comet的就是知识提取。

Comet的典型使用场景是替代那些需要打开二十个标签页、逐一阅读比对的研究工作。用户给出一个研究问题，Comet自主打开多个页面、分析内容、综合结果，直接输出研究报告。

Perplexity在前几个月还推出了名为Computer的多模型协调引擎。Computer能把复杂任务拆成多个子任务，再分给最合适的AI模型去做——Anthropic的Claude负责核心推理，Gemini跑深度研究，Grok接轻量快速任务，ChatGPT处理长上下文记忆。

这套架构的底层逻辑和企业里的分工其实是一样的。让最擅长推理的做推理，最擅长视觉的做图像理解，最快的做轻量任务。没有一个通才模型能在所有维度上都做到最好，但一组专精模型协同起来，整体表现就能大幅提升。这意味着AI浏览器已经开始往AI任务操作系统的方向长了。

把三条路线放在一起看，可以发现，Google赌的是惯性——你已经在用Chrome了，加点AI不用你换地方，Gmail、日历、地图全打通，走得稳但转身也慢。OpenAI赌的是迁移意愿——如果AI体验足够好，用户愿意为此换一个全新浏览器，哪怕扩展、书签、密码管理都要重头来过。Perplexity赌的是场景切入——不跟前两家争”通用浏览器”这口饭，先把研究场景吃透，用多模型协作和信息综合做出差异化，再看能长多大。

三种赌法各有各的风险。ChromeSkills被自家产品框架卡住了天花板，Atlas面临真金白银的迁移门槛，Comet则要应对Amazon已经打上门来的版权诉讼。但有一点是共通的：它们都在试图把浏览器从一个被动的展示工具，变成一个主动替用户干活的系统。差别只在于这个”干活”到底由谁发起、走多深、边界画在哪。

浏览器正在发生的三重变化

将视野从个别产品拉远，可以看到整个浏览器行业正在经历三个层面的结构性变化。

1）从”找信息”到”办事”

2026年之前，浏览器的核心角色是信息获取入口——你主动搜、主动看，所有动作都由人来驱动。AI代理浏览器正在把这个关系翻过来：你只要说清楚想要什么结果，AI自己规划路径、操作网页、完成任务。以前的说法是”帮我打开浏览器查一下”，现在变成了”告诉AI你要什么”。

这个演进可以被归纳成四个阶段：2000年代手动浏览、2010年代搜索加App、2020年代AI问答助手、2026年开始AI自主执行。浏览器从”人操作的工具”变成了”为人干活的代理”。换句话说，浏览器的价值衡量标准已经从”能展示多少信息”变成了”能替你办多少事”。

2）从标准化工具到个性化系统

ChromeSkills就是这一趋势的缩影。当你攒起了一套自己的Skills库，你的Chrome和别人的Chrome已经不是同一个东西了。你的可能擅长食谱转换和营养计算，我的可能专精技术文档摘要和竞品分析——同一个浏览器壳子，跑着完全不同的个性化工作流。

MicrosoftEdge也在走类似的路：AutoBrowse给了Light、Balanced、Strict三档安全级别，让用户自己决定AI能操作到什么程度。而Edge正在测试的浮动Copilot工具栏更进一步，把AI嵌进了右键菜单——选中文字或图片后右键一点，就能直接摘要、解释、改写。

3）浏览器成为AI分发的主战场

过去两年，AI主要靠独立App、API接口和开发者工具来触达用户。但2026年的趋势很明显：浏览器正在成为AI能力到达终端用户的最短路径。原因不复杂——浏览器是几乎所有人每天都会打开的软件，把AI直接塞进去，比让用户下载一个新App或学一套API的触达效率高得多。

Google靠Chrome、Microsoft靠Edge、OpenAI靠Atlas，各自把自家AI模型的能力直接送到数十亿用户面前。一位LinkedIn上的行业观察者估算，2026年全球LLM用户市场份额中，ChatGPT占约60%，Gemini占约15%，Copilot占约13%——而浏览器作为这些AI能力的直接载体，正变成决定谁拿到多少份额的关键战场。谁的浏览器装机量大、谁的AI嵌入得深，谁就能占住用户日常使用AI的第一入口。

AI浏览器还远未成熟

愿景很理想，但2026年的AI浏览器赛道还有一堆硬骨头没啃下来。

可靠性还是最大的坎。根据Medium上一篇综合评测的实测结论，即使是表现最好的AI浏览器，跑复杂多步骤任务时的失败率还在10%到40%之间。对于金融操作、医疗信息查询这类容不得出错的场景，这个可靠性离”能用”还差得远。

安全风险很现实。代理型浏览器要读网页内容、还要替你操作，这天然带来了提示注入的攻击面——恶意网页可以在页面里埋特定文本来诱导AI做出错误操作。Edge的AutoBrowse为此设计了三级安全模式，不同级别下AI需要拿到不同程度的用户授权才能跟网站交互；Atlas的AgentMode也走的是”先请示、后动手”的路子。但安全研究圈对这些防护到底够不够硬，态度普遍还是保守的。

费用和信任是两道并行的门槛。大多数高级AI浏览器功能都需要付费订阅，价格从每月20美元到200美元不等，底层API调用还要额外花钱。但比费用更难跨过的是信任——”你愿意让一个AI登录你的银行账户自己转账吗？”绝大多数人的回答还是不愿意。

覆盖面也是个问题。ChromeSkills初期只支持桌面端，而且浏览器语言得设成英语才能用。Atlas目前也只有macOS版，Windows和移动端的时间表还不确定。也就是说，在相当长一段时间内，这些最前沿的AI浏览器功能只能覆盖一小部分用户，大多数人还停在传统浏览体验里。技术前沿和用户现实之间的差距，可能比产品发布节奏还要更慢地弥合。

尽管问题不少，赛道的方向已经不可逆了。当Google、OpenAI、Microsoft、Perplexity在同一个季度密集发布AI浏览器功能时，真正被改写的是人和互联网之间维持了二十多年的交互契约。而这场改写，才刚刚开始。

上一篇：2025首届地平线技术生态大会召开 10万级国民车将享城区智驾

下一篇：没有了

新闻动态

Chrome 推出 Skills 新功能, Agent 重塑上网方式