首页
bob官方网站登录介绍
产品展示
新闻动态
bob官方网站登录

新闻动态

你的位置:bob官方网站登录 > 新闻动态 > Chrome 推出 Skills 新功能, Agent 重塑上网方式

Chrome 推出 Skills 新功能, Agent 重塑上网方式

发布日期:2026-04-30 10:10    点击次数:124

浏览器正经历从"展示窗口"到"AI代理"的范式转变——GoogleChrome推出Skills功能让用户保存复用AI提示词,OpenAIAtlas以"BrowserMemories"实现跨会话上下文延续,微软Edge将Copilot升级为"AutoBrowse"自主操作网页。三条路线殊途同归:Chrome赌用户惯性(渐进叠加AI能力),Atlas赌迁移意愿(AI原生浏览器接管80%日常运营),PerplexityComet赌场景切入(多模型协作做深度研究)。

2026年4月14日,Google给Chrome浏览器加了一个Skills的新功能——用户可以把常用的AI提示词存下来,下次在任何网页上一键复用。同一周,OpenAI的AI原生浏览器Atlas在macOS上开放使用,微软也正在把Edge里的Copilot,从能聊天的AI继续往能代做网页任务的AI推进,原来的“ActionsinEdgePreview”被改成了“AutoBrowse”。

这一连串动作背后指向的是同一件事:浏览器正在经历一次范式转变。过去二十多年里,浏览器的基本工作模式基本没怎么变——用户输入网址或关键词,浏览器展示网页内容,剩下的靠用户自行阅读、点击、填写。

无论是从Netscape到Chrome的霸主更替,还是从桌面端到移动端的平台迁移,浏览器的角色始终是一个展示窗口。但现在,科技巨头和新兴公司正在竞相回答一个全新的问题:浏览器的下一步,是继续帮用户看网页,还是直接替用户操作网页?

ChromeSkills背后的战略布局

乍一看,ChromeSkills并不复杂。你在Chrome里跟GeminiAI聊天时,觉得某个提示词好用,就能直接从聊天记录里把它存成一个“Skill”。之后只要输入/斜杠命令或者点+按钮就能调出来,它会在你当前看的网页上运行,也能同时跨多个标签页工作。

Google还配套上线了一个Skills预设库,覆盖了生产力、购物、食谱、预算管理这些常见场景,你可以直接拿来用,也可以改提示词让它更贴合自己的需求。用户访问chrome://skills/browse就能浏览所有可用的Skills。

但这个功能的战略意义,远不止表面看到的那么简单。

先看时机。Chrome推Skills的背景,是一堆新对手正在涌入浏览器赛道。TechCrunch指出,Gemini在Chrome里的深度集成,就是在OpenAI、Perplexity、TheBrowserCompany等公司扎堆推AI原生浏览器的压力下加速的。Chrome的全球市占率虽然还是第一,但它的优势从来没像现在这样,被AI赛道的新物种从根基上动摇过。

再看路径选择。Google没有另起炉灶搞一个全新的AI浏览器,相反,它在Chrome的庞大用户盘子上一层层叠AI能力。2025年底嵌入Gemini侧边栏,2026年初上线AutoBrowse,4月又推出Skills——每一步都很克制,降低用户的学习成本的同时,一点点扩大AI在浏览过程中的参与度。

值得一提的是Skills在安全上的考量。跟其他Gemini功能一样,Skills在执行敏感操作,比如发邮件、加日历之前,都会先弹窗找你确认。这个设计说明Google心里很清楚,Skills不只是一个辅助工具,它其实在为更深层的Agent操作铺路——只不过眼下选了一条更稳、更可控的渐进路线。

Google在早期测试中发现,用户最常创建的Skills集中在三个方向:健康营养(快速算食谱里的蛋白质含量)、购物比价(跨标签页生成规格对照表)、文档处理(扫描长文提取关键信息)。这三类场景正好对应了普通人上网最高频的需求,也间接验证了可复用AI工作流这件事确实有真实的用户需求在支撑。

三条路线的不同赌注

如果说ChromeSkills代表了”在老地基上盖新楼”的思路,OpenAI和Perplexity则分别代表了另外两种截然不同的战略选择。

Atlas:另起炉灶,AI就是浏览器本身

OpenAI的Atlas已经在macOS上可以用了,它把ChatGPT直接做进了浏览器的底层。根据CNET的评测,Atlas最大的差异化功能叫“BrowserMemories”——AI能记住你在不同网页上的浏览上下文和任务进度,下次打开还能接着来。

更核心的是它的“AgentMode”。开启这个模式后,AI可以在你的监控下自主完成一系列网页操作:扫内容找灵感、起草文案、把产出整理成文档、审计落地页、清理收件箱、采购前自动对比不同工具,甚至根据你的历史操作重建整套工作流。

此外,Atlas瞄准的痛点很明确——上下文切换。传统方式下,用户得在搜索引擎、AI对话窗口、文档编辑器、邮件客户端之间来回跳,每跳一次上下文就断一次,信息要手动搬来搬去。这个问题对独立创业者和小团队尤其致命:一个人同时要管策略、做内容、跑运营、回客户,任务之间频繁切换成为了巨大的效率黑洞。

Atlas想做的事很简单——把研究、写作、编辑、任务管理全揉进一个连续的AI浏览环境里,从根上消灭上下文断裂。根据其早期用户反馈显示,Atlas可以接管一个独立创业者大约80%的日常运营工作。

Comet:从”搜索”到”研究”的跃迁

Perplexity的Comet走的是第三条路,专注于帮使用者理解互联网上的信息。如果说Atlas的核心价值是操作自动化,那么Comet的就是知识提取。

Comet的典型使用场景是替代那些需要打开二十个标签页、逐一阅读比对的研究工作。用户给出一个研究问题,Comet自主打开多个页面、分析内容、综合结果,直接输出研究报告。

Perplexity在前几个月还推出了名为Computer的多模型协调引擎。Computer能把复杂任务拆成多个子任务,再分给最合适的AI模型去做——Anthropic的Claude负责核心推理,Gemini跑深度研究,Grok接轻量快速任务,ChatGPT处理长上下文记忆。

这套架构的底层逻辑和企业里的分工其实是一样的。让最擅长推理的做推理,最擅长视觉的做图像理解,最快的做轻量任务。没有一个通才模型能在所有维度上都做到最好,但一组专精模型协同起来,整体表现就能大幅提升。这意味着AI浏览器已经开始往AI任务操作系统的方向长了。

把三条路线放在一起看,可以发现,Google赌的是惯性——你已经在用Chrome了,加点AI不用你换地方,Gmail、日历、地图全打通,走得稳但转身也慢。OpenAI赌的是迁移意愿——如果AI体验足够好,用户愿意为此换一个全新浏览器,哪怕扩展、书签、密码管理都要重头来过。Perplexity赌的是场景切入——不跟前两家争”通用浏览器”这口饭,先把研究场景吃透,用多模型协作和信息综合做出差异化,再看能长多大。

三种赌法各有各的风险。ChromeSkills被自家产品框架卡住了天花板,Atlas面临真金白银的迁移门槛,Comet则要应对Amazon已经打上门来的版权诉讼。但有一点是共通的:它们都在试图把浏览器从一个被动的展示工具,变成一个主动替用户干活的系统。差别只在于这个”干活”到底由谁发起、走多深、边界画在哪。

浏览器正在发生的三重变化

将视野从个别产品拉远,可以看到整个浏览器行业正在经历三个层面的结构性变化。

1)从”找信息”到”办事”

2026年之前,浏览器的核心角色是信息获取入口——你主动搜、主动看,所有动作都由人来驱动。AI代理浏览器正在把这个关系翻过来:你只要说清楚想要什么结果,AI自己规划路径、操作网页、完成任务。以前的说法是”帮我打开浏览器查一下”,现在变成了”告诉AI你要什么”。

这个演进可以被归纳成四个阶段:2000年代手动浏览、2010年代搜索加App、2020年代AI问答助手、2026年开始AI自主执行。浏览器从”人操作的工具”变成了”为人干活的代理”。换句话说,浏览器的价值衡量标准已经从”能展示多少信息”变成了”能替你办多少事”。

2)从标准化工具到个性化系统

ChromeSkills就是这一趋势的缩影。当你攒起了一套自己的Skills库,你的Chrome和别人的Chrome已经不是同一个东西了。你的可能擅长食谱转换和营养计算,我的可能专精技术文档摘要和竞品分析——同一个浏览器壳子,跑着完全不同的个性化工作流。

MicrosoftEdge也在走类似的路:AutoBrowse给了Light、Balanced、Strict三档安全级别,让用户自己决定AI能操作到什么程度。而Edge正在测试的浮动Copilot工具栏更进一步,把AI嵌进了右键菜单——选中文字或图片后右键一点,就能直接摘要、解释、改写。

3)浏览器成为AI分发的主战场

过去两年,AI主要靠独立App、API接口和开发者工具来触达用户。但2026年的趋势很明显:浏览器正在成为AI能力到达终端用户的最短路径。原因不复杂——浏览器是几乎所有人每天都会打开的软件,把AI直接塞进去,比让用户下载一个新App或学一套API的触达效率高得多。

Google靠Chrome、Microsoft靠Edge、OpenAI靠Atlas,各自把自家AI模型的能力直接送到数十亿用户面前。一位LinkedIn上的行业观察者估算,2026年全球LLM用户市场份额中,ChatGPT占约60%,Gemini占约15%,Copilot占约13%——而浏览器作为这些AI能力的直接载体,正变成决定谁拿到多少份额的关键战场。谁的浏览器装机量大、谁的AI嵌入得深,谁就能占住用户日常使用AI的第一入口。

AI浏览器还远未成熟

愿景很理想,但2026年的AI浏览器赛道还有一堆硬骨头没啃下来。

可靠性还是最大的坎。根据Medium上一篇综合评测的实测结论,即使是表现最好的AI浏览器,跑复杂多步骤任务时的失败率还在10%到40%之间。对于金融操作、医疗信息查询这类容不得出错的场景,这个可靠性离”能用”还差得远。

安全风险很现实。代理型浏览器要读网页内容、还要替你操作,这天然带来了提示注入的攻击面——恶意网页可以在页面里埋特定文本来诱导AI做出错误操作。Edge的AutoBrowse为此设计了三级安全模式,不同级别下AI需要拿到不同程度的用户授权才能跟网站交互;Atlas的AgentMode也走的是”先请示、后动手”的路子。但安全研究圈对这些防护到底够不够硬,态度普遍还是保守的。

费用和信任是两道并行的门槛。大多数高级AI浏览器功能都需要付费订阅,价格从每月20美元到200美元不等,底层API调用还要额外花钱。但比费用更难跨过的是信任——”你愿意让一个AI登录你的银行账户自己转账吗?”绝大多数人的回答还是不愿意。

覆盖面也是个问题。ChromeSkills初期只支持桌面端,而且浏览器语言得设成英语才能用。Atlas目前也只有macOS版,Windows和移动端的时间表还不确定。也就是说,在相当长一段时间内,这些最前沿的AI浏览器功能只能覆盖一小部分用户,大多数人还停在传统浏览体验里。技术前沿和用户现实之间的差距,可能比产品发布节奏还要更慢地弥合。

尽管问题不少,赛道的方向已经不可逆了。当Google、OpenAI、Microsoft、Perplexity在同一个季度密集发布AI浏览器功能时,真正被改写的是人和互联网之间维持了二十多年的交互契约。而这场改写,才刚刚开始。