678CHAT AI资讯 谷歌新推Gemini功能,能看懂网页内容了

谷歌新推Gemini功能,能看懂网页内容了

在影视科技与人工智能交汇的浪潮中,谷歌再次投下了一枚重磅技术“炸弹”。近日,其旗下Gemini平台正式发布了名为“URL Context”的全新API功能,旨在彻底革新AI对网络内容的理解与处理方式。该功能已于5月28日在Google AI Studio平台上线,迅速在开发者社区引发热议,被视为AI信息处理领域的一次范式跃迁。

谷歌新推Gemini功能,能看懂网页内容了插图

不同于我们日常在聊天机器人中简单粘贴链接的操作,URL Context并非面向普通用户的便捷功能,而是一套专为开发者打造的深度集成工具。传统AI在处理链接时,往往依赖浏览器插件或搜索引擎接口,仅能抓取网页的标题、摘要或公开元数据,信息获取极为有限。而Gemini的这一新功能,则能像人类阅读者一样,深入解析网页的完整结构与语义内容,甚至可穿透PDF文档中的复杂表格、图表与脚注,实现真正意义上的“全息理解”。

据悉,该API支持高达34MB的内容处理能力,兼容HTML、JSON、CSV等多种主流数据格式,堪称开发者手中的“信息提取利器”。谷歌产品负责人Logan Kilpatrick在介绍中强调,URL Context极大简化了原本繁琐的开发流程。以往,开发者需借助“检索-增强生成”(RAG)架构,经过内容抓取、向量化、存储、检索等多个环节才能让AI“读懂”网页。如今,仅需几行代码,Gemini便能直接从URL中提取关键信息,省去了中间的复杂架构,效率提升显著。

谷歌新推Gemini功能,能看懂网页内容了插图1

其实际应用场景令人振奋。例如,开发者只需输入一份上市公司发布的PDF财报链接,Gemini便能精准识别并提取“流动比率”“净利润增长率”等核心财务指标,即便这些数据深藏于多页文档的表格角落。在学术研究领域,它也能快速解析论文中的实验数据与参考文献结构,为自动化文献综述提供强大支持。这种“即插即用”的智能处理能力,无疑将加速AI在金融、科研、媒体等领域的深度渗透。

当然,技术并非万能。URL Context目前无法绕过付费墙或登录验证机制,对于YouTube视频、Google Docs等专有平台内容也无权访问。此外,其计费模式基于Token消耗,意味着处理大容量或高复杂度内容时成本可能迅速攀升。因此,开发者需精心设计调用策略,平衡效率与成本。

尽管存在局限,URL Context的推出仍标志着AI从“信息搬运工”向“深度理解者”的关键转变。它不仅预示着传统RAG架构的逐渐式微,更让我们窥见未来智能系统如何无缝融入海量网络信息流,成为真正的“数字大脑”。

文章地址:https://towardsdatascience.com/googles-url-context-grounding-another-nail-in-rags-coffin/

本文来自网络,不代表678CHAT立场,转载请注明出处:https://www.678chat.com/ai/19651.html

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

返回顶部