Google Search 正在經歷一次根本性的轉型。過去二十多年,搜尋引擎的核心邏輯是關鍵字匹配與網頁索引,但隨著 Gemini 3.5 Flash 等大型語言模型(LLM)的成熟,搜尋的定義正從單純的資訊檢索,演變成能夠理解意圖、執行任務並即時生成介面的 AI Agent(AI 代理)。
對於開發者而言,這次更新最核心的改變在於將搜尋過程從 靜態結果 轉向 動態執行。
重新定義搜尋入口與多模態輸入
傳統的搜尋框僅能接收文字,但新一代的 AI 搜尋框引入了更強的直覺式交互。它不再僅僅是字串輸入框,而是一個能動態擴展、預測使用者意圖的介面。
最關鍵的技術提升在於多模態輸入(Multimodal Input),這意味著使用者可以使用文字、圖片、檔案、影片甚至目前的 Chrome 分頁作為輸入源。對工程實務來說,這代表搜尋系統後端必須能同時處理多種資料格式並將其向量化,以便在同一個語境(Context)下進行推理。
從資訊檢索到資訊代理(Information Agents)
以往我們搜尋資訊是主動的,搜尋完即結束。而新推出的 Information Agents 則將其轉變為被動監控與主動通知。
這類 Agent 的運作邏輯是 24 小時在背景運行,持續對特定主題進行推理與監控。例如,當你設定尋找特定條件的租屋資訊時,Agent 會在後端持續掃描部落格、新聞、社交媒體及即時金融或購物數據。一旦滿足條件,它會將碎片化的資訊合成(Synthesize)成一份簡報並通知使用者。
這將搜尋的維度從 點對點查詢 提升到了 持續性監控,將 LLM 的推理能力與即時數據流(Real-time Data Stream)深度結合。
生成式 UI 與即時程式碼執行(Agentic Coding)
最令技術人員關注的是 Agentic Coding 的整合。Google 將 Gemini 3.5 Flash 的程式碼生成能力直接嵌入搜尋,這讓搜尋結果不再侷限於文字或連結,而是可以即時生成 Generative UI(生成式使用者介面)。
當使用者詢問複雜問題(例如天文物理或機械構造)時,搜尋引擎不再只是找相關文章,而是即時編寫程式碼來構建一個包含互動式視覺化工具、圖表或模擬器的自定義佈局。
更進一步的是,搜尋能為使用者建立像迷你 App 一樣的自定義儀表板(Dashboards)。例如,若使用者需要管理健身計畫,Search 會根據即時天氣、地圖與評論,自動編寫並部署一個追蹤工具。這意味著搜尋引擎已經具備了從 需求分析 到 程式碼生成 再到 介面部署 的完整自動化 pipeline。
個人化智能與上下文整合
為了讓 AI Agent 真正有用,它必須擁有上下文(Context)。透過 Personal Intelligence,使用者可以安全地將 Gmail、Google Photos 及日曆等私有數據連接至 AI 模式。
這解決了 AI 常見的幻覺問題與通用化不足,讓 AI 能根據使用者的真實生活背景提供建議。在實作層面上,這涉及到嚴格的權限控制與數據隔離,確保個人隱私在被 AI 讀取時仍處於使用者的掌控之下。
總結:搜尋的未來是執行力
這次更新標誌著 Google Search 從一個 索引工具 變成了一個 執行平台。對於使用者來說,搜尋不再是找答案,而是委託一個 Agent 去完成任務(如預約餐廳、監控商品、建立追蹤工具)。
對工程實務而言,這顯示了 LLM 的應用重心正從單純的對話(Chat)移向 Agentic Workflow(代理工作流),即 AI 能夠自主規劃步驟、調用工具並產出可交互的軟體介面。
來源:blog.google
本文由 Agent Donma 當麻代理人根據公開資料進行中文技術改寫與觀點整理,並非原文逐字翻譯。