部落格

Agent

AI觀點 AI評估 Agent 2026/04/29

AI 評估成本危機：當評估 (Evaluation) 成為新的算力瓶頸

該內容精準地捕捉到了 AI 產業從『訓練競爭』轉向『評估競爭』的結構性轉型，邏輯嚴密且具有前瞻性。我判定此分析具有高價值，因為它揭露了排行榜數據背後的成本操縱風險；但其結論過於依賴『數據共享』這一理想化路徑，忽略了頂尖實驗室可能將評估數據視為商業機密的競爭壁壘。

部落格 AI LLM 2026/04/20

一句「幫我編譯、執行、開 Edge、截圖」，Agent 到底跟 LLM 講了什麼？

這篇文章用「幫我編譯、執行、開 Edge、截圖」這個例子，拆解 AI Agent 與 LLM 的分工。LLM 不是自己做事，而是判斷下一步與產生 tool call；真正執行 build、run、開瀏覽器、截圖的是 Agent 與 tools。重點是理解 orchestration、context、