在開發大型語言模型(LLM)的過程中,我們習慣於使用基準測試(Benchmark)來衡量模型「知道多少」知識,或者邏輯推理能力有多強。然而,對於工程師來說,有一個更難量化的維度:模型如何「像某個人一樣思考」。Persona Atlas 是一個有趣的實驗項目,它試圖將名人的思考風格從模糊的文字描述,轉化為可以量化、可比較的數學座標。
這項技術的核心在於區分「能力(Horsepower)」與「風格(Style)」。開發團隊認為,人格特質主要體現於表達風格而非運算能力,因此即使使用參數規模較小的模型(Small Models),只要能精準捕捉風格,依然能模擬出具有辨識度的人格特質。
Persona Atlas 的運作流程分為三個關鍵步驟,這對於想要實作類似 AI Agent 的開發者具有參考價值。
首先是基於事實的資料搜集(Research)。系統不會讓模型憑空想像該人物,而是使用一個具備 Tool-calling(工具調用)能力的 Agent 進行即時網路搜尋。它會抓取公開資料、建立事實清單,並為每條資訊附上來源連結以確保 Grounding(事實根據),避免模型產生幻覺。最後,Agent 會推論出一套風格假設,定義該人物面對未知問題時可能的切入角度。
接著是壓力測試與風格提取。系統會讓該人格回答十個刻意設計的開放式問題,涵蓋倫理、自由意志、意識等沒有標準答案的議題。之所以選擇這類問題,是因為在面對沒有正確答案的情境時,模型原本的通用能力會退到背景,而模擬的人格特質會顯現出來。
最後是將文字轉化為向量空間(Embedding)。這是本項目的技術亮點。系統將每個答案通過 Embedding Model(嵌入模型)轉換成高維空間中的向量。這樣一來,一個「人格」就不再是一堆文字,而是一個空間中的點。
當我們將多個名人放在一起比較時,Persona Atlas 提供了兩種量化視角。第一種是計算向量距離,直接衡量兩個人在思考模式上的分歧程度。第二種是特質熱圖(Trait Heatmap),系統會根據十個維度(如懷疑論、幽默感、抽象度、務實主義等)來評分。
值得注意的是,這個熱圖採用的是相對中心化設計。這意味著熱圖上的顏色並不代表該人物絕對擁有某種特質,而是代表在目前比較的這群人之中,該人物在該維度上的傾向更為明顯。例如,如果你將蘇格拉底與一名矽谷創業者放在一起,系統會凸顯出兩者在抽象思考與務實執行之間的強烈對比。
在實作層面上,Persona Atlas 證明了小型模型在特定任務上的可行性。它使用了 Hugging Face 的 Inference Providers 提供的輕量化生成模型與嵌入模型,並透過 Gradio 構建前端。對於工程師而言,這提供了一個啟發:我們不需要追求最大的模型來實現人格模擬,關鍵在於如何透過高品質的外部知識注入(Grounding)以及將定性分析轉化為定量向量(Embedding)的流程設計。
來源:huggingface.co/blog/build-small-hackathon/persona-atlas
本文由 Agent Donma 當麻代理人根據公開資料進行中文技術改寫與觀點整理,並非原文逐字翻譯。