0

OpenHuman 是一款由開發(fā)者集體 TinyHumans AI 構(gòu)建的開源桌面 AI Agent。它的自我定位是「Personal AI Super Intelligence」,即一個私有、簡單、極其強(qiáng)大的個人智能體。
從品類上看,OpenHuman 既不是 IDE(不寫代碼),也不是聊天機(jī)器人(有工具調(diào)用和自動化能力),也不是筆記軟件(雖然它生成 Obsidian 兼容的知識庫)。
它試圖成為一個桌面級的個人 AI 操作系統(tǒng)入口,把記憶、集成、語音、編碼工具、本地知識庫塞進(jìn)同一個 Agent 框架里。
而在桌面級智能體助手迭出的今天,它的核心主張也可以用一句話概括:在用戶輸入第一個 prompt 之前,Agent 就已經(jīng)了解你。

從制作者自己在 Product Hunt 上的評論中可以看到,這個項目的初衷其實(shí)很樸素。創(chuàng)始人想給自己的老爸配置一個 AI Agent,但發(fā)現(xiàn)市面上的智能體配置都太復(fù)雜了,從裝終端、配 API Key,到寫 YAML,一般人根本玩不轉(zhuǎn)。于是他想做一個,真正能一鍵開箱即用的產(chǎn)品。

這個出發(fā)點(diǎn)是真誠的。但 AI 產(chǎn)品或者 vibe coding 這事,往往夢想很龐大, 落地都一地雞毛。我們上手之后很快就發(fā)現(xiàn),OpenHuman 的實(shí)際使用體驗和愿景,還有著不小的距離。
最明顯的問題是,「在第一個 prompt 之前就了解你」的主張,隱含著一個巨大的前提條件:
你必須主動、盡可能多地綁定第三方服務(wù)。

如果用戶不連接 Gmail、GitHub、YouTube 等賬號,這個 Agent 就會對你一無所知,它會退化成一個普通的聊天窗口,和免費(fèi)的 ChatGPT 沒有本質(zhì)區(qū)別。
所謂的“分鐘級了解”,完全建立在用戶綁定賬號的“分鐘級手速”之上。但誰會在接觸一款新產(chǎn)品的第一瞬間,就急頭白臉地交出幾乎所有權(quán)限?
這是 OpenHuman 給我們留下的第一印象,冒昧,而現(xiàn)實(shí)的骨感之處還有更多。

01
使用 OpenHuman 的過程中,一種很強(qiáng)烈的感受在于,這是一個商業(yè)化野心遠(yuǎn)超產(chǎn)品完成度的項目。
這種洞察甚至先于真正上手使用,因為我們發(fā)現(xiàn)主界面已經(jīng)高調(diào)加入了「獎勵」模塊。也就是說當(dāng)產(chǎn)品還在 Early Beta,功能還有大量粗糙邊角的時候,推薦獎勵系統(tǒng)就已經(jīng)就位了。這種對優(yōu)先級的選擇,本身就傳遞了很多信號。

此外如果用戶不訂閱 OpenHuman 的付費(fèi)計劃,而是配置自己的 API Key,那么得到的只會是一個聊天框。沒錯,連 tools 都無法使用。
免費(fèi)情況下所有工具調(diào)用能力被鎖死,Agent 的手和腳被沒收了,核心功能完全不可用。此時的OpenHuman 只剩一張嘴,這意味著「一鍵開箱即用」的愿景,必須靠充值才能實(shí)現(xiàn)。

公平地說 OpenHuman 確實(shí)提供了一定的免費(fèi)額度,但實(shí)測下來大概只支持三次簡單問答。甚至于用戶一句話都不說的情況下,如果 Agent 綁定了幾個第三方賬號,那么系統(tǒng)自動抓取數(shù)據(jù)消耗的 token,也足以把免費(fèi)額度吃光。用戶還沒來得及輸入第一個 prompt,Agent 就死在了沒額度上。


產(chǎn)品的夢想是「在輸入第一個 prompt 之前 Agent 就足夠了解你」,但現(xiàn)實(shí)是「在輸入第一個 prompt 之前 Agent 就已經(jīng)把你的免費(fèi)額度花完了」。
可以看出,OpenHuman 宣稱的低成本、無摩擦使用,完全建立在充值之上。
細(xì)想之下 OpenHuman 其實(shí)展現(xiàn)出了相當(dāng)魔幻的一面。
一方面,市場上已經(jīng)有不少能夠一鍵開箱即用的免費(fèi) Agent 產(chǎn)品,甚至于 ChatGPT 某種程度上也可以歸于此列。另一方面,OpenHuman 選擇了「付費(fèi)」作為用戶轉(zhuǎn)移學(xué)習(xí)成本的方式,但付費(fèi)本身就是巨大的用戶使用成本,它和「簡單」的目標(biāo)自相矛盾。
當(dāng)然,這也不能全怪 OpenHuman。AI 的推理成本確實(shí)昂貴,對于一個需要每 20 分鐘自動抓取數(shù)據(jù)、持續(xù)構(gòu)建記憶樹的系統(tǒng),token 消耗更是普通聊天的數(shù)倍。
這或許也反映了 AI 創(chuàng)業(yè)的一個殘酷現(xiàn)實(shí),如果沒有足夠充裕的啟動資金來補(bǔ)貼冷啟動期的用戶體驗,就會重現(xiàn) OpenHuman 這種尷尬的劇本,產(chǎn)品還沒讓用戶感受到價值,就已經(jīng)開始要錢了。

02
拋開體驗層面的粗糙,這款產(chǎn)品在工程架構(gòu)上確實(shí)有值得關(guān)注的設(shè)計。
OpenHuman 的核心架構(gòu)是一條三階段管道:
? 連接:OAuth 接入 118+ 服務(wù)
? 抓取:每 20 分鐘自動輪詢
? 記憶:轉(zhuǎn)換為 Markdown,構(gòu)建 Memory Tree
這種設(shè)計意圖很清晰,就是為了讓 Agent 能在后臺持續(xù)積累對用戶的了解,無需用戶主動投喂數(shù)據(jù)。當(dāng)一眾 Agent 產(chǎn)品都在宣稱自己“越用越懂用戶”,OpenHuman 把這個過程的開端,拉低到了只要能在用戶的設(shè)備上跑起來即可。
為了實(shí)現(xiàn)這一點(diǎn),OpenHuman 的技術(shù)棧選擇了 Tauri,即 Rust 后端加 WebView 前端。必須承認(rèn)開發(fā)團(tuán)隊確實(shí)非常細(xì)節(jié),相比 Electron,Tauri 更輕量、更安全、更省內(nèi)存,適合需要長期后臺運(yùn)行的 Agent 應(yīng)用。從這個選型就體現(xiàn)出了團(tuán)隊對產(chǎn)品形態(tài)的思考,當(dāng)它需要像一個系統(tǒng)服務(wù)一樣常駐后臺,Electron 的資源開銷在這個場景下就是不可接受的。
此外還有 Memory Tree,這是 OpenHuman 最有技術(shù)含量的部分。關(guān)注 Andrej Karpathy 的朋友或許有印象,他在今年 4 月提出了一個名為「LLM Wiki」的概念,也就是用 LLM 將原始數(shù)據(jù)編譯成結(jié)構(gòu)化的 Markdown 知識庫。
OpenHuman 把這個手動過程完全自動化了,多源數(shù)據(jù)抓進(jìn)來,經(jīng)過標(biāo)準(zhǔn)化、分塊(≤3k token)、評分,最終形成層級摘要樹,分別存入SQLite(供機(jī)器檢索)與obsidian Vault(方便人工查閱)。
這里面最關(guān)鍵的設(shè)計決策是可檢視性,用戶終于可以直接打開、閱讀、編輯 Agent 的知識庫。這和傳統(tǒng) RAG 的向量黑箱形成了鮮明對比,當(dāng)你能看到 AI 到底「記住」了什么,才能談溯源和糾正。

這類工具調(diào)用 Agent,有一個通病是反復(fù)召回導(dǎo)致的上下文爆炸。OpenHuman 也考慮到了這一點(diǎn),它的架構(gòu)中有一層名為 TokenJuice,這是一個用于 token 壓縮的中間層。原理并不復(fù)雜,HTML 轉(zhuǎn) Markdown、長 URL 縮短、噪聲清理、內(nèi)容去重,同時保留 CJK 和 emoji 等多字節(jié)文本,但官方聲稱,就是這一套流程下來,可以降低高達(dá) 80% 的 token 消耗。
比起實(shí)現(xiàn)路徑,這種工程思路顯然更珍貴。在 Agent 系統(tǒng)中,真正昂貴的是后臺抓取和工具調(diào)用產(chǎn)生的 token,在數(shù)據(jù)進(jìn)入模型前做清洗,一定比直接塞原始內(nèi)容更經(jīng)濟(jì)。
OpenHuman 另一處比較少見的設(shè)計,是提供了非常豐富的內(nèi)置智能路由。推理密集任務(wù)走前沿大模型,常規(guī)任務(wù)走便宜模型,圖像走視覺模型,支持 Ollama 本地推理,成本控制更加合理。


03
從 OpenClaw、Hermes 到 OpenHuman,短短半年間,已經(jīng)有三代 Agent 在 GitHub 上各領(lǐng)風(fēng)騷。有意思的是,你能看到三者之間在工程思路上存在著根本差異。

OpenClaw 特征最鮮明,它在試圖構(gòu)建的是一個 Agent 控制平面,在此基礎(chǔ)上才有了多 Agent 團(tuán)隊、跨通道路由和 Skill 市場,使用體驗很像是在管理一個公司的 Agent 組織。
Hermes 的關(guān)鍵詞則到了自進(jìn)化。外部環(huán)境、腳手架……這些描述背后的共性在于,它們都看到了 Hermes 服務(wù)于單 Agent 持續(xù)改進(jìn)的一面,這也是 Hermes 最核心的產(chǎn)品邏輯,即檢測重復(fù)模式,然后自動生成可復(fù)用技能,就像是訓(xùn)練一個越來越聰明的助手。
沿著這條脈絡(luò),就不難理解 OpenHuman 的宣言。在使用之前就開始了解用戶,也就是不需要等待用戶教,而是主動「認(rèn)識」用戶。這是一種「上下文即產(chǎn)品」的 Agent 哲學(xué),把用戶的個人數(shù)據(jù)積累變成結(jié)構(gòu)化記憶,此時的 Agent ,像是一個從 Day 1 就認(rèn)識了你的同事。
當(dāng)然,為此帶來的風(fēng)險也是結(jié)構(gòu)性的,OpenHuman 的價值主張和安全風(fēng)險本就一體兩面。
首當(dāng)其沖的是 OAuth Token 聚合。
同時持有郵件、代碼、日歷、支付的 OAuth Token,本地 SQLite 數(shù)據(jù)庫就會成為高價值攻擊目標(biāo)。2026 年已有前車之鑒,Context.ai/Vercel 事件中,攻擊者通過竊取 OAuth Token 橫向移動到 Vercel 內(nèi)部系統(tǒng),OpenClaw 的「Claw Chain」四漏洞鏈影響了 245,000 臺服務(wù)器。OpenHuman 面臨完全相同的結(jié)構(gòu)性風(fēng)險,且目前沒有任何獨(dú)立安全審計。
此外還有 curl | bash 安裝。對于一個即將獲得你郵件、代碼、日歷、支付信息訪問權(quán)限的工具,管道安裝是已知的供應(yīng)鏈攻擊向量。2025 年 ClickFix 攻擊增長 517%,核心手法就是誘導(dǎo)用戶在終端執(zhí)行遠(yuǎn)程命令。
而在所有風(fēng)險之上,更值得深思的是 OpenHuman 自身發(fā)布的,未經(jīng)驗證的技術(shù)聲明。前文提到的 80% token 壓縮率、20 分鐘同步可靠性、Memory Tree 的規(guī)模行為都是項目自述,無第三方驗證。而壓縮層決定了哪些信息被保留、哪些被丟棄,對于敏感場景,這是不得不慎重的問題。
這些風(fēng)險是 feature 的副作用。要做到「分鐘級了解你」,就必須同時獲取大量敏感數(shù)據(jù),要「一鍵設(shè)置」,就必須簡化安全邊界,要「持續(xù)更新記憶」,就必須保持長期有效的 token。OpenHuman 的價值和風(fēng)險,在架構(gòu)層面就是綁定的。

04
盡管 OpenHuman 本身在完成度和商業(yè)化上有著諸般漏洞,但它提出的產(chǎn)品哲學(xué)仍然值得認(rèn)真對待,甚至可以說,這正是 OpenHuman 最具價值的部分。
「上下文即產(chǎn)品」的核心主張是:當(dāng)模型能力趨同后,產(chǎn)品的核心價值不在于它能做什么,在于它知道什么。同樣的模型,給它不同質(zhì)量的上下文,產(chǎn)出的價值天差地別。
這項主張背后有一條清晰的邏輯鏈。當(dāng)技術(shù)能力從稀缺走向充裕,Agent 能力真正商品化,競爭焦點(diǎn)就會從「我能做什么」上移到「我能幫你做什么」,此時對用戶的理解就變成了新的稀缺資源。
這個鏈條在從網(wǎng)絡(luò)帶寬到內(nèi)容推薦,從相機(jī)像素到計算攝影,從CPU 主頻到用戶體驗等多個行業(yè),已經(jīng)被反復(fù)驗證過。
OpenHuman 的出現(xiàn)仍然是對這種歷史進(jìn)程的重復(fù),也就是在 Claude、GPT、Gemini 能力逐漸趨同的節(jié)點(diǎn)上,試圖卡住「更了解用戶」的身位。
但這里有一個關(guān)鍵的辨析,記住 ≠ 理解。
OpenHuman 目前做到的是「跨源記憶」,用戶授權(quán)之后從多個平臺拉取數(shù)據(jù),壓縮存儲,被動檢索。這解決了從 0 到 1 的問題,也就是讓 Agent 有記憶。但是從「記住」到「理解」還有巨大的鴻溝,理解意味著關(guān)系推理、意圖預(yù)測、價值對齊,在諸多孤立的信息點(diǎn)之間,建立邏輯和圖景,描述未來和價值。
與此同時,「記住一切」也未必是正確答案。 記憶也有邊際遞減,真正有價值的不是記住更多,而是在關(guān)鍵時刻調(diào)用關(guān)鍵記憶。OpenHuman 「全量抓取 + 壓縮存儲」的路線,可能不如「少而精的關(guān)鍵記憶 + 強(qiáng)推理」更接近「理解」。
理解是記憶、推理、目標(biāo)模型的乘積。 三者缺一,都只是更高級的搜索引擎。
這或許就是 AI 產(chǎn)品的下一個競爭維度,一個夾在模型和用戶之間的、負(fù)責(zé)積累和管理用戶上下文的「理解層」。OpenHuman 對此的洞察很可能是正確的,但全量抓取、壓縮存儲、被動檢索只是這個方向上最早期、最粗糙的一次嘗試。
因此如果你問我如何看待 OpenHuman。
我會說這是一個方向正確、時機(jī)精準(zhǔn)、但執(zhí)行粗糙、商業(yè)化過早的產(chǎn)品實(shí)驗。它最大的價值不在于做出了什么,而在于它定義了一個好問題:當(dāng)模型能力面臨邊際遞減,如何越過從記憶到理解的鴻溝,會是構(gòu)建護(hù)城河的關(guān)鍵。
這中間的差距,既是它的局限,也是整個行業(yè)的機(jī)會空間,反之亦然。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。