
作者 | 王涵
編輯 | 漠影
鼠標點擊煙花
多擺混沌系統模擬器
以上這些,都是用云知聲最新發布的 U2 大模型做出來的。
智東西 6 月 8 日報道,今天," 港股 AGI 第一股 " 云知聲發布其最新通用大語言模型 U2,該模型是由云知聲自研的、基于快慢思考融合的 MoE(混合專家)范式構建的通用大語言模型。U2 跳出了傳統大模型盲目堆參數、堆 Token 的內卷路徑,實現了 " 小參數強能力、少 Token 高產出、低算力低成本 " 的進化。
只從基準測試上看,云知聲 U2 就已經躋身國產大模型第一陣列了。
長上下文能力上,U2 在 AA-LCR 評測中得到 70 分,在對比模型中排在首位,比第二名的 MiniMax M2.5/M2.7 高出 0.5 分。知識與推理上,U2 也以 87.9 分的成績領跑。指令遵循能力方面,U2 同樣表現突出,IFBench 得分 77.3 分,比第二名的 GLM-5.1 高出 1 分。
智能體能力方面,U2 在 SWE-Bench Verified 評測中取得 75 分,排名第三。Claw-Eval(pass@3)方面,U2 獲得 76.9 分,排名僅次于 MiniMax M2.5/M2.7。在面向真實辦公與知識工作交付能力的 GDPval 上,U2 取得 72.5 分,展現出扎實的專業辦公能力。


云知聲團隊告訴智東西,在當下這個時間衡量今天的大模型價值,已經不能再單純比拼參數規模和內容生成長度。當 AI 真正進入真實工作流,用戶關心的不再只是模型能否給出一個漂亮回答,而是它能否真正把任務完成。
因此,云知聲 U2 從設計之初,就不是一個單純面向聊天場景的通用模型,而是一款有著近 3000 億參數、面向任務執行的原生智能體大模型。
U2 具備長程工作編排與自主糾錯能力,這意味著它可以像一位高級工程師那樣,把一個復雜任務拆解成多個子步驟,按序執行,并在過程中自我校驗、自動修正。
比如編程任務,U2 不僅能完成后端邏輯,還能勝任前端全流程開發:從項目功能開發、頁面排布到視覺方案設計,均可端到端落地。
我讓 U2 生成一個新產品發布倒數頁面,要求包含郵箱信息填寫和各個平臺聯系方式的互動按鈕。幾乎沒有反應時間,它就直接交付了內容清晰、可運行的頁面。
這套長程編排與自主糾錯機制,也讓 U2 能夠獨立完成虛擬系統、游戲等完整應用的交付。例如,用戶不需要輸入完整的游戲邏輯,U2 就可以自動搜索相關條件,生成一個符合要求且可玩度很高的俄羅斯方塊小游戲。
面對復雜的知識工作,U2 同樣不靠簡單拼接信息。它具備跨行業數據檢索、多源信息清洗與專業文獻深度結構化分析的能力,能夠并行調用多個工具,將零散、異構的數據整合為有邏輯、有結論的分析結果。
我交給了 U2 一個十分艱巨的任務:分析 2026 年 5 月原油、黃金、銅、農產品等大宗商品走勢,結合地緣政治、供需關系、美元指數、庫存數據,判斷短期價格波動與中長期趨勢。
這個任務不僅需要對當下地緣政治局面十分了解,還要理解地緣政治與大宗商品的內在邏輯關系,需要扎實的歷史知識和金融知識。
面對這個綜合金融問題,U2 幾乎沒有反應時間,自動調取了所需的網頁檢索和分析工具,在一兩分鐘內就洋洋灑灑生成了一篇超 5000 字、帶數據表格的分析報告,展現出十分強大的深度結構化分析能力。

用戶只需一句 " 幫我寫一下本周的周報 ",U2 就會主動梳理已完成事項、提取關鍵數據、調用 docx 技能,并且模型還會自動校驗其生成結果的準確度。從結果看來,U2 輸出的周報文檔,結構清晰、內容完整詳實,可以直接拿來就用。

U2 模型的核心創新,目的都是指向一個清晰的目標:讓模型在真實業務場景中展現出超越體積的智能與效率。
這其中,模型的高智能密度和高 Token 價值就至關重要。
云知聲通過對高質量知識數據的深度提純,實現知識點級的精準萃取與結構化編碼,徹底剔除冗余低質信息,讓小參數模型獲得與超大模型相當的知識承載能力與智能表現。
U2 采用高效稀疏架構,激活參數僅為總參數量的約十分之一,推理成本與激活參數規模線性錨定,高并發場景下的成本優勢尤為突出。
并且,通過優化語義表征與推理路徑壓縮,技術團隊讓模型的單個 Token 承載語義、信息量都遠超傳統模型,用更少 Token 完成更復雜任務,大幅降低企業部署的算力門檻與推理延遲。
傳統顯式思維鏈雖然具備較強可解釋性,但往往需要生成大量中間推理文本,帶來更高 Token 消耗與推理延遲。而隱空間推理,卻可能在復雜任務中出現邏輯漂移,缺乏足夠的可控性與驗證能力。
因此,在復雜推理層面,U2 進一步引入了一個十分獨特的機制:混合思考機制。
它借鑒人腦解題方式:輸出前先在隱藏表征中形成連續思考,在高維空間同步探索多條路徑,再映射為后續顯式推理,避免將全部中間步驟逐一展開。
其中,U2 引入了可控隱空間展開(Bounded Latent Rollout)與熵感知切換(Entropy-aware Switching)機制,使模型能夠根據推理過程中的不確定性動態調整思考方式:當隱式探索穩定時,模型保持高效推理;當不確定性升高、推理路徑可能發散時,則及時回到顯式思維鏈,通過確定性 Token 完成精準推導與結果收斂。
這套設計在保留多路徑探索與可驗證性的同時,還節省了約 25% 的思考 Token 消耗。
在任務執行層面,U2 使用了 Agent-Harness 協同訓練范式,將模型原生 Agent 能力提升與 Harness 迭代優化納入同一訓練閉環:一方面,Harness 根據 U2 的模型特點持續優化任務執行鏈路;另一方面,真實任務中產生的高質量執行軌跡,又反過來強化模型的任務規劃、工具調用、過程糾錯和結果驗收能力。
總體看下來,U2 整套設計的落點非常清晰:用更小的參數、更少的 Token、更低的算力,在真實業務場景中交付穩定、可靠、可驗證的智能結果。
三、端云協同疊加場景深耕,云知聲走出大模型商業化樣本
云知聲自 2012 年創立以來,走出了一條獨特的發展道路。
首先,在技術硬實力上,云知聲擁有僅少數廠商才具備的全棧 AI 能力,其不僅能做云端,更能做端側,實現了端云協同。不同于單純的模型層廠商,云知聲手握 " 芯片 + 算力 + 模型 + 應用 " 的完整鏈條。其自研的 " 蜂鳥 " 等系列芯片出貨量已超億顆,這使得云知聲在端側大模型的部署上擁有相當的優勢。

在智慧醫療領域,其產品已在近 450 家醫院實現規模化部署,涵蓋病歷生成與質控、輔助診療及保險和醫保監管等場景;在智慧交通領域,產品應用于深圳、廣州、青島等多地地鐵及航空樞紐,提供智慧客服、語音購票及智能調度等解決方案;在智慧生活與 AIoT 領域,通過 " 芯片 + 模型 " 方案,賦能智能家居、智慧座艙、智慧營銷等場景,服務眾多行業頭部企業。
這種在高價值 B 端場景的扎根,讓云知聲成為了國產大模型公司中變現能力最強、離盈利最近的那一個。
財報數據也著實證明了這一點。今年 3 月 26 日,云知聲交出了一張 " 硬核成績單 ":該公司 2025 年營收 12.1 億元,同比增長 29%;其中大模型相關收入達 6.1 億元,同比暴漲 1076%,撐起半壁江山。更值得一提的是,其虧損顯著收窄,全年經調整凈虧損約 1.3 億元,同比下降近 25%,下半年更是大幅縮窄 92%,幾近盈虧平衡。
受益于高質量場景 Token 的需求激增,云知聲 5 月 Token 調用收入的 ARR 環比暴漲 600%,預計 6 月將繼續保持高增長,ARR 達到 1500 萬美元。
這意味著,其收入與客戶 AI 使用強度已關聯,云知聲業務的規模天花板已經全面打開。
結語:躋身國產大模型第一梯隊后,云知聲再次捅破行業天花板
站在 2026 年 6 月的時間點回望,從 2012 年以語音技術起家,到 2025 年登陸港交所,再到如今上市一周年之際發布 U2 大模型,云知聲用 14 年時間完成了從智能交互到 AGI 的跨越。
云知聲的特殊性在于,它從未脫離過產業場景。長達十年的 " 云端芯 " 布局,云知聲積累了深厚的垂直行業 Know-How。U2 大模型發布后,立刻就能在智慧醫療、智慧交通、智慧座艙等場景中產生化學反應,成為生產力工具。
U2 的發布,不僅是其自身的一次產品迭代,更是國產大模型走向成熟化、產業化的一個縮影。

作者 | 王涵
編輯 | 漠影
鼠標點擊煙花
多擺混沌系統模擬器
以上這些,都是用云知聲最新發布的 U2 大模型做出來的。
智東西 6 月 8 日報道,今天," 港股 AGI 第一股 " 云知聲發布其最新通用大語言模型 U2,該模型是由云知聲自研的、基于快慢思考融合的 MoE(混合專家)范式構建的通用大語言模型。U2 跳出了傳統大模型盲目堆參數、堆 Token 的內卷路徑,實現了 " 小參數強能力、少 Token 高產出、低算力低成本 " 的進化。
只從基準測試上看,云知聲 U2 就已經躋身國產大模型第一陣列了。
長上下文能力上,U2 在 AA-LCR 評測中得到 70 分,在對比模型中排在首位,比第二名的 MiniMax M2.5/M2.7 高出 0.5 分。知識與推理上,U2 也以 87.9 分的成績領跑。指令遵循能力方面,U2 同樣表現突出,IFBench 得分 77.3 分,比第二名的 GLM-5.1 高出 1 分。
智能體能力方面,U2 在 SWE-Bench Verified 評測中取得 75 分,排名第三。Claw-Eval(pass@3)方面,U2 獲得 76.9 分,排名僅次于 MiniMax M2.5/M2.7。在面向真實辦公與知識工作交付能力的 GDPval 上,U2 取得 72.5 分,展現出扎實的專業辦公能力。


云知聲團隊告訴智東西,在當下這個時間衡量今天的大模型價值,已經不能再單純比拼參數規模和內容生成長度。當 AI 真正進入真實工作流,用戶關心的不再只是模型能否給出一個漂亮回答,而是它能否真正把任務完成。
因此,云知聲 U2 從設計之初,就不是一個單純面向聊天場景的通用模型,而是一款有著近 3000 億參數、面向任務執行的原生智能體大模型。
U2 具備長程工作編排與自主糾錯能力,這意味著它可以像一位高級工程師那樣,把一個復雜任務拆解成多個子步驟,按序執行,并在過程中自我校驗、自動修正。
比如編程任務,U2 不僅能完成后端邏輯,還能勝任前端全流程開發:從項目功能開發、頁面排布到視覺方案設計,均可端到端落地。
我讓 U2 生成一個新產品發布倒數頁面,要求包含郵箱信息填寫和各個平臺聯系方式的互動按鈕。幾乎沒有反應時間,它就直接交付了內容清晰、可運行的頁面。
這套長程編排與自主糾錯機制,也讓 U2 能夠獨立完成虛擬系統、游戲等完整應用的交付。例如,用戶不需要輸入完整的游戲邏輯,U2 就可以自動搜索相關條件,生成一個符合要求且可玩度很高的俄羅斯方塊小游戲。
面對復雜的知識工作,U2 同樣不靠簡單拼接信息。它具備跨行業數據檢索、多源信息清洗與專業文獻深度結構化分析的能力,能夠并行調用多個工具,將零散、異構的數據整合為有邏輯、有結論的分析結果。
我交給了 U2 一個十分艱巨的任務:分析 2026 年 5 月原油、黃金、銅、農產品等大宗商品走勢,結合地緣政治、供需關系、美元指數、庫存數據,判斷短期價格波動與中長期趨勢。
這個任務不僅需要對當下地緣政治局面十分了解,還要理解地緣政治與大宗商品的內在邏輯關系,需要扎實的歷史知識和金融知識。
面對這個綜合金融問題,U2 幾乎沒有反應時間,自動調取了所需的網頁檢索和分析工具,在一兩分鐘內就洋洋灑灑生成了一篇超 5000 字、帶數據表格的分析報告,展現出十分強大的深度結構化分析能力。

用戶只需一句 " 幫我寫一下本周的周報 ",U2 就會主動梳理已完成事項、提取關鍵數據、調用 docx 技能,并且模型還會自動校驗其生成結果的準確度。從結果看來,U2 輸出的周報文檔,結構清晰、內容完整詳實,可以直接拿來就用。

U2 模型的核心創新,目的都是指向一個清晰的目標:讓模型在真實業務場景中展現出超越體積的智能與效率。
這其中,模型的高智能密度和高 Token 價值就至關重要。
云知聲通過對高質量知識數據的深度提純,實現知識點級的精準萃取與結構化編碼,徹底剔除冗余低質信息,讓小參數模型獲得與超大模型相當的知識承載能力與智能表現。
U2 采用高效稀疏架構,激活參數僅為總參數量的約十分之一,推理成本與激活參數規模線性錨定,高并發場景下的成本優勢尤為突出。
并且,通過優化語義表征與推理路徑壓縮,技術團隊讓模型的單個 Token 承載語義、信息量都遠超傳統模型,用更少 Token 完成更復雜任務,大幅降低企業部署的算力門檻與推理延遲。
傳統顯式思維鏈雖然具備較強可解釋性,但往往需要生成大量中間推理文本,帶來更高 Token 消耗與推理延遲。而隱空間推理,卻可能在復雜任務中出現邏輯漂移,缺乏足夠的可控性與驗證能力。
因此,在復雜推理層面,U2 進一步引入了一個十分獨特的機制:混合思考機制。
它借鑒人腦解題方式:輸出前先在隱藏表征中形成連續思考,在高維空間同步探索多條路徑,再映射為后續顯式推理,避免將全部中間步驟逐一展開。
其中,U2 引入了可控隱空間展開(Bounded Latent Rollout)與熵感知切換(Entropy-aware Switching)機制,使模型能夠根據推理過程中的不確定性動態調整思考方式:當隱式探索穩定時,模型保持高效推理;當不確定性升高、推理路徑可能發散時,則及時回到顯式思維鏈,通過確定性 Token 完成精準推導與結果收斂。
這套設計在保留多路徑探索與可驗證性的同時,還節省了約 25% 的思考 Token 消耗。
在任務執行層面,U2 使用了 Agent-Harness 協同訓練范式,將模型原生 Agent 能力提升與 Harness 迭代優化納入同一訓練閉環:一方面,Harness 根據 U2 的模型特點持續優化任務執行鏈路;另一方面,真實任務中產生的高質量執行軌跡,又反過來強化模型的任務規劃、工具調用、過程糾錯和結果驗收能力。
總體看下來,U2 整套設計的落點非常清晰:用更小的參數、更少的 Token、更低的算力,在真實業務場景中交付穩定、可靠、可驗證的智能結果。
三、端云協同疊加場景深耕,云知聲走出大模型商業化樣本
云知聲自 2012 年創立以來,走出了一條獨特的發展道路。
首先,在技術硬實力上,云知聲擁有僅少數廠商才具備的全棧 AI 能力,其不僅能做云端,更能做端側,實現了端云協同。不同于單純的模型層廠商,云知聲手握 " 芯片 + 算力 + 模型 + 應用 " 的完整鏈條。其自研的 " 蜂鳥 " 等系列芯片出貨量已超億顆,這使得云知聲在端側大模型的部署上擁有相當的優勢。

在智慧醫療領域,其產品已在近 450 家醫院實現規模化部署,涵蓋病歷生成與質控、輔助診療及保險和醫保監管等場景;在智慧交通領域,產品應用于深圳、廣州、青島等多地地鐵及航空樞紐,提供智慧客服、語音購票及智能調度等解決方案;在智慧生活與 AIoT 領域,通過 " 芯片 + 模型 " 方案,賦能智能家居、智慧座艙、智慧營銷等場景,服務眾多行業頭部企業。
這種在高價值 B 端場景的扎根,讓云知聲成為了國產大模型公司中變現能力最強、離盈利最近的那一個。
財報數據也著實證明了這一點。今年 3 月 26 日,云知聲交出了一張 " 硬核成績單 ":該公司 2025 年營收 12.1 億元,同比增長 29%;其中大模型相關收入達 6.1 億元,同比暴漲 1076%,撐起半壁江山。更值得一提的是,其虧損顯著收窄,全年經調整凈虧損約 1.3 億元,同比下降近 25%,下半年更是大幅縮窄 92%,幾近盈虧平衡。
受益于高質量場景 Token 的需求激增,云知聲 5 月 Token 調用收入的 ARR 環比暴漲 600%,預計 6 月將繼續保持高增長,ARR 達到 1500 萬美元。
這意味著,其收入與客戶 AI 使用強度已關聯,云知聲業務的規模天花板已經全面打開。
結語:躋身國產大模型第一梯隊后,云知聲再次捅破行業天花板
站在 2026 年 6 月的時間點回望,從 2012 年以語音技術起家,到 2025 年登陸港交所,再到如今上市一周年之際發布 U2 大模型,云知聲用 14 年時間完成了從智能交互到 AGI 的跨越。
云知聲的特殊性在于,它從未脫離過產業場景。長達十年的 " 云端芯 " 布局,云知聲積累了深厚的垂直行業 Know-How。U2 大模型發布后,立刻就能在智慧醫療、智慧交通、智慧座艙等場景中產生化學反應,成為生產力工具。
U2 的發布,不僅是其自身的一次產品迭代,更是國產大模型走向成熟化、產業化的一個縮影。