
更新到 iOS 27 的開發者測試版本后,對國行 iPhone 來說,最大的變化是可以設置調休鬧鐘,外版用戶則迎來了一個獨立的 Siri App。
這兩年,我們一直在吐槽國行 iPhone 沒有 AI。
但如果今天真的要買一臺手機,AI 恐怕還不是大多數人的首要考慮因素。

大家會比較影像、續航、性能、外觀,甚至顏色,卻很少有人因為「這個 AI 特別強」而下單。
一個有點矛盾的現實是,AI 手機已經喊了兩年,但什么是 AI 手機,行業和用戶都還沒有形成共識。
就在這個背景下,蘋果這次把新版 Siri 推到了系統層。
它有了獨立入口,也支持連續對話、文件上傳和上下文理解。

真正值得關注的是,蘋果終于給出了自己對于 AI 手機的答案。
目前,對 AI 手機而言,行業里目前存在兩種理解。
一方面是手機變聰明了,從智能到人工智能。相機能夠識別物體,照片能自動擴圖、修改視角,搜索框里換了大模型驅動的 AI 引擎,快捷指令用簡單的自然語言就能搭出來。
這些改進確實讓體驗變得更好,可是我們跟手機的關系似乎并沒改變。這一路線增強的是功能,而第二種路線改變的是交互。

過去兩年我們一直在討論,也是所有廠商都難做好的,全在第二件事上。
四種 AI 手機
問題在于,當 AI 真正開始替用戶操作手機,它立刻會碰到權限、應用生態和責任歸屬的問題。
誰有資格代替用戶執行操作?App 愿不愿意開放能力?出了問題誰負責?
于是,不同廠商開始走向完全不同的路線。

豆包手機剛出來那會兒,確實收獲了很多關注。它通過系統權限拿到的能力,可以直接模擬用戶點擊。一個需要 50 步點擊的任務,大概能跑出八成的成功率,能力邊界是當時市面上,所有打著 AI 手機旗號的產品中最寬的一個。

效率上,通過識屏的方式找到應用的不同按鈕,然后再操作系統進行點擊,這種流程被拉得極長。即便可以預先錄入一套常見應用的交互方式,但 App 一旦更新,界面重新排布,就又需要再來一次,還可能失效,需要重新學習訓練。
合規上,豆包手機在去年年底被微信、支付寶集體風控。豆包手機也發布聲明回復,所有的權限都在系統允許的范圍內操作,后續也主動收縮了操作范圍。

豆包手機的正式版還在打磨,路線也正在從純視覺操作向接口協同演進。
國民級的超級應用選擇 AI,會成為手機的重要部分
微信,就在 WWDC 前,聯合五大手機廠商推出了 A2A(Agent-to-Agent)助手能力。
手機系統 AI 助手解析出用戶意圖后,通過加密、受控的協議向微信發起「呼叫」,微信在自己的沙盒里原生執行「發消息、打電話」這兩個基礎動作,系統 AI 碰不到任何聊天記錄。

更有意思的是,微信同一天還面向小程序開發者開放了微信 AI 生態接入指引。
開發者可以授權微信 AI 接入自己的小程序,其中有兩種模式,「自動模式」讓平臺讀取源碼、分析頁面、直接操作;「開發模式」讓開發者自主聲明能力,經審核后被微信 AI 調用。
兩種模式可以同時開啟。微信現有超過 400 萬個小程序,如果大量接入,微信 AI 調度的能力范圍將遠超「發消息打電話」,點外賣、打車、訂票、買東西,一整個小程序生態都有機會實現。

雙方都在開放能力,但都希望把入口掌握在自己手里。
XX Intelligence 和 XX 助手
再看 Android 和 iPhone,方向其實一致:AI 不再是一個 App,而是在系統里流動。
Google 在 I/O 之前的 Android Show 上直接說,Android 正在從 operating system 變成 intelligence system。

從這個角度看,Google 爭奪的已經不僅是一部手機上的 AI 入口,Gemini 承擔的是整個 Google 生態的交互層。
當用戶發出一個需求,調用的可能是搜索、地圖、郵箱、瀏覽器,也可能是電腦、手機、車機和眼鏡上的能力。
AI 手機只是這張網絡里的一個節點。
Siri AI 不會是一個「ChatGPT 式」的 App
蘋果選了一條更慢的路。
Siri AI 的新能力強烈依靠 App Intents。開發者要把自己的內容和動作用結構化方式交給系統,比如「我能創建一筆費用」、「我能預約會議」、「我能編輯這張圖」。Siri 再用自然語言理解用戶意圖,調用這些動作。
蘋果還把 App 內容接進 Spotlight 的語義索引,讓 Siri 能理解手機里的個人上下文。這套邏輯和微信小程序的「開發模式」很像,開發者聲明能力,平臺負責調度。
區別是,微信只在小程序生態里做,蘋果要把它放到整個 iOS App 生態里。

蘋果的底層模型也補了一大塊。第三代 Apple Foundation Models 包括端側模型、私有云模型和圖像模型,其中端側 AFM 3 Core 是 30 億參數,AFM 3 Core Advanced 是 200 億參數的稀疏模型,按任務激活 10 億到 40 億參數。
更復雜的任務交給 Private Cloud Compute。蘋果也提到新一代 AFM 是和 Google Gemini 合作定制的,最重的云端模型還用到了 Google Cloud 上的 NVIDIA GPU。

蘋果終于把過去兩年欠下的 AI 賬補到了系統層。
它的優勢是整合最深,Siri、Spotlight、App Intents、照片、信息、Safari、快捷指令,這些東西都在系統里。一次系統升級,就能改變 iPhone 用戶「找東西、辦事情」的默認路徑。
但它的限制也很清楚,App Intents 取決于開發者適配多少,Siri AI 真實可用性還要等 beta 之后驗證。
國行用戶還要面對地區限制,而部分端側大模型的能力,支持的手機產品也只有 iPhone Air 和 iPhone 17 Pro 系列。

今天各家爭的,還是手機和 App 之間那一層:誰能替用戶辦事,誰批準,誰執行,誰擔責。
從豆包、微信、Google 到蘋果,雖然它們給出的答案并不相同,有的選擇模擬操作,有的選擇開放協議,有的選擇統一調度層,也有的選擇讓開發者聲明能力。
共同點在于,AI 手機正在從「回答問題」走向「完成任務」。

端側模型正在變小,推理芯片正在變強。1.58-bit、2-bit 這類低比特量化不斷降低模型占用,手機上能跑的模型會越來越大。現在很多端側能力還只是修圖、聽寫、摘要和簡單問答,幾年后,手機本地模型處理個人上下文、隱私任務、輕量代理工作,會變得更自然。

我們不一定要在手機上完成所有工作,但可以用手機發起任務:讓電腦里的 Codex 寫代碼,讓云端的 Claude 做研究,讓家里的設備準備環境,讓車機繼續導航,讓眼鏡把現實世界變成輸入。
Googlebook 已經把這個方向擺出來了:手機里的 Android App、文件和 Gemini 能力,可以延伸到筆記本。蘋果如果把 Siri AI 做扎實,后面自然會接 AirPods、Apple Watch、Vision Pro,甚至傳聞中的眼鏡和桌面機器人。
