在 AI 發展的進程中,早期云端 AI 憑借強大的算力與集中式的數據處理能力,成為行業發展的主導力量。但隨著應用場景不斷拓展,尤其是在物聯網、自動駕駛、工業控制等領域,云端 AI 的局限性逐漸顯現。國際數據公司(IDC)研究顯示,2025 年全球邊緣計算解決方案支出將接近 2610 億美元,預計年復合增長率(CAGR)將達到 13.8%,到 2028 年將達到 3800 億美元,零售和服務業將占據邊緣解決方案投資的最大份額,占全球總支出的近 28%。這一數據直觀體現出產業重心正從云端向邊緣傾斜。
人們越來越擔心人工智能正滑入泡沫領域。麻省理工學院 NANDA 項目發布的一份報告《GenAI 鴻溝:2025 年商業人工智能現狀》發現,95% 的公司在開發生成式人工智能工具后幾乎沒有實現生產力提升。就連 OpenAI 首席執行官薩姆 · 奧特曼也承認,投資者可能對人工智能過度興奮,并將當前的市場比作泡沫。
然而,業內人士認為,這種批評主要針對基于云端的人工智能市場和軟件算法。
為什么需要邊緣 AI 生成?
當前市面上主流的語言大模型,從 OpenAI 的 GPT、谷歌的 Gemini、Anthropic 的 Claude,到國內熱門的 DeepSeek,幾乎都依賴 AI 云計算完成生成任務。這種依托遠程服務器的模式,憑借強大的算力,能輕松應對大規模模型訓練、高分辨率圖像合成等復雜需求,而且擴展性極強 —— 小到個人用戶的日常問答,大到企業級的批量部署,都能靈活適配,對普通用戶來說,這樣的體驗已經足夠滿足需求。
但放到企業級應用或更復雜的場景中,云端模式的短板就逐漸顯現:一是延遲較高,復雜任務的響應速度容易受網絡波動影響;二是對網絡的依賴性極強,一旦斷網便無法使用;最關鍵的是數據隱私風險—— 大量原始數據需要上傳至云端處理,不僅會增加帶寬成本,還可能因傳輸或存儲環節的漏洞導致數據泄露,這對醫療、金融等敏感領域來說尤為棘手。
也正因此,邊緣生成式 AI 的優勢開始凸顯。它將生成能力直接部署在本地設備上 —— 可能是我們的手機、監控攝像頭,也可能是自動駕駛車輛、工業機床,數據處理全程在本地完成,敏感信息無需離開設備,從源頭保障了隱私安全。與此同時,邊緣 AI 的低延遲特性堪稱 " 實時場景救星 ":自動駕駛需要毫秒級的路況判斷、工業自動化依賴即時的設備故障預警,這些對響應速度要求極高的場景,邊緣 AI 都能精準適配。更重要的是,它無需頻繁傳輸數據,大幅降低了帶寬需求,即便在無網絡的偏遠地區或信號薄弱的工業車間,也能獨立運行,穩定性和可靠性遠超云端模式。
邊緣智能的技術雛形可追溯至 20 世紀 90 年代,當時以內容交付網絡(CDN)的形態出現。其最初定位是通過分布在網絡邊緣的服務器,就近為用戶提供網絡服務與視頻內容分發,核心目標在于分流中心服務器的負載壓力,提升內容傳輸與訪問效率。
不過,隨著物聯網(IoT)設備的爆發式增長,疊加 4G、5G 移動通信技術的普及,全球數據產生量呈指數級攀升,逐步邁入澤字節(ZB)時代。傳統云計算架構在此背景下逐漸顯露出短板:數據需全量傳輸至云端處理,不僅造成高額帶寬消耗,還因傳輸距離導致高延遲問題,同時數據跨網絡流轉也帶來了隱私泄露的風險,已難以滿足實時性、安全性要求較高的場景需求。
進入 21 世紀后,為解決云計算的痛點,邊緣計算概念正式提出。其核心思路是將數據處理環節從云端下沉至靠近數據源的邊緣節點,通過在本地完成數據的初步篩選、處理與轉發,大幅減少上傳至云端的數據量,從而緩解帶寬壓力、降低延遲。但這一階段的邊緣計算,主要聚焦于數據處理流程的優化,尚未與人工智能(AI)技術結合,未涉及 AI 算法的部署與應用。
直到 2020 年以后,隨著 AI 技術(尤其是輕量化模型、低功耗計算技術)的成熟,邊緣計算與 AI 開始深度融合," 邊緣智能 " 作為一門獨立的融合技術正式興起。它的核心特征是將 AI 算法(包括推理與訓練環節)部署在靠近數據生成端的邊緣設備(如物聯網終端、邊緣服務器)上,既能實現數據的實時處理與低延遲決策,又能避免原始數據上傳云端,從源頭保障數據隱私安全。
縱觀邊緣智能的發展歷程,可清晰劃分為三大核心階段:第一階段以 " 邊緣推理 " 為核心,模型訓練過程仍依賴云端完成,訓練好的模型再被推送至邊緣設備執行推理任務;第二階段進入 " 邊緣訓練 " 階段,借助自動化開發工具,實現模型訓練、迭代、部署的全流程邊緣化,減少對云端資源的依賴;第三階段也是未來的發展方向,是 " 自主機器學習 ",目標是讓邊緣設備具備自主感知、自適應調整的學習能力,無需人工干預即可完成模型優化與能力升級。
當然,這并不意味著云端 AI 會被取代。面對超大規模模型訓練、跨設備協同的復雜任務,云端強大的算力依然不可替代。未來的趨勢更可能是 " 云端 + 邊緣 " 互補:云端負責底層模型的訓練與優化,邊緣負責本地場景的實時部署與數據處理,二者協同發力,既能發揮云端的算力優勢,又能兼顧邊緣的隱私與實時性,最終推動人工智能技術更安全、更高效地走進各行各業。
數據來源:precedenceresearch 半導體產業縱橫制表
市場研究機構 Market 數據表明,全球邊緣人工智能市場規模預計到 2032 年將超過 1400 億美元,較 2023 年的 191 億美元大幅增長。Precedence Research 數據顯示,邊緣計算市場在 2032 年可能達到 3.61 萬億美元(CAGR 30.4%)。這些數據預示著邊緣 AI 廣闊的發展前景,也解釋了為何大廠紛紛將目光投向這片新藍海。
巨頭布局,搶占先機
在邊緣 AI 芯片賽道,大廠競爭激烈。芯片領域作為邊緣 AI 發展的核心硬件支撐,近兩年呈現出算力革新與架構創新并行的趨勢。
蘋果在 iPhone 系列中積極布局自研邊緣 AI 芯片,以最新發布的 iPhone 16 系列為例,其搭載的 A18 芯片專為 AI 功能深度優化。A18 采用第二代 3 納米工藝,集成 16 核神經網絡引擎,每秒運算可達 35 萬億次 。這一強大算力使得面容 ID 識別瞬間完成,Animoji 生成也流暢無比,響應速度進入毫秒級時代。同時,得益于芯片的本地處理能力,數據無需上傳至云端,從根本上規避了云端傳輸帶來的隱私風險,為用戶筑牢隱私防線。
英偉達作為圖形處理及 AI 計算領域的佼佼者,在邊緣 AI 芯片布局上同樣成果斐然。其推出的 Jetson 系列邊緣 AI 芯片,專為機器人、無人機、智能攝像頭等邊緣設備打造。以 Jetson Xavier NX 為例,這款芯片集成了 512 個 NVIDIA CUDA 核心和 64 個 Tensor Core,具備高達 21 TOPS(每秒運算萬億次)的算力,卻僅需 15W 的功耗,能夠為機器人在復雜多變的環境中提供強大的視覺識別與決策執行支持。在物流倉儲場景中,搭載 Jetson Xavier NX 芯片的移動機器人可快速識別貨物、貨架位置,規劃最優路徑,高效完成貨物搬運任務,大幅提升物流運作效率。
國內企業在邊緣 AI 芯片領域也成績亮眼。云天勵飛 2022 年推出的 DeepEdge 10 系列專為邊緣大模型設計;2024 年升級的 DeepEdge200 采用 D2D Chiplet 技術,搭配 IPU-X6000 加速卡,可適配云天天書、通義千問等近 10 個主流大模型,在智慧安防攝像頭中實現異常行為實時識別,預警響應時間縮短至 0.5 秒內。
國產 AI 算力芯片公司主要產品 來源:民生證券
在 8 月 26 日晚間,云天勵飛公布 2025 年半年度報告。財報顯示,其 2025 年上半年實現營業收入 6.46 億元,較上年同期增長 123.10%;歸母凈利潤為 -2.06 億元,同比虧損收窄 1.04 億元;扣非凈利潤為 -2.35 億元,同比虧損收窄 1.10 億元。對于業績變化,該公司表示,報告期內,營業收入較上年同期增加,主要是消費級及企業級場景業務的銷售收入增加所致。虧損收窄主要系報告期內營業收入及毛利率同步增加所致。
數據來源:公司財報 半導體產業縱橫制表
面對邊緣設備內存、算力等資源受限的現實,谷歌、微軟、Meta 等國際科技巨頭等紛紛聚焦于輕量化大模型的研發與優化,以實現大模型在邊緣設備上的高效運行。
谷歌在這一領域積極探索,通過對模型架構的精巧設計與參數的精細調整,將部分大模型進行了成功的輕量化改造。例如其推出的 Gemini Nano 模型,基于 Transformer 架構進行優化,在保持較高模型性能的同時,大幅減少了模型參數數量與計算復雜度,能夠在智能安防攝像頭等邊緣設備上流暢運行,為實時視頻圖像分析提供有力支持。在城市安防監控網絡中,部署了 Gemini Nano 模型的攝像頭可實時識別行人、車輛,監測異常行為,及時發出警報,有效提升城市安全防控能力。
微軟則另辟蹊徑,推出的 phi-1.5 模型雖參數規模相對較小,但在模型訓練數據選擇上獨具匠心。該模型采用了精心篩選的 27B token " 教科書級 " 數據進行訓練,在數學推理能力方面表現卓越,超越了部分參數規模龐大的千億級模型。在教育領域的智能輔導系統中,phi-1.5 模型可快速、準確地解答學生提出的數學問題,提供詳細的解題步驟與思路,輔助教師教學,提升教學質量與效率。
爆發點,在哪里
智能家居設備是邊緣 AI 最常見的應用場景之一。它讓智能家居設備告別 " 單一指令執行 ",轉向 " 行為預判式服務 "。智能溫控器通過學習用戶作息與睡眠周期,結合室外天氣動態調溫,既保障舒適又降低 15%-20% 能耗,遠優于傳統設備。以小度音箱為代表的終端,憑借邊緣 AI 實現 0.3 秒內響應高頻指令,還能聯動跨品牌設備形成場景服務,如 " 回家模式 " 自動觸發開燈、調溫、放音樂,推動中國智能家居場景聯動滲透率達 38%,超全球平均水平。
可穿戴設備是邊緣 AI 的另一個重要領域。Meta 與雷朋合作的智能眼鏡,在上海等城市實現毫秒級圖像識別與本地翻譯,無網狀態下也能實時轉換路牌文字、推薦周邊店鋪,累計出貨量已經突破 200 萬臺。中國品牌更聚焦深度健康管理,華為 Watch GT 系列通過邊緣 AI 融合心率、血氧、心電圖等數據,篩查睡眠呼吸暫停綜合征準確率達 85%,幫助超 10 萬用戶提前發現健康問題;OPPO 手環則依據用戶運動數據實時調整強度,生成個性化計劃,讓健康管理形成 " 采集 - 分析 - 建議 " 閉環。
在工業領域,AI 與物聯網、機器人的結合,正推動工廠從 " 單一設備自動化 " 升級為 " 全流程智能協同 ",通過邊緣 AI 實時處理生產數據,實現 " 故障預判、流程優化、質量追溯 " 的全鏈條智能化。智能工廠中的機器人,已不再是 " 重復單一動作 " 的機械臂,而是具備 " 實時決策能力 " 的 " 智能生產單元 "。Arm 的計算平臺則為工業物聯網提供了 " 高效數據處理底座 "。工業場景中,一臺智能設備每天會產生超 10GB 的傳感器數據(如溫度、振動、壓力),若全部上傳云端處理,不僅會占用大量帶寬,還會導致數據延遲(可能達數分鐘),而 Arm 平臺的邊緣計算能力可實現 " 本地數據過濾與分析 " —— 僅將 " 異常數據 "(如振動頻率超出正常范圍)上傳云端,同時在本地生成 " 設備健康報告 ",提醒運維人員及時檢修。
長遠來看,邊緣 AI 的深度價值,在于推動人工智能從 " 工具屬性 " 向 " 場景屬性 " 延伸。當智能不再依賴云端的遠程支撐,而是嵌入到生活與生產的具體場景中 —— 從家庭溫控器根據用戶習慣動態調溫,到工廠機器人自主優化作業路徑,再到可穿戴設備為用戶定制健康方案,人工智能才算真正融入產業肌理與生活日常。這種轉變,既規避了技術泡沫化的風險,也讓人工智能的價值在實際應用中落地生根。
來源:半導體產業縱橫