伴隨全球數字化進程的加快,人工智能成為引領未來世界發展的關鍵技術。近年來,各國政府、科研教育機構、科技企業及專家學者紛紛加入到推動人工智能產業發展的過程中,人工智能技術與產業融合程度不斷加深。
本期的智能內參,我們推薦尚普咨詢的報告《2022年全球人工智能產業研究報告》,揭秘人工智能的發展前沿。
來源 尚普咨詢
原標題:
《2022年全球人工智能產業研究報告》
作者:孫碩 宿碩 劉宇 張�t 周文青
一、人工智能產業概況
近年來,人工智能技術得到快速發展,其對經濟社會發展以及生產生活方式變革將產生重大影響。全球范圍內美國、歐盟、英國、日本、中國等國家和地區均大力支持人工智能產業發展,相關新興應用不斷落地。根據Deloitte報告預測,全球人工智能產業規模從2017年的6,900億美元增長至2025年的64,000億美元,2017-2025年復合增長率32.10%,呈現較快增長走勢。
▲2017-2025年全球人工智能產業規模
投融資方面,全球人工智能投資市場近年來快速發展,整體融資規模從2015年的63億美元增長至2021年的668億美元。2021年全球醫療AI融資規模較高達到122億美元,金融科技AI融資規模為39億美元,零售AI融資規模為37億美元。
▲2015-2021年全球AI融資規模和融資數量
▲2015-2021年全球醫療AI融資規模和融資數量
▲2015-2021年全球金融AI融資規模和融資數量
▲2015-2021年全球零售AI融資規模和融資數量
尚普研究院根據CB Insights數據統計,全球現有人工智能企業超過11,000家,累計融資總額超過2,500億美元。其中,美國擁有AI相關企業達到4,171家,累計融資金額達到1,601.9億美元,在公司數量和融資規模上均位居世界首位;中國擁有1,275家AI公司,融資總金額為470.7億美元,位居世界第二位。英國、印度、加拿大等國家也各自擁有百余家AI公司,AI企業數量排名前10位的國家占全球總數的78.3%,累計融資金額則達到全球總額的95%,AI企業和融資活動集中在美、中、英等國家。
▲全球主要國家AI企業數量與累計融資規模
尚普研究院將處于全球人工智能產業鏈中的典型上市公司進行整理,名單中以具備綜合實力的科技巨頭為主,國外如Google、Amazon、Microsoft等,國內如百度、阿里巴巴、騰訊等。此外,國內的商湯、科大訊飛等具有強技術屬性的AI公司受關注度較高。
▲全球人工智能產業鏈主要上市企業名單
二、AI芯片,廣泛應用于云、邊、端各類場景
AI芯片(AI Chip):專門用于處理人工智能相關的計算任務,其架構針對人工智能算法和應用進行專門優化,具有高效處理大量結構化和非結構化數據的特征,可高效支持視覺、語音、自然語言處理等智能處理任務。當前AI芯片類型主要涉及GPU、FPGA、TPU、IPU、DPU、NPU等類別。從應用場景來看,AI芯片廣泛應用于云端、邊緣端、終端等各類場景,其中云端AI芯片具備高性能特征,終端AI芯片具有低功耗和高能效特性,而邊緣端AI芯片性能介于云端和終端之間。
目前,評價AI芯片性能的指標主要包括:TOPS、TOPS/W、時延、成本、功耗、可擴展性、精度、適用性、吞吐量、熱管理等。其中,TOPS/W是用于度量在1W功耗的情況下,芯片能進行多少萬億次操作的關鍵指標。近年來,MIT、Nvidia等研發人員開發專門的芯片軟件評價工具對于AI芯片的性能做出了系統、全面評價,如Accelergy(評估芯片架構級能耗)、Timeloop(評估芯片運算執行情況)等。MLPerf是由來自學術界、研究實驗室和相關行業的AI領導者組成的聯盟,旨在“構建公平和有用的基準測試”,可用于衡量深度學習軟件框架、AI芯片和云平臺性能。
CPU作為通用處理器,包含控制單元(指令讀取及指令譯碼)、存儲單元(CPU片內緩存和寄存器)及運算單元(ALU約占20%CPU空間)三個主要模塊,但受制于成本/功耗/技術難度/算力瓶頸等問題,目前仍未出現適配AI高算力要求的主流CPU產品。GPU是一種由大量核心組成的大規模并行計算架構,擁有較多運算單元(ALU)和較少緩存(cache),是一款專為同時處理多重任務而設計的芯片,具備良 好的矩陣計算能力和并行計算優勢,能滿足深度學習等AI算法的處理需求,成為主流云端AI芯片。
英偉達A100芯片為多個SM單元(Streaming Multiprocessors,流式多處理器)構成的并發多核處理器,不同SM單元共享L2 Cache存儲資源進行數據訪存,A100的安培架構中有128個SM核,SM結構是芯片架構升級的核心。Tensor Core是英偉達GPU架構中專為深度學習矩陣運算設置的張量計算單元,是英偉達GPU系列深度學習運算加速的核心。Tensor Core處理的是大型矩陣運算,其執行一種專門的矩陣數學運算,適用于深度學習和某些類型的高性能計算。Tensor Core功能是執行融合乘法和加法的運算,其中兩個4*4 FP16矩陣相乘,然后將結果添加到4*4 FP32或FP64矩陣中,最終輸出新的4*4 FP32或FP64矩陣。
AIoT通過融合AI和IoT技術實現萬物智聯,其主要涉及到安防、移動互聯網等多樣化場景。在智慧安防方面,由于終端攝像頭每天產生大量的視頻數據,若全部回傳到云數據中心將會對網絡帶寬和數據中心資源造成極大占用。通過在終端加裝AI芯片,可實現數據本地化實時處理,即僅將經過結構化處理、關鍵信息提取后帶有關鍵信息的數據回傳云端,大大降低網絡傳輸帶寬壓力。當前主流解決方案為前端攝像頭設備內集成AI芯片,在邊緣端采用智能
服務器級產品,后端在邊緣服務器中集成智能推理芯片。目前國內外企業正在加大對邊緣端AI視覺處理芯片的研發和投入,相關芯片產品如英偉達Jetson AGX Xavier、地平線旭日3、華為海思Hi3559A V100等。
隨著智能駕駛等級的提高,技術不斷迭代促使車用AI芯片性能逐步增強。SAE(國際自動機工程師學會)將自動駕駛劃分為六個級別:L0(非自動化)、L1(駕駛員輔助)、L2(部分自動化,如交通擁堵輔助和高級緊急制動+轉向)、L3(有條件自動化,如高速道路自動駕駛)、L4(高度自動化,如城市自動駕駛)和L5(完全自動化,如全場景自動駕駛)。從L3開始每一級別均需要強大的算力進行實時分析,處理大量數據,執行復雜的邏輯運算,對計算能力有著極高要求。每一級別自動駕駛汽車所需的芯片計算能力一般認為是:L3約為250TOPS,L4超過500TOPS,L5超過1,000TOPS。隨著芯片設計和制造工藝的提高,車用AI芯片正朝著高算力、低功耗的方向發展。
▲全球主要車用AI芯片概覽
預計到2025年,全球車用AI芯片市場規模將突破17億美元。隨著汽車控制方式逐漸由機械式轉向電子式,每輛汽車對車用AI芯片需求提升,帶動車用AI芯片長期發展。根據Yole預測,2025年全球車用AI芯片產量將達到67.19億顆,市場規模將達到17.76億美元,年復合增速分別達到99.28%和59.27%。此外,車用AI芯片逐漸往高能效方向發展,如英特爾2022年推出的EyeQ Ultra自動駕駛汽車芯片,基于經過驗證的Mobileye EyeQ架構而打造,其含有8個PMA、16個VMP、24個MPC、2個CNN Accelerator視覺處理單元(VPU),通過優化算力和效能以達到176TOPS,可滿足L4自動駕駛場景,該產品將于2023年底供貨,預計在2025年全面實現車規級量產。
▲2021-2025年全球車用AI芯片產量
▲2021-2025年全球車用AI芯片市場規模
AI芯片在圖像識別、語音識別和快速建立用戶畫像等方面具有重要作用。根據Yole預測,2026年全球消費電子AI芯片市場規模將達到55.8億美元,其中筆記本電腦、平板電腦和智能手機AI芯片滲透率將分別達到100%、100%和91%,未來全球消費電子AI芯片市場規模和滲透率呈現逐步增長態勢。
▲2021-2026年全球消費電子AI芯片市場規模及滲透率
三、人工智能趨勢展望
1、前沿技術
Transformer模型:由Google的Ashish Vaswani等人和多倫多大學的Aidan N.Gomez于2017年首次提出,是一種基于自注意力機制(在Transformer模型中起基礎作用,可減少對外部信息的依賴,更擅長捕捉數據或特征的內部關系,優化模型訓練結果)的深度學習模型,該模型主要由
編碼器和
解碼器構成,模型本身并行度較高,在精度和性能上均要優于傳統的循環神經網絡(RNN)和卷積神經網絡(CNN)。Transformer模型在簡單語言問答和語言建模任務上有著較好表現。Transformer模型仍存在一些不足,如對局部信息的獲取能力弱于RNN和CNN、不能很好表征單詞的位置信息、頂層梯度消失等問題。
▲Transformer模型
BERT模型:由Google于2018年提出,是基于Transformer Encoder構建的一種模型。模型基本思想:給定上下文來預測下一個詞。BERT模型架構是由多接口組成的Transformer編碼器層,即全連接神經網絡增加自注意力機制。對于序列中的每個輸入標記,每個接口計算鍵、值和查詢向量,相關向量用于創建加權表示,合并同一層中所有接口輸出并通過全連接層運行。每個層使用跳躍連接進行包裝,之后將層歸一化處理。BERT模型傳統工作流主要包含預訓練和模型微調兩部分,其中預訓練環節涉及MLM和NSP兩個半監督任務;模型微調環節包含一個或更多全連接層,通常增加到最終編碼器層的頂部。BERT模型已集成在谷歌搜索中,并提升10%的查詢準確率。
▲BERT模型(Bidirectional Encoder Representation from Transformer)
ViT模型(Vision Transformer):由Google公司Alexey Dosovitskiy等人在2021年提出,其原理是將原本用于NLP領域的基于自注意力機制的Transformer模型應用于計算機視覺領域。相比于傳統CNN算法,ViT模型在大數據集上識別率更高、成本更低。ViT模型的基本原理:1)將圖片切分為相同大小的塊,每個塊可以看做一個“單詞”;2)每個塊經過線性投射層(全連接層)的操作得到位置編碼(圖像分類問題轉化為NLP問題);3)將線性投射后的圖像塊輸入由L層Transformer模型構成的編碼器;4)輸出結果經過多層感知機(MLP)得到最終分類結果。目前,ViT已發展出多種改進模型,在計算機視覺物體檢測等方面具有很大應用潛力。
▲ViT模型(Vision Transformer)
自監督學習(Self-supervised Learning):旨在對于無標簽數據,通過設計輔助任務來挖掘數據自身的表征特性作為監督信息,來提升模型的特征提取能力,將無監督問題轉化為有監督問題的方法。輔助任務是自監督學習最關鍵內容,目前主要包括自然語言處理NLP和計算機視覺CV兩大類任務。其中,自然語言處理包括單詞預測、句子序列預測、詞序列預測;計算機視覺包括圖像任務、視頻任務等。著名AI科學家Yann Lecun曾經提出,如果將人工智能比作一塊蛋糕,蛋糕的大部分是自監督學習,蛋糕上的糖衣是監督學習,蛋糕上的櫻桃是強化學習,自監督學習在人工智能領域占據重要地位。
▲自監督學習(Self-supervised Learning)
類腦計算(Brain-Inspired Computing):又稱神經形態計算,是借鑒生物神經系統信息處理模式和結構的計算理論、體系結構、芯片設計以及應用模型與算法的總稱。類腦計算可模擬人類大腦信息處理方式,以極低的功耗對信息進行異步、并行、高速和分布式處理,并具備自主感知、識別和學習等多種能力,是實現通用人工智能的途徑之一。2020年10月,清華大學張悠慧等人在Nature雜志發表論文,首次提出“類腦計算完備性”,填補類腦研究完備性理論與相應系統層次結構方面的空白。類腦計算技術的發展將推動圖像識別、語音識別、自然語言處理等前沿技術的突破,有望推動新一輪技術革命。
▲類腦計算(Brain-Inspired Computing)
AI大模型(Foundation Models):是指經過大規模數據訓練且在經微調后即可適應廣泛下游任務的模型。隨著參數規模不斷擴大,AI大模型在語言、視覺、推理、人機交互等領域涌現出新能力。由于各類AI大模型可有效應用于多種任務,各類AI大模型同質化特征愈發明顯。伴隨2017年Transformer模型的提出,深度學習模型參數數量突破1億個。此后,模型參數數量迅速增長,其中BAGUALU模型于2021年7月發布,參數規模已達到174萬億個。模型參數規模的增大,有助于進一步提高模型的運算精度。AI大模型的應用向多個應用場景提供預訓練方案,其使用的自監督學習方法也可減少標注數據的使用,降低訓練研發成本。具體而言,AI大模型在醫療和生物醫藥、法律和教育等領域擁有廣闊應用前景。
▲AI大模型(Foundation Models)
2、產業融合
元宇宙(Metaverse):本質上是對現實世界的虛擬化、數字化過程,其主要包括基礎設施、人機交互、空間計算等七層架構,其中計算機視覺、AI芯片和嵌入式AI等人工智能技術及基礎設施共同助力元宇宙加速落地。元宇宙涵蓋芯片、云計算、技術平臺、通信、智能設備、內容服務等龐大生態系統。當前全球科技企業紛紛投入到元宇宙建設熱潮中,如Nvidia、Meta、Microsoft等科技巨頭及國內企業推出元宇宙解決方案,應用于辦公、娛樂、設計等領域。
▲元宇宙七層經典架構(The Seven Layers of the Metaverse)
人工智能與生命科學:AlphaFold是由谷歌旗下DeepMind團隊基于深度學習算法的蛋白質結構預測的人工智能系統,其被視作人工智能深入到生物領域的一大突破。目前AlphaFold已對98.5%的人類蛋白質結構做出預測,此外還對于大腸桿菌、果蠅、斑馬魚、小鼠等研究時常用生物的蛋白質結構進行預測。DeepMind與歐洲生物信息研究所(EMBL-EBI)聯合發布由AlphaFold預測的蛋白質結構數據庫―AlphaFold Protein Structure Database,該數據庫已包含約35萬個蛋白質結構。
人工智能與新冠疫情:Eva是用于檢測入境旅客新冠病毒的強化學習系統,其由美國南加州大學、美國賓夕法尼亞大學、AgentRisk以及希臘相關專家合作開發。2020年,Eva系統被部署到希臘所有入境口岸(機場、港口、車站等),用于識別限制新冠無癥狀旅客入境。借助Eva系統,希臘每天對抵達或途經該國大約41,000戶家庭中約17%人員進行檢測。通過比較,Eva發現感染的旅行者比原先嚴格按照其國籍檢測的方式多1.25-1.45倍。與隨機檢測相比,Eva在旅游旺季發現感染的旅行者是前者的4倍,非旅游旺季的結果是隨機檢測的1.85倍,取得良好檢測效果。
人工智能與半導體:功耗、性能和面積(PPA)是芯片設計中的三個重要優化指標。為使PPA優化結果更佳,同時為應對芯片安全性需求提升、設計規模攀升及工藝節點微縮等趨勢,EDA廠商開始利用AI技術解決半導體芯片設計問題。在EDA中,數據快速提取模型、布局和布線、電路仿真模型、PPA優化決策等環節均有AI技術參與。AI應用于EDA主要有兩種形式:1)應用于EDA工具以優化單一芯片設計環節,如Google、西門子EDA;2)應用于整體芯片設計流程優化,如Cadence、Synopsys。此外,華大九天、臺積電等公司亦將AI納入芯片生產各個環節。將AI與芯片設計工作結合,不僅有助于釋放人力成本、提升工作效率,還將進一步弱化人在其中的作用,甚至可能改變EDA產業格局。
▲EDA企業AI技術應用案例
人工智能與碳中和:自2015年第21屆聯合國氣候變化大會后,碳中和已成為全球共識。當前,碳中和已獲得全球超過40個國家和地區承諾,其中大部分國家宣布將于2050年左右實現碳中和目標。從整體來看,人工智能將從預測、監測、優化三大環節助力碳中和,如預測未來碳排放量、實時監測碳足跡、優化工作流程等。根據BCG數據,到2030年人工智能的應用有望減少26-53億噸二氧化碳排放量,占全球減排總量5-10%。從行業來看,人工智能在不同領域及不同環節發揮重要作用,其主要在城市、制造、汽車、電力四大領域助力“碳中和”。
人工智能與冬奧會:2022年2月,第24屆冬季奧林匹克運動會成功在北京舉辦。人工智能技術在冬奧會開幕式、比賽項目、運動員訓練等多個場景實現應用,助力科技冬奧目標實現。Intel打造的3DAT技術,一方面可以幫助教練員提出科學訓練計劃,有效提升運動員訓練效率,同時還可以在開幕式中實現與演員互動效果;商湯科技為冬奧會冰壺比賽打造的“冰壺運動軌跡捕捉”技術,實現對冰壺檢測追蹤和軌跡捕捉。未來,人工智能與體育賽事、體育運動的融合程度將逐步加深。
3、熱點問題
人工智能產業發展的路徑探究:結合人工智能產業特點,梳理出“創新投入―科研成果―商業化落地”的發展路徑。其中,創新投入主要涉及人才投入、資本投入和要素投入;科研成果涵蓋論文、開源軟硬件和專利;商業化落地包含AI產品、AI解決方案和AI平臺。當前人工智能產業從投入端到科研成果端發展較快,人工智能在學術研究領域不斷取得突破。但另一方面,人工智能從技術成果到商業化落地環節仍面臨諸多挑戰,如算法訓練的通用性不強、泛化能力不強、商業化成本較高、相關產業及企業對于人工智能技術接受程度不高等問題,需要不斷從政策機制、技術發展以及管理層觀念等方面不斷完善,才能最終推動人工智能在商業化方面實現快速發展。
倫理與安全:隨著人工智能技術的高速發展與普及應用,由其產生的倫理與安全問題日益受到關注。人工智能不但延續信息技術的倫理問題,又因深度學習算法具有不透明、難解釋、自適應、運用廣泛等特征而在基本人權、社會秩序、國家安全等方面產生新問題。人工智能典型倫理問題包括:威脅公民生命安全、算法歧視、威脅隱私權、影響公民知情權和監督權、虛假信息泛濫、破壞市場競爭環境、引起權力結構變化、影響勞動者權益、AI武器威脅世界和平等問題。目前,全球人工智能治理尚處于初期探索階段,各國正加大人工智能領域的治理力度,出臺人工智能倫理相關制度,以預防AI在應用過程中產生的風險。未來,全球人工智能治理將由準則向操作指南、行業標準等層面逐步深入,加快構建人工智能國際治理體系。
就業:人工智能將通過改變勞動分工與人力資本價值結構深刻影響就業市場。AI與勞動力就業關系包含三個方面:1)當AI成本低于勞動力工資水平、且產品附加值又不足以彌補用工成本時,AI應用將直接替代相應勞動崗位;2)AI應用填補勞動者無法勝任的崗位,既可降低錯誤率,提高產品質量,也可保護人身安全和健康;3)AI應用催生新工作崗位,AI帶來生產生活方式的變革與社會效率的提高,全社會產能實現躍升,進一步產生新工作崗位。世界經濟論壇發布的《2020未來就業報告》預計,到2025年,機器可能會取代8,500萬個工作崗位,在AI推動下經濟增長會產生9,700萬個新崗位。隨著AI技術發展,工作崗位、員工技能和任務類型將重塑,就業替代呈現行業性特征,總體就業崗位數量仍將上升。
國家間技術限制:當前,開源深度學習框架、開源工具集、開源應用軟件快速發展,國際間AI技術交流不斷深入,但部分國家和政府間組織為保持自身AI技術優勢,限制AI技術交流。如美國在2021年6月發布《創新與競爭法案》,在AI、無人機、芯片等多個領域限制與中國合作;美國商務部于2019年10月和2020年5月將商湯科技、科大訊飛等多家中國AI公司加入其實體清單,實施投資限制;2022年白宮修訂“關鍵和新興技術(CET)清單”,對AI技術具體分類并實行技術封鎖。歐盟則于2021年9月通過最新出口管制法規,內容涵蓋人臉識別等AI技術。上述相關政策與未來人工智能發展趨勢背道而馳,不利于各國開展技術合作。
智東西認為,人工智能在60多年的發展過程中經歷了幾度起落。近年來,移動互聯網高速發展帶來的海量數據、深度學習算法的持續發展等共同推動人工智能技術在多個領域取得突破,與之前技術革命中的蒸汽機、電力等新技術相比,人工智能對經濟社會的影響將更具顛覆性,成為新一輪科技革命和產業變革的重要驅動力量。