隨著我國大數據產業政策日趨完善、產業基礎日益鞏固、數據要素市場建設不斷深化,大數據產業再次迎來巨大發展空間。日前,《2023大數據十大關鍵詞》在2023大數據產業發展大會主論壇上正式發布。
大數據十大關鍵詞是基于信通院長期對產業的研究與觀察,充分結合了行業一線專家的觀點,希望能夠預示大數據產業當前發展的熱點方向。
數據從計算機語言到成為生產要素的全生命周期包括以下七個環節,數據資源化、數據治理、數據資產化、數據開發應用、數據流通、數據要素市場建設、數據安全。今年的十大關鍵詞中有四項分布于數據開發應用環節,兩項分布于數據要素市場環節,兩項分布于數據安全環節,體現出了今年發展的重點在于數據的業務賦能與內外部融通,以及繼續夯實安全基礎。
關鍵詞一
湖倉一體,數據平臺發展進入融合一體化新階段
隨著移動互聯網飛速發展,為滿足多種數據類型存儲、多場景分析等業務訴求,部分企業采用在一個數據平臺之上混合部署數據湖和數據倉庫,通過ETL進行數據交換的業務架構。這一湖+倉混合架構存在存儲成本高、時效性差、易出現一致性問題、開發運維難度高四大問題。
為解決上述問題,湖倉一體技術應運而生,湖倉一體是融合數據湖與數據倉庫的優勢,形成一體化、開放式的數據處理平臺,底層支持多數據類型統一存儲,實現了一份數據、一套任務在數據湖、數據倉庫之間無縫調度和管理,上層則通過統一接口進行訪問查詢和分析。湖倉一體打破了數據倉庫與數據湖之間的壁壘,構建在數據湖低成本的數據存儲架構之上,同時具備數據倉庫的數據處理和管理能力。隨著各行業數字化轉型的不斷推進,湖倉一體平臺市場需求持續增長,亞馬遜、阿里云、騰訊云等廠商紛紛推出湖倉一體產品,并在互聯網、電信、金融等行業得到廣泛應用。
關鍵詞二
數據資產化,產學研齊推進,關鍵環節有望突破
以加快培育發展數據要素市場為最終目標,產學研各界紛紛開展數據資產化研究與實踐。
政策方面,中共中央 國務院于2022年12月發布了“數據二十條”,明確提出“培育數據要素流通和交易服務生態。培育一批數據商和第三方專業服務機構,為數據交易雙方提供數據資產的合規化、標準化、增值化服務,探索數據資產入表新模式”。
近三年,數據資產化實踐如火如荼。數據權屬方面,以數據交易所和知識產權局為代表的機構提出了數據資產登記的要求,為數據資產規范交易奠定基礎。數據估值方面,數據資產估值的目的和對象逐漸清晰,企業關注點從數據應用價值視角向數據資本視角轉移,例如光大銀行根據前期的研究基礎,完成對貴陽移動金融發展有限公司授信1000萬元,是數據估值實踐的一大突破。數據入表方面,財政部會計司于去年發布了《企業數據資源相關會計處理暫行規定(征求意見稿)》,提出根據數據資源的持有目的、形成方式等,對數據資源相關交易和事項進行會計確認、計量和報告,為數據資產入表提供了一種思路。場內數據交易方面,以北京、上海、貴陽、深圳等為代表的數據交易所紛紛搭建了交易平臺,構建交易生態圈,推動交易市場健康有序發展。
信通院云大所在數據資產化方面的工作也作出了相關部署。一是聯合大數據局、通信、金融等機構,發布數據估值標準;二是聯合數據交易所開展數據產品的數據質量評估;三是制定了數據資產運營能力成熟度的標準。
關鍵詞三
DataOps,標準引領,國內DataOps已進入規模落地階段
數據研發運營一體化(DataOps)是數據開發的新范式,它將敏捷、精益等理念融入數據開發過程,通過對數據相關人員、工具和流程的重新組織,打破協作壁壘,構建集開發、治理、運營于一體的自動化數據流水線,不斷提高數據產品交付效率與質量,實現高質量數字化發展。
隨著產業實踐的與理論研究發展,DataOps已從模糊的概念期逐步演化至落地實踐階段。2022年,中國信通院與多家頭部的通信、金融、互聯網企業共同成立DataOps標準工作組,并發布《DataOps能力框架模型》,定義了DataOps的七大能力域;2022年底,工作組發布研發管理能力域的細化標準。2023年上半年,工作組發布《DataOps實踐指南(1.0)》,從最佳實踐中抽象DataOps的理論框架,為產業界實踐DataOps提供理論參考;中國信通院依據DataOps研發管理能力域標準,開展評估貫標工作,驗證了工行、農行、浙江移動、江蘇移動等領先企業在數據研發管理方面的能力,以評促建,推動這些機構完善自身能力。同時我們還發起了“DataOps社區”,目前有130家機構加入,根據調研,這些機構均已經開展DataOps相關實踐,國內DataOps已經進入規?;涞仉A段。
關鍵詞四
數據服務,服務體系建設成為數據中臺發展規劃的重點
數據中臺的重要職能是面向業務方提供基于數據的自助分析、模型管理、接口調用、指標和標簽管理等多樣化的能力支持。數據服務是數據中臺對外進行能力輸出的出口。數據服務體系的建設可使業務方更為便捷的檢索并獲取所需要的數據內容,從而更好地發揮數據中臺的賦能價值。隨著各方數據中臺底層能力建設的逐步成熟,數據服務成為了數據中臺建設的重點方向??焓?、建設銀行以及中國移動等各領域頭部企業的數據中臺團隊均將數據服務能力建設作為2023年工作的重點。數據服務能力的建設方向主要有以下三個:一是構建多樣化的數據服務方式,以滿足不同業務需求;二是整合分散的數據服務平臺,構建統一的數據服務用戶界面,實現服務門戶一體化;三是完善數據服務的全生命周期運營管理,實現服務運營規范化。通過提供多樣化的數據服務、一體化的數據服務門戶,以及規范化的數據服務運營,企業能夠讓更多的用戶高效地使用數據中臺的各項能力,從而充分地發揮數據中臺價值。
2022年4月至今,信通院牽頭聯合行業專家和頭部企業共同編制《數據中臺能力成熟度模型》系列標準,數據服務能力作為數據中臺六大能力域之一納入到了該標準體系。2023年上半年,浙江移動、工商銀行完成了基于該標準的首批數據服務能力評估。
關鍵詞五
智能增強分析,數據分析的智能化升級
智能增強型數據分析工具是通過機器學習、自然語言處理等智能化技術提升數據分析流程中的數據準備、洞察發現、結果輸出共享三方面能力,從而提升數據分析工作的自動化程度。此概念由gartner于2017年提出,但受限于當時的AI技術水平,該領域并未取得突破性的發展。隨著2023年AIGC技術的火熱,其在數據分析領域的應用也受到了各方關注。微軟PowerBI、百度SugarBI、觀遠BI等團隊紛紛加快智能增強型數據分析方向的探索和布局,并推出以BI+大模型為理念的智能增強型分析工具。智能增強型數據分析工具使用戶能通過對話式的形式同工具進行交互;工具通過語義解析,調用相關的數據源,適配相應的分析算法和數據可視化呈現方式,并自動生成統計圖表、文字見解和分析報告;智能增強型數據分析工具使得數據分析工作可以通過類似聊天的形式輕松完成,使非技術背景的用戶能夠以更低的門檻、更高的效率實現具有一定深度的分析,使數據能夠賦能于更多一線人員,這將極大地促進數據分析工作的普惠化發展。
關鍵詞六
數據倫理,國家數字經濟治理體系重要組成部分
大數據、人工智能等新技術的蓬勃發展促進了科技創新和經濟發展。但大數據應用的負面效益也不容忽視,如大數據殺熟、隱私數據泄露、數據濫用、不良內容推薦等現象層出不窮,人類基于傳統生活世界的倫理價值也面臨著巨大挑戰。因此,自2021年開始,我國針對數據安全、個人信息保護、科技倫理等問題陸續出臺多項法律法規旨在搭建數據倫理治理框架,持續推進科技向善發展;縱觀國際社會,美國自2020年開始加速數據倫理體系的布局,目前已涵蓋理論框架、實踐指引、相關立法三個層面。為了更好的治理細分領域數據倫理問題,2023年2月美商務部發布的《商業數據倫理框架》是其在商務領域的補充。由此可見,建立完善的數據倫理治理體系是保障數字經濟健康發展的必要條件,需要政府、企業和社會各方面的共同努力。
關鍵詞七
數據基礎制度,破解數據要素價值釋放難題
去年年底,中共中央、國務院印發《關于構建數據基礎制度 更好發揮數據要素作用的意見》,也就是“數據二十條”。這是我國首部從生產要素高度部署數據要素價值釋放的國家級專項政策文件,具有里程碑式的重大意義?!皵祿畻l”綱舉而目張,首先明確了構建數據基礎制度、發揮數據要素作用的前提、主線和目標,即在維護國家數據安全、保護個人信息和商業秘密的前提下,促進數據合規高效流通使用、賦能實體經濟,從而充分實現數據要素價值、促進全體人民共享數字經濟發展紅利。進一步地,“數據二十條”具體提出了適應數據特征、符合發展規律、彰顯創新引領的數據基礎制度體系,具有獨特的政策設計,即以基礎制度破解數據要素價值釋放中的基礎性問題。保障權益、合規使用的數據產權制度,合規高效、場內外結合的數據要素流通和交易制度,體現效率、促進公平的數據要素收益分配制度,安全可控、彈性包容的數據要素治理制度,這四大制度構成了數據基礎制度的“四梁八柱”,為進一步推動數據要素價值釋放指明了方向。
關鍵詞八
公共數據授權運營,全國各地廣泛開展,走向規?;c規范化
2022年12月,“數據二十條”發布,提出要建立公共數據確權授權機制,為此前公共數據開發利用中存在爭議的“所有權”問題提供了一種合理解決思路,為公共數據授權運營帶來了全新機遇。
前期,北京、海南、貴州、成都等地區積極開展各類創新實踐探索,基本形成了公共數據的授權運營模式。公共數據管理機構進行資源整合,統一推進開發利用,授權運營機構或加工方進行數據處理加工,以產品或服務的形式進入市場,提供給應用方。
2023年以來,在“數據二十條”指導下,各地方積極落實了針對性舉措。一是杭州、濟南、青島、武漢、煙臺、鄭州等地相繼發布公共數據授權運營管理辦法,推進建立工作機制。二是河南、福建、湖北、湖南、蘇州等地相繼成立地方數據集團公司作為開展授權運營的市場主體,推動公共數據與社會數據融合開發利用。
人社部、民航局、最高法等行業主管部門也開展了以行業為單位的探索,形成了電子社保卡、航旅縱橫、司法大數據服務網等產品及服務,為公共數據價值釋放提供新思路。
但目前為止,公共數據尚未形成統一的授權運營機制,實踐中存在風險和挑戰,還需要探索更完善的標準規范體系,從運營主體能力、運營平臺技術、運營成果等方面切入,促進規范化發展。
關鍵詞九
數據安全風險評估,數據安全治理的重要抓手
數據要素市場化發展的不斷演進對數據安全底座能力的要求不斷提升。數據安全風險評估作為數據安全治理能力提升的關鍵環節,一方面受國家各項政策驅動備受關注,另一方面隨著數據泄露等事件的愈演愈烈,基于風險防范目標而開展的數據安全工作也成為業務數字化健康發展中的必選題。因此,數據安全風險評估正在成為數據安全治理的重要抓手,國家也在標準化工作、實踐指南等方面做出了相應探索。此前,中國信通院也提出了基于系統管理安全、系統數據安全、系統應用安全的數據安全風險評估框架,助力企業數據安全風險防范。
關鍵詞十
數據出境,三條路徑從理論走向實踐
隨著2023年6月1日《個人信息出境標準合同辦法》的正式施行,數據出境話題再次引發熱議。自國家網信辦發布第一版《數據出境安全評估申報指南》,各省市積極跟進響應,或開展解讀活動,或發布當地申報指南,為出境評估工作的順利開展探索實踐路徑。同時,個人信息保護認證、個人信息出境標準合同辦法也進入大眾視野。三條出境路徑各有適用場景,互為補充,為數據出境工作的落地實踐提供指導。
最后,對其總結可以發現,2023大數據十大關鍵詞涵蓋政策、理念、安全、技術等等支撐數據要素價值釋放的方方面面,表明我國大數據產業已形成政策引領、理念先行、技術支撐、安全護航的健康發展格局。