中文字幕无码久久精品,13—14同岁无码A片,99热门精品一区二区三区无码,菠萝菠萝蜜在线观看视频高清1

您當前的位置是:  首頁 > 資訊 > 人物 >
 首頁 > 資訊 > 人物 >

梅宏院士等發(fā)布最新論文《大數(shù)據(jù)技術前瞻》指出大數(shù)據(jù)技術的四大挑戰(zhàn)與十大趨勢

2023-01-31 15:57:37   作者:   來源:通信世界網(wǎng)   評論:0  點擊:


  中科院院士梅宏聯(lián)合中國人民大學、華中科技大學、中科院計算技術研究所、中國科學院大學、北京理工大學多位專家,發(fā)布最新論文《大數(shù)據(jù)技術前瞻》。該文在計算體系重構的背景下,指出了大數(shù)據(jù)技術發(fā)展的四大技術挑戰(zhàn)和十大發(fā)展趨勢。

  新型大數(shù)據(jù)系統(tǒng)技術的四大挑戰(zhàn)

  挑戰(zhàn)一:如何構建數(shù)據(jù)為中心的計算體系

  全球大數(shù)據(jù)規(guī)模增長快速,2020年全球新增數(shù)據(jù)規(guī)模為64ZB,是2016年的400%,2035年新增數(shù)據(jù)將高達2140ZB1,大數(shù)據(jù)呈現(xiàn)指數(shù)級增長。隨著數(shù)字經(jīng)濟的發(fā)展和數(shù)字化轉(zhuǎn)型的深入,愈來愈多的數(shù)據(jù)資源正以數(shù)據(jù)要素的形態(tài)獨立存在并參與數(shù)字經(jīng)濟活動全過程。因此構建以數(shù)據(jù)為中心的新型計算體系,以適用新的應用環(huán)境。如何組織和管理超大規(guī)模的數(shù)據(jù)要素已經(jīng)成為一項難題:例如,針對大數(shù)據(jù)管理,面臨數(shù)據(jù)跨域訪問帶來的各種問題、系統(tǒng)規(guī)模持續(xù)增大帶來的可用性下降、維護大規(guī)模數(shù)據(jù)帶來的成本和能耗持續(xù)增高等嚴峻挑戰(zhàn)。

  挑戰(zhàn)二:如何滿足大數(shù)據(jù)高效處理的需求

  數(shù)據(jù)規(guī)模呈指數(shù)級增長,數(shù)據(jù)動態(tài)傾斜、稀疏關聯(lián)、應用復雜,傳統(tǒng)大數(shù)據(jù)處理架構數(shù)據(jù)處理成本高企、時效性差,如何滿足規(guī)模海量、格式復雜、需求多變的大數(shù)據(jù)高效處理需求是大數(shù)據(jù)處理面臨的重要挑戰(zhàn)。

  挑戰(zhàn)三:如何實現(xiàn)多源異構大數(shù)據(jù)的可解釋性分析

  隨著數(shù)據(jù)量持續(xù)地爆炸式增長和各類應用的不斷拓展與深化,基于深度學習的主流方法因其僅關注單源單模態(tài)數(shù)據(jù)且模型只知其然不知其所以然的特性已無法滿足發(fā)展需求。如何打破數(shù)據(jù)多源異構造成的隔閡,融合多域甚至全域數(shù)據(jù)中蘊含的知識,實現(xiàn)分析結果的可解釋,從而提升其可用性,是當前大數(shù)據(jù)分析面臨的主要挑戰(zhàn)。

  挑戰(zhàn)四:如何形成系統(tǒng)化大數(shù)據(jù)治理框架與關鍵技

  針對大數(shù)據(jù)應用過程中的對數(shù)據(jù)匯聚融合、質(zhì)量保障、開放流通、標準化和生態(tài)系統(tǒng)建設的需求,大數(shù)據(jù)治理技術逐漸成為發(fā)展熱點,然而當前系統(tǒng)化的大數(shù)據(jù)治理框架尚未形成,開放共享、質(zhì)量評估、價值預測等關鍵技術遠未成熟,成為制約大數(shù)據(jù)發(fā)展的主要瓶頸。

  大數(shù)據(jù)技術十大未來發(fā)展趨勢

  趨勢一:數(shù)據(jù)與應用進一步分離,實現(xiàn)數(shù)據(jù)要素化

  數(shù)據(jù)從一開始是依附于具體應用的。數(shù)據(jù)庫技術的出現(xiàn)使得數(shù)據(jù)與應用實現(xiàn)了第一次分離。數(shù)據(jù)存儲在數(shù)據(jù)庫中,不再依賴具體的應用而存在。數(shù)據(jù)要素化的需求將推動數(shù)據(jù)與應用進一步分離,數(shù)據(jù)不再依賴于具體的業(yè)務場景,數(shù)據(jù)以獨立的形態(tài)而存在于數(shù)據(jù)庫中,并通過數(shù)據(jù)服務向不同的業(yè)務場景提供服務。例如,人口數(shù)據(jù)庫,可以向全部的涉及人口信息的業(yè)務場景提供服務。

  趨勢二:數(shù)聯(lián)網(wǎng)作為數(shù)字化時代的新型信息基礎設施

  將形成一套完整的數(shù)聯(lián)網(wǎng)基礎軟件理論、系統(tǒng)軟件架構、關鍵技術體系,包括:針對數(shù)聯(lián)網(wǎng)軟件以數(shù)據(jù)為中心的特點,需要從復雜網(wǎng)絡和復雜系統(tǒng)等復雜性理論出發(fā),研究數(shù)聯(lián)網(wǎng)軟件的結構組成、行為模式和外在性質(zhì);針對數(shù)聯(lián)網(wǎng)軟件的數(shù)據(jù)傳存算一體化需求,需要采用數(shù)據(jù)互操作技術和軟件定義思想,研究數(shù)聯(lián)網(wǎng)軟件運行機理、體系結構與關鍵機制;針對數(shù)聯(lián)網(wǎng)軟件跨層級、跨地域、跨系統(tǒng)運行帶來的可靠性、可用性、安全性等質(zhì)量挑戰(zhàn),需要以數(shù)據(jù)驅(qū)動為手段,研究數(shù)聯(lián)網(wǎng)環(huán)境下保障服務質(zhì)量與保護質(zhì)量的原理、機制與方法。

  趨勢三:從單域到跨域數(shù)據(jù)管理,促進數(shù)據(jù)要素的共享與協(xié)同

  數(shù)據(jù)為中心計算的核心目標是數(shù)據(jù)價值的最大化,關鍵要打破“數(shù)據(jù)孤島”,實現(xiàn)數(shù)據(jù)要素的高效共享與協(xié)同。傳統(tǒng)數(shù)據(jù)管理局限在單一企業(yè)、業(yè)務、數(shù)據(jù)中心等內(nèi)部,未來大數(shù)據(jù)管理將從傳統(tǒng)的單域模式發(fā)展到跨域模式,跨越空間域、管轄域和信任域。但跨空間域造成網(wǎng)絡時延較高且不穩(wěn)定;跨管轄域造成數(shù)據(jù)與應用異構,數(shù)據(jù)管理復雜度大大提升;跨信任域則要求具備容忍各類惡意錯誤的能力,跨域帶來的這些變化將為大數(shù)據(jù)技術帶來了新的機遇和挑戰(zhàn)。

  趨勢四:大數(shù)據(jù)管理與處理系統(tǒng)體系結構異構化日趨明顯

  體系結構創(chuàng)新進入“黃金十年”,圍繞不同數(shù)據(jù)處理特征的新型加速器(GPU、TPU、APU 等各種xPU)層出不窮,存儲器件快速發(fā)展,高速SSD、新型非易失內(nèi)存、新型計算網(wǎng)絡等成為大數(shù)據(jù)處理系統(tǒng)的重要硬件配置,計算與存儲的融合趨勢明顯。為極大程度發(fā)揮數(shù)據(jù)管理能力,大數(shù)據(jù)管理系統(tǒng)在存儲、網(wǎng)絡、計算等硬件上最大化挖掘新型硬件的處理能力。在處理上針對不同數(shù)據(jù)處理需求,配置不同計算與存儲硬件成為大數(shù)據(jù)處理系統(tǒng)的主流架構。數(shù)據(jù)驅(qū)動的計算架構快速發(fā)展,從控制流到數(shù)據(jù)流到系統(tǒng)設計切換成為大數(shù)據(jù)處理系統(tǒng)從微觀到宏觀的重要體系結構設計理念。

  趨勢五:擴展性優(yōu)先設計到性能優(yōu)先設計

  數(shù)據(jù)規(guī)模急劇增長,大數(shù)據(jù)處理需求越來越走向深度價值挖掘,數(shù)據(jù)處理計算愈發(fā)密集,數(shù)據(jù)管理與處理的成本成為大數(shù)據(jù)管理與處理系統(tǒng)的重要考量因素,傳統(tǒng)“以擴展性優(yōu)先”的大數(shù)據(jù)處理系統(tǒng)設計將會被“以性能優(yōu)先”的系統(tǒng)設計所替代。Spark、Flink 等系統(tǒng)在大數(shù)據(jù)處理生態(tài)系統(tǒng)中的占有率明顯體現(xiàn)了這一趨勢,圖計算(圖加速器、圖計算框架等)、深度學習框架(Tensorflow、PyTorch 等)等領域?qū)S么髷?shù)據(jù)處理系統(tǒng)的崛起也是這一系統(tǒng)設計理念在技術生態(tài)上的表現(xiàn)。智能化數(shù)據(jù)管理、近似計算等新興管理與處理方法成為性能優(yōu)先設計的重要技術手段。

  趨勢六:近數(shù)處理成為突破大數(shù)據(jù)處理系統(tǒng)性能瓶頸的重要途徑

  存算一體類體系結構技術快速發(fā)展,新型SSD等新型存儲贏家功能愈發(fā)豐富,分布式計算系統(tǒng)邊緣能力迅速發(fā)展,以上三種體系結構技術發(fā)展為大數(shù)據(jù)近數(shù)處理提供了良好的發(fā)展契機。近數(shù)處理體現(xiàn)在“存儲上移”(如在GPU、FPGA 等計算設備上集成HBM)、“算力下沉”(如在DRAM 內(nèi)存或者SSD 存儲設備上集成處理能力)、“分布擴展”(如在云、邊、端分布式處理數(shù)據(jù),降低數(shù)據(jù)處理中心壓力)。

  趨勢七:從單域單模態(tài)分析到多域多模態(tài)融合,實現(xiàn)廣譜關聯(lián)計算

  傳統(tǒng)大數(shù)據(jù)分析技術大多僅聚焦于單一來源單一模態(tài)數(shù)據(jù),而實際應用中往往要對來自不同來源不同模態(tài)(如文本、圖像、音視頻等)的數(shù)據(jù)進行聯(lián)合分析,從而實現(xiàn)不同來源與不同模態(tài)數(shù)據(jù)之間的信息互補。此外,諸多領域的大數(shù)據(jù)往往具有重要的時空屬性,當前研究對這類信息的利用還不太充分。因此,探究能夠跨模態(tài)關聯(lián)、跨時空關聯(lián)的廣譜關聯(lián)技術是大數(shù)據(jù)分析處理的一個重要趨勢。

  趨勢八:從聚焦關聯(lián)到探究因果,實現(xiàn)分析結果可解釋

  如何讓大數(shù)據(jù)分析模型更加穩(wěn)定且具有可解釋性,從而使其分析結果對用戶而言變得更加可信、更為可用最好還能具備一定的可回溯性是大數(shù)據(jù)分析面臨的巨大挑戰(zhàn)。雖然已有因果推斷與可解釋性分析技術取得了一定進展,但總體來說尚處于起步階段,離實際應用還有很長一段距離。因此,從關聯(lián)到因果也是未來大數(shù)據(jù)分析技術的重要研究方向。

  趨勢九:高能效大數(shù)據(jù)技術是可持續(xù)發(fā)展的關鍵

  全球大數(shù)據(jù)的持續(xù)高速增長,尤其是碳達峰、碳中和目標的提出,要求大數(shù)據(jù)技術棧必須走低碳高效、可持續(xù)發(fā)展的路線。例如云數(shù)據(jù)管理系統(tǒng)以資源共享、節(jié)能高效為主要特點,將是未來大數(shù)據(jù)管理的主要基礎形態(tài);在云數(shù)據(jù)管理基礎上的全國一體化高能效大數(shù)據(jù)管理,可以進一步由于算力和數(shù)據(jù)要素的大規(guī)模調(diào)度與流通,將成為未來大數(shù)據(jù)管理的主要方向,形成低碳發(fā)展新格局。

  趨勢十:大數(shù)據(jù)標準規(guī)范和以開源社區(qū)為核心的軟硬件生態(tài)系統(tǒng)將成為發(fā)展的重點

  隨著大數(shù)據(jù)在各個領域應用的迅速普及,標準化需求將不斷增長,與大數(shù)據(jù)流動融合、質(zhì)量評估,及與行業(yè)、領域應用密切相關的大數(shù)據(jù)標準將成為發(fā)展重點。開源社區(qū)在大數(shù)據(jù)軟硬件生態(tài)建設中的地位不斷加強,對開源社區(qū)的主導權爭奪將成為各國技術、產(chǎn)品和市場競爭的重要戰(zhàn)場。

【免責聲明】本文僅代表作者本人觀點,與CTI論壇無關。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

相關閱讀:

專題

CTI論壇會員企業(yè)