CTI論壇(ctiforum.com)(編譯/老秦):實際上,每個企業(yè)都有大量的“黑暗數(shù)據(jù)”,以Weblog、機器日志和從石油鉆塔、渦輪引擎到醫(yī)院病人的各種傳感器的日志等形式存在著。問題是:你是否有計劃從你的黑暗數(shù)據(jù)中創(chuàng)造商業(yè)價值?
這是數(shù)據(jù)驅(qū)動的數(shù)字轉(zhuǎn)型時代。你的企業(yè)正在尋找方法與客戶進行更密切的接觸,改進決策,提高生產(chǎn)效率,或者提供更好的客戶體驗。你可能有大量的需要在內(nèi)部處理的數(shù)據(jù)。
這是數(shù)據(jù)驅(qū)動的數(shù)字轉(zhuǎn)型時代。你的企業(yè)正在尋找方法與客戶進行更密切的接觸,改進決策,提高生產(chǎn)效率,或者提供更好的客戶體驗。你可能有大量的需要在內(nèi)部處理的數(shù)據(jù)。
我們將“黑暗數(shù)據(jù)”定義為大型的、通常是非結(jié)構(gòu)化的數(shù)據(jù)集,這些數(shù)據(jù)集來自于內(nèi)部和外部資源,而這些數(shù)據(jù)目前并沒有用于創(chuàng)建提供業(yè)務(wù)價值的洞察力。可以利用黑暗數(shù)據(jù)來檢測客戶購買、金融交易欺詐、供應(yīng)鏈問題、衛(wèi)生保健行業(yè)適用模型、產(chǎn)品生命周期問題等關(guān)鍵模式。
挑戰(zhàn)在于能夠訪問和使用數(shù)據(jù)來傳遞有用的見解,從而驅(qū)動業(yè)務(wù)價值。黑暗數(shù)據(jù)本質(zhì)上是巨大的,非結(jié)構(gòu)化的,難以理解的。
不僅僅是數(shù)據(jù)量,數(shù)據(jù)復(fù)雜性是一個更大的問題。這些黑暗數(shù)據(jù)大多沒有結(jié)構(gòu),也沒有一個未知的結(jié)構(gòu),這使得要從中獲取有用的商業(yè)見解變得更加的困難。
利用這些極其龐大的數(shù)據(jù)集將推動生產(chǎn)力和創(chuàng)新的新浪潮。根據(jù)MGI和麥肯錫的商業(yè)技術(shù)辦公室的研究,企業(yè)將利用數(shù)據(jù)以多種方式創(chuàng)造價值:
- 通過使信息變得透明,數(shù)據(jù)可以在更大程度上用來提高盈利能力。
- 當(dāng)企業(yè)以數(shù)字形式創(chuàng)建和存儲越來越多的事務(wù)性數(shù)據(jù)時,他們可以收集精確的、詳細(xì)的性能數(shù)據(jù),以揭示變化和提高績效。
- 可以利用黑暗數(shù)據(jù)來檢測客戶購買、金融交易欺詐、供應(yīng)鏈問題、衛(wèi)生保健行業(yè)適用模型、產(chǎn)品生命周期問題等關(guān)鍵模式。
數(shù)據(jù)的黑暗面
有了所有的數(shù)據(jù)承諾,就有不利的一面。這些數(shù)據(jù)類型的特征不僅僅是數(shù)據(jù)量大,還包括它們的速率、多樣性和可變性。“數(shù)據(jù)漂移”通常用于描述這些新數(shù)據(jù)類型中數(shù)據(jù)的波動,這些數(shù)據(jù)對試圖收集和理解新數(shù)據(jù)的企業(yè)構(gòu)成了嚴(yán)重的挑戰(zhàn)。在2016年進行的一項調(diào)查中,25%的受訪者表示,他們放棄了從數(shù)據(jù)中獲得分析性見解的努力,因為他們無法衡量收集到的數(shù)據(jù)。每個人面臨的問題是,當(dāng)數(shù)據(jù)“漂移”時,可能導(dǎo)致數(shù)據(jù)集成中斷,并突然關(guān)閉業(yè)務(wù)流程。
不僅現(xiàn)有的數(shù)據(jù)管理架構(gòu)不適合處理這些文件,許多企業(yè)都缺少必要的分析和管理才能來驅(qū)動所有這些數(shù)據(jù)的價值。麥肯錫表示,僅美國就面臨缺乏深度分析技能人才的問題。
簡單地說,讓你的數(shù)據(jù)變得更有意義,更不要說把它轉(zhuǎn)換成可以讓你基于數(shù)據(jù)做出更好決策的工具,這是一項不可能完成的任務(wù)。在數(shù)字方面,世界上僅有不到0.5%的數(shù)據(jù)實際上正在被分析利用。企業(yè)數(shù)據(jù)豐富,但信息貧乏。
機器學(xué)習(xí)的承諾:
機器學(xué)習(xí)有望給市場帶來新產(chǎn)品,比如自動駕駛汽車,而且已經(jīng)提供了一個復(fù)雜的關(guān)于人類基因組的數(shù)據(jù)收集,這些數(shù)據(jù)被用來提供高度個性化的醫(yī)療保健。
自上世紀(jì)90年代末以來,企業(yè)一直在使用人工智能工具來分析信息。幾十年來,大型信用卡處理器一直在使用人工智能檢測和防止欺詐。商業(yè)情報公司利用算法為企業(yè)主提供報告、儀表盤和其他數(shù)據(jù)的可視化顯示。
然而,這些任務(wù)只能通過已經(jīng)被識別、清洗、準(zhǔn)備和清潔的數(shù)據(jù)來實現(xiàn)--換句話說,是那些已經(jīng)被發(fā)現(xiàn)并被帶進了光明的數(shù)據(jù)。
機器學(xué)習(xí)能被用來闡明黑暗數(shù)據(jù)嗎?機器擁有處理海量數(shù)據(jù)的處理能力,利用數(shù)學(xué)和其他工具將數(shù)據(jù)轉(zhuǎn)化為有意義的信息,為什么不呢?
雖然聽起來很簡單,但這一領(lǐng)域仍處于起步階段。企業(yè)正在努力適應(yīng)他們的數(shù)據(jù)管理架構(gòu)來掌控容量和速率。
為黑暗數(shù)據(jù)制定計劃:
我們的目標(biāo)是提供可信的相關(guān)信息,并及時提供數(shù)據(jù),以推動你的企業(yè)變革。因此,擁有一個智能的數(shù)據(jù)發(fā)現(xiàn)工具,可以幫助查找數(shù)據(jù)并了解整個企業(yè)中的數(shù)據(jù)分布和擴散,這是解決黑暗數(shù)據(jù)問題的第一步。
將新數(shù)據(jù)放到不同的系統(tǒng)中,并將它們放到你的操作中,這將是你從數(shù)據(jù)中獲取價值的下一個關(guān)鍵步驟。許多企業(yè)正在尋找方法來加速跨越門檻的過程,同時正在努力適應(yīng)這些類型數(shù)據(jù)的不斷變化和變化。
從黑暗數(shù)據(jù)中交付業(yè)務(wù)價值
IT企業(yè)正面臨著從解決這一挑戰(zhàn)中獲取價值的挑戰(zhàn),這將需要新的思考。舊的管理黑暗數(shù)據(jù)的方法不會是大規(guī)模的。為了滿足數(shù)據(jù)驅(qū)動的數(shù)字轉(zhuǎn)型的需求,我們將采取更多的措施。你需要人工智能和機器學(xué)習(xí)工具的力量,以自動化理解、管理和從黑暗數(shù)據(jù)中提取有價值的信息。
是時候?qū)δ愕暮诎禂?shù)據(jù)方法進行不同的思考了。你有計劃了嗎?
聲明:版權(quán)所有 非合作媒體謝絕轉(zhuǎn)載