今天,在拉斯維加斯舉行的Inspire合作伙伴會議上,微軟發(fā)布了更多與數(shù)據(jù)相關(guān)的公告,包括該公司自己在Azure上的數(shù)據(jù)倉庫服務(wù)以及Power BI服務(wù)。
在數(shù)據(jù)倉庫方面,微軟為其Azure SQL Data Warehouse(SQL DW)服務(wù)宣布了一項名為Instant Data Movement的新功能。通過在一個大的邏輯服務(wù)器中將多個服務(wù)器(節(jié)點)聯(lián)合在一起,數(shù)據(jù)倉庫平臺獲得了更高的速度。當(dāng)在這個邏輯服務(wù)器上運行查詢時,數(shù)據(jù)通常要在節(jié)點之間進行移動,數(shù)據(jù)倉庫執(zhí)行此操作的速度對于其性能來說至關(guān)重要,SQL DW只是讓這樣的操作變得更快。
該產(chǎn)品使用了一種被稱為數(shù)據(jù)移動服務(wù)(Data Movement Service ,DMS)的功能來處理這項任務(wù),它一直表現(xiàn)良好,因為它基于一種長期以來一直很高效的SQL Server技術(shù),這種技術(shù)被稱為批量復(fù)制協(xié)議(Bulk Copy Protocol,BCP)。但是,BCP的問題在于它采用了單線執(zhí)行模式,在單個處理器內(nèi)核上使用SQL Server的單線程操作模式。
但是,SQL Server Gen2存儲的用戶現(xiàn)在可以利用即時數(shù)據(jù)移動(Instant Data Movement ,IDM),它可以在多個CPU內(nèi)核上執(zhí)行,并使用SQL Server新的批處理模式(基于矢量處理)。結(jié)果是數(shù)據(jù)能夠更快地移動,因此當(dāng)查詢沒有進行物理排列的連接表時,查詢性能更高。事實上,微軟表示,結(jié)合其新的Azure Accelerated Networking,SQL DW可以以每個節(jié)點每秒高達1GB的速度移動數(shù)據(jù)。
在IDM和由于SQL DW Gen2存儲和緩存帶來的性能提升之間,微軟對于該產(chǎn)品的性能非常有信心。事實上,這種信心是如此之強大,以至于該公司委托了分析公司GigaOm Research在SQL DW上進行同Amazon Redshift比對的TPC-H基準測試,而且看起來似乎結(jié)果非常樂觀。
信息披露:我自己為GigaOm Research做分析師的工作。我沒有參與SQL DW TPC-H基準測試項目,不過我知道它正在進行。
微軟對TPC-H基準測試工作的討論將在博客文章中進行介紹,GigaOm的報告也可以點擊這里在線獲取。
增強了的Power BI
在Power BI方面,微軟已在云Big Data和Enterprise上都加強了流行的商業(yè)智能(Business Intelligence)服務(wù)。
對于前者,微軟強化了Power Query自助服務(wù)數(shù)據(jù)準備工具(也嵌入在Windows版本的Excel中),以處理存儲在Power BI云服務(wù)中的數(shù)據(jù),而不是將其功能限制在存儲在桌面電腦中的Power BI模型中。
根據(jù)Power Query云功能的實現(xiàn)方式,它可以為微軟的Azure數(shù)據(jù)工廠(Azure Data Factory)服務(wù)提供一個非常有趣的伴奏,其主要改進是6月27日公告的一部分。此外,Power BI正在與Azure Data Lake Storage Gen2(也于6月27日發(fā)布并且目前處于預(yù)覽階段)集成,對Azure Blob Storage的改進消除了文件大小限制,并且增加了一個訪問接口,使其與Hadoop Distributed File System (HDFS)——這種經(jīng)典的大數(shù)據(jù)存儲技術(shù)兼容。
Power BI基于微軟長期的SQL Server Analysis Services(SSAS)技術(shù),而從現(xiàn)在開始,Power BI集成了許多SSAS功能。包括與XML for Analysis(XMLA)的兼容性,這是SSAS的本地協(xié)議。XMLA兼容性帶來了與為SSAS協(xié)同工作而構(gòu)建的一系列工具的兼容性,使Power BI能夠更好地針對企業(yè)。
Power BI還與微軟的企業(yè)報告技術(shù)——SQL Server Reporting Services(SSRS)進行了集成,F(xiàn)在,除了Power BI報告和面板之外,Power BI云服務(wù)還將能夠托管和呈現(xiàn)SSRS報告。
這為與本身就是SSRS內(nèi)部部署的報表服務(wù)器擴展集的Power BI Report Server提供了良好的對稱性,它允許本地提供的Power BI報告以及SSRS資產(chǎn),F(xiàn)在,微軟的客戶將能夠在本地和云端兩種環(huán)境中都能夠合并SSRS和Power BI報告。
為了提升Enterprise的實力,Power BI現(xiàn)在將提供對微軟通用數(shù)據(jù)模型(Microsoft Common Data Model,CDM))的支持,并且正在增加多個地區(qū)的合規(guī)性,允許客戶將Power BI Premium(非Professional)部署到全球特定的區(qū)域。 這有助于遵守數(shù)據(jù)駐留要求,增強數(shù)據(jù)局部性,從而減少數(shù)據(jù)的加載時間。
微軟知道技術(shù)幾乎總是通過數(shù)據(jù)和分析來實現(xiàn),而且該公司正在這個領(lǐng)域的多款產(chǎn)品上加倍下注,特別是在云端更是如此。微軟現(xiàn)在面臨的問題是讓市場相信該公司可以在數(shù)據(jù)領(lǐng)域打敗亞馬遜網(wǎng)絡(luò)服務(wù)(Amazon Web Services)。雖然該公司現(xiàn)在正在前進,但是要想在數(shù)據(jù)領(lǐng)域贏得市場的民心,微軟還有很多工作要做。