Gartner公布2019年十大策略性科技趨勢
http://bit.ly/2MwCf1w
從各個發展趨勢來看,產業與科技正面臨前所未有的快速變化,在未來也將會是如此。因
此,數據分析產業建立一套靈活的、「以資料為中心」(data-centric)的服務架構是很
重要的,才能在如此變動的環境中維持競爭優勢。
Gartner歸結出在將來的三到五年間可能顛覆數據分析產業的十項科技趨勢,並建議數據
分析工作者應評估這些趨勢,以因應對所經營策略可能帶來的影響並做相應的調整。
趨勢一:擴增分析(Augmented Analytics)
擴增分析指在資料分析和商業智慧(business intelligence)的領域中應用機器學習、
人工智慧和自動化等科技輔助分析人員以進行資料準備、產生洞察和解釋洞察等數據分析
工作。運用擴增分析將能實現整合人工智慧和數據分析兩個專業領域,為企業提供重要的
企業洞察。此外,擴增分析將有助於讓非專業的數據分析人員,或稱為「素人資料科學家
」(citizen data scientist),也能生產出重要的企業洞察。Gartner將擴增分析趨勢
造成數據分析專業門檻降低的現象,稱為數據分析的「民主化」(democratization)。
Gartner預估,到了2020年,擴增分析將會是帶動數據分析產業和商業智能成長的重要驅
力。另一方面,對於資料科學、機器學習平台和嵌入分析(embedded analytics)的需求
也會跟著提升。隨著相關技術的成熟,Gartner建議數據分析工作者應建立計劃,將擴增
分析整合進數據分析服務中。
趨勢二:擴增數據管理(Augmented Data Management)
擴增數據管理指運用機器學習和人工智慧引擎讓企業的資料管理系統能具有自我調適(
self-configuring)的功能,減少在資料管理上面的人力成本,讓專業人員可專注於更高
附加價值的業務上。
擴增數據管理影響所及的範疇,包含:資料品質、後設資料管理、主資料管理、資料整合
和資料庫等資料管理層面。尤其是在於對後設資料的處理,Gartner指出,擴增數據管理
的關鍵流程便是將過往被視為次要的後設資料(metadata)運用於機器學習的機制中,讓
後設資料成為擴增數據管理的主要資料。
Gartner預測,到了2022年底,結合機器學習和自動化管理的擴增數據管理發展趨勢將會
讓資料管理的人工作業減少45%。
趨勢三:自然語言處理/會話分析(Natural Language Processing/Conversational
Analytics)
Gartner估計,在2020年將會有五成以上的資料分析查詢(query)是以文字搜尋(search
)或語音的方式進行。也就是說,將來使用者會以更加人性化的方式或甚至以對話的方式
來和資料互動。
自然語言處理或會話分析的發展趨勢,將可讓數據分析的結果有更廣泛的應用情境,例如
客服部門或櫃台等辦公室前端的人員,以及能讓更多人以更簡便的方式取用到數據分析的
結果。
趨勢四:圖形分析(Graph)
圖形分析指以神經網絡的形式模擬資料與資料之間的關係網路,並藉以探索未知的問題、
串連不同領域的資料庫或以更貼近人類思維的方式管理資料。
圖形分析的關鍵技術在於對圖形資料庫(graph database)的運用與管理。圖形資料庫是
以資料節點以及資料節點之間的路徑關係所構成的資料庫結構。運用圖形資料庫將有助於
分析人員處理更複雜的問題或是整合不同層面的資料,例如將飲食規劃、醫療資料和保健
新聞整合運用於運動app。
Gartner指出,到了2022年,圖形分析的運用比例將會以100%的成長率倍速成長,並解決
傳統關聯式資料庫所無法應付的難題。
趨勢五:商業化的人工智慧和機器學習(Commercial AI and machine learning)
運用於開發人工智慧和機器學習(AI/ML)的開發環境,目前以開源(open source)平台
為大宗。商業機構則是以提供企業化服務為主,例如與AI/ML相關的專案管理、模型管理
、重複利用、透明化和整合服務等,這些服務則是目前開源平台較缺乏的。
不過Gartner預測,到了2022年,75%的新使用者將會使用商業機構(如亞馬遜、Google和
微軟)所提供的AI/ML解決方案,而不是使用來自開源平台的解決方案。運用商業機構所
提供的AI/ML解決方案將有助於分析人員快速將AI/MI投入工作流程中,並加速提高企業價
值。
趨勢六:數據結構(Data Fabric)
由企業或各種部門所搜集產生的資料數據持續爆炸性的增長,但這些資料數據卻又分處在
各種不同的儲存空間中,例如存放在亞馬遜的S3、微軟的Azure或谷歌的Google Cloud
Platform等公有雲上,又或是存放在企業建立的私有雲中,同時這些資料數據也可能建立
於不同的檔案系統(file system)或傳輸協定,因此造成資料群集(cluster)之間取用
的困難,而形成所謂的資料孤島(data silo)。
為了要解決資料孤島的困境,數據結構的概念是建立一套可以整合各種不同雲端服務以及
橋接各種檔案系統和傳輸協定的操作系統。運用數據結構將可以更有效率的運用與分享資
料數據,減少因數據孤島而造成的資料重複、轉移困難等資源的浪費。
Gartner認為,在2022年左右,為了企業服務而建造的數據結構將會成為企業的基礎設施
,同時也會誘發企業投入成本於改良資料數據基礎設施。
趨勢七:可解釋人工智慧(Explainable AI, XAI)
隨著AI的運用層面越來越廣泛,對於AI的可信度、了解程度和可修正程度的要求也相應的
提升。現行的AI雖然可以透過機器學習的方式建立起可應用的AI模型,但在實際的應用場
景中,AI就如同一個黑盒子(black box),只能提供使用者一個結果或決策,而無法進
一步說明是依據什麼推論過程而得出該結果或決策,也可能導致使用者因看不見又摸不著
的AI系統而產生出錯誤的決策。
可解釋人工智慧是在AI研究領域中的一種新趨勢,其主要概念便是要讓AI在處理資料的過
程中能同時對使用者提供回饋,讓使用者可以瞭解為什麼AI會得出該結果或決策,藉以提
升使用者對AI的可信任程度或是在必要時能修正AI。
依據Gartner預估,2023年以前將會有75%的大型企業開始雇用AI行為研究人員和消費者隱
私保護專家來預防企業潛在的品牌與名譽風險。
趨勢八:區塊鏈(Blockchain)
對數據分析產業而言,區塊鏈技術最重要的兩項優勢在於,第一,區塊鏈可以細盡的記錄
資料的來源去向或是交易紀錄。第二,區塊鏈可以建立透明化的關係網絡。
運用區塊鏈技術,雖然可以建立起具有可信度的、無法竄改的資料網絡,但Gartner強調
,區塊鏈仍然無法取代對數據分析產業最重要的工作流程,即資料的儲存、管理及在商業
上的應用。此外,Gartner還指出,目前區塊鏈技術的成熟度還不足以讓區塊鏈擁有在虛
擬貨幣以外的大規模應用機會。
Gartner認為,在2021年以前,帳本式資料庫管理系統(ledger database management
system)將會足以取代大部份的私有區塊鏈。
趨勢九:連續智慧(Continuous Intelligence)
連續智慧意指在企業運作的流程中整合即時性(real-time)的數據分析工作,讓企業可
以隨時從資料數據中得出洞察,並進而制定企業當下所應採行的決策。連續智慧與傳統商
業智慧(business intelligence)不同之處在於,連續智慧強調運用AI/ML和自動化等技
術,取代傳統分析資料所需的人力,並且大量且即時的產出企業所需的決策依據,而非是
如傳統企業決策流程以階段性或費時的方式產出決策。
Gartner預測,在2022年以前將會有過半的大型企業採用連續智慧幫助他們依據即時的資
料數據做出企業決策,同時也協助大型企業建立對產業環境變動的警覺能力。
趨勢十:持續性記憶體伺服器(Persistent Memory Servers)
持續性記憶體是一種介於DRAM與快閃記憶體之間的一種新興記憶體技術。持續性記憶體保
有DRAM的運算速度,同時也擁有快閃記憶體的非揮發性(non-volatile),即使斷電後資
料也不會遺失。
過去在執行數據分析時,尤其是在網路或雲端作業當中,為了加快運算速度而將數據保存
在DRAM中同時也在DRAM內完成運算,省去系統和硬碟之間的讀取時間。但隨著資料量越來
越龐大,DRAM空間則顯得不足、昂貴。因此,持續性記憶體的出現將能提供一種符合經濟
成本同時也具有穩定性的記憶體解決方案。
Gartner預估,持續性記憶體將持續成長,在2021年以前將會提供DRAM內運算的整體需求
量的10%。
評論:
過去在企業決策時最需要專業的分析師依據企業經營的各種數據或是從消費者身上蒐集到
的數據來擬訂企業的短中長期經營策略。這個分析的過程是最需要人工人力與專業經驗的
企業流程。但AI、機器學習、資料庫技術的創新逐漸讓這個決定企業發展的流程更加細致
化甚至自動化、AI化。