數(shù)字化轉(zhuǎn)型中的自動(dòng)化大數(shù)據(jù)治理
當(dāng)今,數(shù)字化正在各行業(yè)快速發(fā)展,醞釀著一場(chǎng)巨大的變革,許多企業(yè)將會(huì)經(jīng)歷***的改變。在數(shù)字化轉(zhuǎn)型的道路上,數(shù)據(jù)是上層建筑和質(zhì)量的基石,而數(shù)據(jù)治理在提升企業(yè)數(shù)據(jù)質(zhì)量的道路上扮演重要的角色。
目錄:
一、數(shù)字化是企業(yè)精細(xì)化管理的必由之路
二、數(shù)據(jù)治理就是自動(dòng)化的數(shù)據(jù)生命周期管理
三、企業(yè)數(shù)據(jù)治理執(zhí)行建議
一、數(shù)字化是企業(yè)精細(xì)化管理的必由之路
我們現(xiàn)在身處一個(gè)虛擬時(shí)空交易與現(xiàn)實(shí)時(shí)空交付的數(shù)字化時(shí)代。
數(shù)據(jù)正發(fā)揮著越來越重要的作用,數(shù)據(jù)將驅(qū)動(dòng)企業(yè)業(yè)務(wù)運(yùn)營,我們通過數(shù)據(jù)去發(fā)現(xiàn)機(jī)會(huì)或定位問題的根源,從而從根本上解決問題。
從發(fā)展趨勢(shì)來看,未來的企業(yè)必將成為數(shù)字化的企業(yè),數(shù)字化轉(zhuǎn)型將成為企業(yè)核心戰(zhàn)略,而在此過程中數(shù)據(jù)治理則是轉(zhuǎn)型道路的必由之路,它能提升企業(yè)數(shù)據(jù)的整體質(zhì)量,規(guī)范企業(yè)管理數(shù)據(jù)的動(dòng)作。
普元在多年的項(xiàng)目實(shí)踐過程中,發(fā)現(xiàn)企業(yè)在做數(shù)據(jù)治理的過程中存在著五個(gè)痛點(diǎn),分別是:
企業(yè)數(shù)據(jù)摸底不清晰
缺乏數(shù)據(jù)治理落地體系方法
缺乏有效的支撐工具
數(shù)據(jù)整改周期長
系統(tǒng)建設(shè)各自為戰(zhàn),數(shù)據(jù)關(guān)聯(lián)度不足,甚至割裂
企業(yè)中有價(jià)值的數(shù)據(jù)是散落在不同的業(yè)務(wù)系統(tǒng)中的,由于信息化進(jìn)程和階段的不同,業(yè)務(wù)系統(tǒng)都是采用急用先建的策略進(jìn)行。要從企業(yè)萬千雜亂的數(shù)據(jù)中理出價(jià)值密度高的數(shù)據(jù),人工、無體系的管理方式在數(shù)據(jù)膨脹的環(huán)境下已心有余而力不足,企業(yè)需要自動(dòng)化甚至智能化的手段去解決數(shù)據(jù)的問題。在多年的實(shí)踐中我們發(fā)現(xiàn),自動(dòng)化是大數(shù)據(jù)治理的關(guān)鍵因素。
作為數(shù)據(jù)密集型企業(yè),銀行一直是國內(nèi)數(shù)據(jù)治理的排頭兵,有數(shù)據(jù)治理相關(guān)的政策要求,也有數(shù)據(jù)強(qiáng)化管理的要求。下面我們舉幾個(gè)銀行的案例:
先看某大型知名銀行的案例。在這個(gè)案例中,我們幫助客戶實(shí)現(xiàn)了自動(dòng)支撐數(shù)據(jù)標(biāo)準(zhǔn)構(gòu)建、自動(dòng)規(guī)范系統(tǒng)數(shù)據(jù)模型、自動(dòng)構(gòu)建企業(yè)數(shù)據(jù)地圖、自動(dòng)實(shí)現(xiàn)數(shù)據(jù)協(xié)同變更、自動(dòng)執(zhí)行關(guān)鍵數(shù)據(jù)檢核等全面自動(dòng)化的數(shù)據(jù)生命周期管理,大大提升了對(duì)數(shù)據(jù)管理的力度。
再來看一個(gè)城商行的案例,該城商行通過自動(dòng)化的企業(yè)數(shù)據(jù)地圖構(gòu)建、自動(dòng)實(shí)現(xiàn)數(shù)據(jù)協(xié)同變更、自動(dòng)執(zhí)行關(guān)鍵數(shù)據(jù)檢核,保障了數(shù)據(jù)中心對(duì)數(shù)據(jù)的統(tǒng)一管理,推進(jìn)了變更統(tǒng)籌管理、降低了源頭業(yè)務(wù)系統(tǒng)在數(shù)據(jù)結(jié)構(gòu)變化過程中對(duì)分析類應(yīng)用的影響,從而大大提升了該行IT項(xiàng)目群的整體管理水平。
由于時(shí)間和篇幅的原因,我們沒對(duì)電信、政府、制造業(yè)、航空業(yè)、物流業(yè)的案例進(jìn)行介紹,但在普元實(shí)施這些行業(yè)客戶的時(shí)候,無不是通過自動(dòng)化的手段去解決數(shù)據(jù)治理問題。
我們認(rèn)為,數(shù)據(jù)治理其實(shí)是圍繞數(shù)據(jù)生命周期的不同階段,開展對(duì)數(shù)據(jù)規(guī)范、管理和整治活動(dòng)的集合。由于數(shù)據(jù)在企業(yè)中存在的形態(tài)是瑣碎多樣且無體系的,企業(yè)必須用整體的思路、體系化的管理策略,使用自動(dòng)化的方式去解決數(shù)據(jù)管理的問題。
二、數(shù)據(jù)治理就是自動(dòng)化的數(shù)據(jù)生命周期管理
我們從不同行業(yè)的數(shù)據(jù)治理實(shí)施項(xiàng)目中提取了五種可執(zhí)行的自動(dòng)化手段,來解決數(shù)據(jù)生命周期中不同階段的數(shù)據(jù)治理問題。
這五個(gè)手段分別是:
自動(dòng)支撐數(shù)據(jù)標(biāo)準(zhǔn)構(gòu)建
自動(dòng)規(guī)范系統(tǒng)數(shù)據(jù)模型
自動(dòng)構(gòu)建企業(yè)數(shù)據(jù)地圖
自動(dòng)實(shí)現(xiàn)數(shù)據(jù)協(xié)同變更
自動(dòng)執(zhí)行關(guān)鍵數(shù)據(jù)檢核
1.自動(dòng)支撐數(shù)據(jù)標(biāo)準(zhǔn)構(gòu)建
自動(dòng)支撐數(shù)據(jù)標(biāo)準(zhǔn)構(gòu)建的意思是,企業(yè)能在在數(shù)據(jù)生命周期的規(guī)劃和標(biāo)準(zhǔn)規(guī)范階段,能通過工具來自動(dòng)構(gòu)建數(shù)據(jù)標(biāo)準(zhǔn)。
數(shù)據(jù)標(biāo)準(zhǔn)是企業(yè)的語義字典,不僅對(duì)企業(yè)數(shù)據(jù)架構(gòu),數(shù)據(jù)分類,數(shù)據(jù)特征進(jìn)行了全方位的描述,還對(duì)業(yè)務(wù)活動(dòng)和業(yè)務(wù)系統(tǒng)建設(shè)給出了數(shù)據(jù)架構(gòu)層面的的指導(dǎo)性建議。它相當(dāng)于一個(gè)綱領(lǐng),用來規(guī)范信息系統(tǒng)的建設(shè),并且協(xié)同業(yè)務(wù)和技術(shù)。
一般企業(yè)構(gòu)建數(shù)據(jù)標(biāo)準(zhǔn),需要參考同業(yè)、引用國家標(biāo)準(zhǔn)、考慮企業(yè)數(shù)據(jù)現(xiàn)狀。但我們發(fā)現(xiàn)標(biāo)準(zhǔn)和企業(yè)實(shí)際情況脫節(jié)是經(jīng)常會(huì)出現(xiàn)的問題,造成標(biāo)準(zhǔn)無法落地或落地困難,所以數(shù)據(jù)標(biāo)準(zhǔn)制定過程中一定要充分考慮企業(yè)的數(shù)據(jù)現(xiàn)狀。我們認(rèn)為要在摸清企業(yè)數(shù)據(jù)現(xiàn)狀的基礎(chǔ)上再構(gòu)建數(shù)據(jù)標(biāo)準(zhǔn)。
構(gòu)建數(shù)據(jù)標(biāo)準(zhǔn)要從自動(dòng)化的數(shù)據(jù)資產(chǎn)梳理開始。通過元數(shù)據(jù)管理工具自動(dòng)摸清企業(yè)有哪些數(shù)據(jù),在什么地方,如何存儲(chǔ),歸誰使用,誰在運(yùn)維,體量如何,數(shù)據(jù)含義是否明確,被誰關(guān)聯(lián)引用等,在這些都明確的基礎(chǔ)上,自動(dòng)對(duì)元數(shù)據(jù)進(jìn)行歸集和分類,將分類結(jié)果經(jīng)過甄別評(píng)審后歸集到定義好的數(shù)據(jù)標(biāo)準(zhǔn)分類體系上,整個(gè)過程在線上完成,實(shí)現(xiàn)數(shù)據(jù)標(biāo)準(zhǔn)構(gòu)建的自動(dòng)化支撐。
從整體統(tǒng)籌的的角度講,與傳統(tǒng)數(shù)據(jù)標(biāo)準(zhǔn)的構(gòu)建方式相比,自動(dòng)化構(gòu)建數(shù)據(jù)標(biāo)準(zhǔn)有幾個(gè)好處:
一是數(shù)據(jù)標(biāo)準(zhǔn)是從企業(yè)實(shí)際數(shù)據(jù)環(huán)境中發(fā)掘出來的,制定的標(biāo)準(zhǔn)有現(xiàn)實(shí)依據(jù);
二是關(guān)鍵的、核心的共享級(jí)數(shù)據(jù)明確了出處,在什么部門、在什么系統(tǒng)、在什么數(shù)據(jù)庫中、歸誰管理和負(fù)責(zé)一目了然,在進(jìn)行數(shù)據(jù)共享的時(shí)候減少了數(shù)據(jù)分析時(shí)間,提高了工作效率。
三是針對(duì)存量的核心數(shù)據(jù)進(jìn)行了數(shù)據(jù)標(biāo)準(zhǔn)映射,在標(biāo)準(zhǔn)制定過程中可以映射存量系統(tǒng)關(guān)鍵數(shù)據(jù),在管理和使用上明確了這些數(shù)據(jù)和標(biāo)準(zhǔn)的關(guān)系。
2.自動(dòng)規(guī)范系統(tǒng)數(shù)據(jù)模型
企業(yè)信息化正從分散化業(yè)務(wù)處理系統(tǒng)向平臺(tái)化業(yè)務(wù)系統(tǒng)轉(zhuǎn)變,如何落實(shí)數(shù)據(jù)標(biāo)準(zhǔn)化,發(fā)揮數(shù)據(jù)標(biāo)準(zhǔn)統(tǒng)籌規(guī)范的價(jià)值是一件不容易的事情。在數(shù)據(jù)生命周期的開發(fā)實(shí)施階段,自動(dòng)規(guī)范系統(tǒng)數(shù)據(jù)模型變得很重要。
自動(dòng)規(guī)范系統(tǒng)數(shù)據(jù)模型在數(shù)據(jù)生命周期過程中起到了承上啟下的作用,也是數(shù)據(jù)標(biāo)準(zhǔn)化落實(shí)的關(guān)鍵階段,是元數(shù)據(jù)事前管理的重要環(huán)節(jié)。
對(duì)于新增系統(tǒng)和存量系統(tǒng)來說,自動(dòng)規(guī)范系統(tǒng)數(shù)據(jù)模型的方式也不同。在信息系統(tǒng)建設(shè)初期,業(yè)務(wù)模型、邏輯模型、數(shù)據(jù)模型要能在線上設(shè)計(jì)完成,并且設(shè)計(jì)的過程中能引用企業(yè)信息模型(非金融)或數(shù)據(jù)標(biāo)準(zhǔn)(金融),以此來達(dá)到規(guī)范模型的目的;
而對(duì)于存量系統(tǒng),我們可以使用自動(dòng)化的元數(shù)據(jù)采集能力,自下而上反向生成存量系統(tǒng)的數(shù)據(jù)模型,如上圖所示。
雖然在線設(shè)計(jì)系統(tǒng)模型在一定程度上保證了數(shù)據(jù)標(biāo)準(zhǔn)或企業(yè)信息模型的有效落地,但系統(tǒng)運(yùn)行是一個(gè)持續(xù)的過程,投產(chǎn)后的系統(tǒng)元數(shù)據(jù)隨時(shí)都有可能發(fā)生變化,所以需要定期自動(dòng)從生產(chǎn)環(huán)境中采集元數(shù)據(jù)和設(shè)計(jì)態(tài)中的元數(shù)據(jù)進(jìn)行比對(duì)糾偏,保證設(shè)計(jì)和投產(chǎn)的一致。
3.自動(dòng)構(gòu)建企業(yè)數(shù)據(jù)地圖
企業(yè)組織是一個(gè)整體,描述的企業(yè)活動(dòng)的數(shù)據(jù)應(yīng)該也是一個(gè)整體。企業(yè)可以通過元數(shù)據(jù)管理工具,將企業(yè)所有元數(shù)據(jù)自動(dòng)采集到一起,并在自動(dòng)抽取元數(shù)據(jù)的過程中建立不同載體與跨載體的數(shù)據(jù)關(guān)系,形成一張反映企業(yè)現(xiàn)狀數(shù)據(jù)的關(guān)系網(wǎng),我們通常稱這張網(wǎng)為“數(shù)據(jù)地圖”。
通過數(shù)據(jù)地圖,在運(yùn)營管理上能統(tǒng)籌看待數(shù)據(jù),全盤考慮數(shù)據(jù)架構(gòu),提出數(shù)據(jù)治理目標(biāo),從根本上解決問題。
企業(yè)數(shù)據(jù)地圖的構(gòu)建必須是自動(dòng)化的,通過自動(dòng)化才能準(zhǔn)確獲取企業(yè)信息系統(tǒng)中的元數(shù)據(jù)信息以及元數(shù)據(jù)間的關(guān)系信息,數(shù)據(jù)地圖的脈絡(luò)分析讓每個(gè)數(shù)據(jù)的在企業(yè)的數(shù)據(jù)鏈條的位置和數(shù)據(jù)價(jià)值變得清晰可見,通過數(shù)據(jù)地圖還能查詢數(shù)據(jù)的技術(shù)屬性、業(yè)務(wù)屬性、管理屬性、安全屬性、稽核屬性等,當(dāng)然也能知道數(shù)據(jù)是否遵循了企業(yè)數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范。
以上提到的數(shù)據(jù)間的流向關(guān)系在企業(yè)信息系統(tǒng)是真實(shí)存在的,我們選用合適的元數(shù)據(jù)工具能方便得到。但數(shù)據(jù)的關(guān)聯(lián)關(guān)系一般是邏輯上的。比如:核心系統(tǒng)、信貸系統(tǒng)、基金系統(tǒng)、網(wǎng)頁系統(tǒng)、理財(cái)系統(tǒng)都存在客戶號(hào),要基于客戶號(hào)獲取這些系統(tǒng)中客戶實(shí)體的相關(guān)屬性信息,將會(huì)是一件不容易的事情。因?yàn)檫@需要知道相關(guān)系統(tǒng)在數(shù)據(jù)上的邏輯關(guān)系,而邏輯關(guān)系一般在跨部門,跨系統(tǒng)間是沒有在數(shù)據(jù)庫表層面建立的,所以在做數(shù)據(jù)分析的時(shí)候需要一種自動(dòng)化的手段來給這些數(shù)據(jù)建立關(guān)系。
我們基于知識(shí)圖譜技術(shù)構(gòu)建企業(yè)數(shù)據(jù)間的關(guān)聯(lián)關(guān)系,首先基于企業(yè)元數(shù)據(jù)信息,通過自然語言處理、模式識(shí)別等算法,以及業(yè)務(wù)規(guī)則過濾,實(shí)現(xiàn)實(shí)體對(duì)象提??;然后以本體的形式表示和存儲(chǔ);***利用智能搜索、關(guān)聯(lián)查詢手段,為最終用戶推薦數(shù)據(jù)關(guān)聯(lián)關(guān)系。有了知識(shí)圖譜的支持,基于元數(shù)據(jù)的自助數(shù)據(jù)服務(wù)開發(fā)就變得很簡單了。
4.自動(dòng)實(shí)現(xiàn)數(shù)據(jù)協(xié)同變更
在數(shù)據(jù)生命周期的使用階段,企業(yè)業(yè)務(wù)系統(tǒng)建設(shè)的步伐深化,數(shù)據(jù)需要在不同的系統(tǒng)當(dāng)中流轉(zhuǎn)和交互,一些平臺(tái)類的系統(tǒng)開始出現(xiàn),如ODS、倉庫、集市、大數(shù)據(jù)等,企業(yè)運(yùn)營決策也依賴數(shù)據(jù)的整合,這期間面臨的一個(gè)主要問題就是數(shù)據(jù)全鏈路協(xié)同變更。
在數(shù)據(jù)鏈路上,任何一個(gè)點(diǎn)上數(shù)據(jù)結(jié)構(gòu)的變化必將影響其他節(jié)點(diǎn)上的數(shù)據(jù),我們需要一種自動(dòng)化的能力實(shí)現(xiàn)全數(shù)據(jù)協(xié)同變更。下圖是一個(gè)典型的案例場(chǎng)景,供大家參考。
自動(dòng)的全局?jǐn)?shù)據(jù)協(xié)同變更包含兩層意思,
一是在數(shù)據(jù)鏈路上的任何一點(diǎn)發(fā)生數(shù)據(jù)結(jié)構(gòu)的變化,如字段長度、字段類型等,會(huì)自動(dòng)通知數(shù)據(jù)鏈路上的相關(guān)部門或責(zé)任人;
二是在數(shù)據(jù)作業(yè)異常后,會(huì)自動(dòng)的通知作業(yè)依賴鏈路上相關(guān)的部門或責(zé)任人。
另外, 流程在數(shù)據(jù)管理工作中起到串聯(lián)和推動(dòng)的作用,數(shù)據(jù)管理工作是企業(yè)級(jí)的一個(gè)大的基礎(chǔ)工程,涉及的部門、系統(tǒng)、人員較多,因此常態(tài)化的數(shù)據(jù)管理離不開流程驅(qū)動(dòng),引入流程化機(jī)制,能規(guī)范跨系統(tǒng),垮部門的數(shù)據(jù)工作協(xié)作。
5.自動(dòng)執(zhí)行關(guān)鍵數(shù)據(jù)檢核
數(shù)據(jù)治理的核心目標(biāo)是通過優(yōu)化數(shù)據(jù)結(jié)構(gòu),規(guī)范數(shù)據(jù)定義,完善數(shù)據(jù)使用流程等手段來提升企業(yè)數(shù)據(jù)質(zhì)量,我們所制定的組織、角色、工作方法都是圍繞這個(gè)目標(biāo)來設(shè)計(jì)的。企業(yè)要通過自動(dòng)化的手段重點(diǎn)監(jiān)控核心數(shù)據(jù),如監(jiān)管類的數(shù)據(jù),核心決策類指標(biāo)數(shù)據(jù)等。
數(shù)據(jù)標(biāo)準(zhǔn)是衡量企業(yè)數(shù)據(jù)質(zhì)量好壞的準(zhǔn)則,對(duì)企業(yè)關(guān)鍵的數(shù)據(jù)檢核應(yīng)該來源于數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范要求。在上面的分享中,我們知道數(shù)據(jù)是多維的,包括技術(shù)維、業(yè)務(wù)維、管理維、質(zhì)量維、安全維,針對(duì)數(shù)據(jù)標(biāo)準(zhǔn)的技術(shù)維度要求,結(jié)合元數(shù)據(jù)管理自動(dòng)化構(gòu)建針對(duì)關(guān)鍵數(shù)據(jù)的檢核規(guī)則,就能發(fā)現(xiàn)數(shù)據(jù)在技術(shù)維度上的不足或問題。
三、企業(yè)數(shù)據(jù)治理執(zhí)行建議
以上我們從數(shù)據(jù)生命周期的不同階級(jí)講解了開展大數(shù)據(jù)治理的五個(gè)自動(dòng)化手段,下面我們根據(jù)普元多年數(shù)據(jù)治理項(xiàng)目實(shí)施的經(jīng)驗(yàn),給出企業(yè)在執(zhí)行數(shù)據(jù)治理的一些建議,供大家參考。
企業(yè)數(shù)據(jù)治理的目的是讓數(shù)據(jù)在業(yè)務(wù)和技術(shù)上保持統(tǒng)一的口徑和準(zhǔn)確的含義,能在企業(yè)數(shù)據(jù)架構(gòu)的規(guī)劃下指導(dǎo)信息化的建設(shè),并能在需要的時(shí)候?qū)?shù)據(jù)進(jìn)行連接、整合,進(jìn)而挖掘出數(shù)據(jù)價(jià)值驅(qū)動(dòng)企業(yè)運(yùn)營。
在數(shù)據(jù)治理執(zhí)行建議中,我們將數(shù)據(jù)的生命周期切分成事前、事中和事后三個(gè)階段。
在事前階段,要定數(shù)據(jù)標(biāo)準(zhǔn),信息系統(tǒng)的數(shù)據(jù)模型在線上參考標(biāo)準(zhǔn)進(jìn)行設(shè)計(jì),設(shè)計(jì)好的模型可以直接創(chuàng)建信息系統(tǒng)的數(shù)據(jù)庫,所有的模型變更調(diào)整都在平臺(tái)上進(jìn)行。
模型設(shè)計(jì)過程中能看到其他系統(tǒng)的數(shù)據(jù)模型,也能看到其他系統(tǒng)數(shù)據(jù)標(biāo)準(zhǔn)化的情況。
過程要符合企業(yè)系統(tǒng)開發(fā)的管理流程,在流程驅(qū)動(dòng)下完成設(shè)計(jì)和變更工作。
這樣做的好處有以下幾個(gè):
企業(yè)元數(shù)據(jù)在事前的到有效管理和控制。
系統(tǒng)間數(shù)據(jù)不是割裂的,從數(shù)據(jù)架構(gòu)角度看他是一個(gè)整體,我在用哪個(gè)系統(tǒng)的、那個(gè)業(yè)務(wù)的數(shù)據(jù),誰又在用我的數(shù)據(jù),一目了然,清晰可見。
數(shù)據(jù)標(biāo)準(zhǔn)(企業(yè)信息模型)落地有了載體,有了方法,有了能力支撐,標(biāo)準(zhǔn)執(zhí)行的程度可查、可控。
全局?jǐn)?shù)據(jù)分析有了數(shù)據(jù)門戶,數(shù)據(jù)質(zhì)量在模型層面得到有效提高。
如果企業(yè)沒有制定數(shù)據(jù)標(biāo)準(zhǔn),這種事前管理思路也是值得嘗試的。
在事后階段,通過檢核的抓手促進(jìn)企業(yè)數(shù)據(jù)標(biāo)準(zhǔn)落實(shí)。
這里提供兩個(gè)抓手
針對(duì)生產(chǎn)運(yùn)行態(tài)的元數(shù)據(jù)進(jìn)行定期的、自動(dòng)化抽取,抽取結(jié)果和事前設(shè)計(jì)態(tài)元數(shù)據(jù)進(jìn)行比對(duì),發(fā)現(xiàn)差異,提出整改意見;
根據(jù)數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范對(duì)關(guān)鍵數(shù)據(jù)進(jìn)行質(zhì)量檢核,發(fā)現(xiàn)數(shù)據(jù)問題,提出整改意見。
在事后階段,為了促進(jìn)數(shù)據(jù)質(zhì)量的持續(xù)提升,企業(yè)可以引進(jìn)考核機(jī)制,進(jìn)而為數(shù)據(jù)治理的有效開展提供保障。
關(guān)于作者:
王鵬
現(xiàn)任普元大數(shù)據(jù)產(chǎn)品線數(shù)據(jù)治理項(xiàng)目實(shí)施經(jīng)理,2009年進(jìn)入國內(nèi)數(shù)據(jù)治理領(lǐng)域,先后主導(dǎo)或參與金融業(yè)、運(yùn)營商、制造業(yè)、政府、航空,物流等行業(yè)的數(shù)據(jù)治理解決方案的編寫,以及相關(guān)落地項(xiàng)目的實(shí)施。