數據是企業數字化轉型的核心要素,數據治理是企業數據能力構建的核心基礎,根據國際數據管理協會(DAMA)給出的定義:數據治理是對數據資產管理行使權力和控制的活動集合。數據治理職能是指導其他數據管理職能如何執行,最終保證數據的可用性、數據質量和數據安全。
企業為什么要做數據治理?
隨著企業數據需求的不斷增加,人們對數據質量的預期也隨之改變。
在企業數字化轉型過程中,根據使用數據的角色不同,數據使用方面會涉及很多痛點,具體的痛點大致可以分為以下三個方向:數據易用性差、數據質量差、數據安全性差。在一些數字化轉型領先行業,早已經積累龐大的數據,當數據質量存在問題如數據標準不統一、數據易用性差以及數據安全等問題時,就需要進行數據治理。
數據治理在數據管理工作中,扮演著“執行者”的角色,是數據規劃成果及標準設計成果、數據存儲、數據管控、數據交換、數據應用得以落地的基礎。企業數據治理是一個長期、復雜的體系化工程,涉及數據標準、數據質量、主數據、元數據、數據安全、數據資產、數據服務等多個方面。
基于此,企業為了獲得質量更高的數據,與業務建立緊密聯系,推動數據資產變現,形成標準化的數據資產管理方法、流程和策略,提高數據運營效率和數據安全性,釋放數據價值,賦能數字化轉型,進行數據治理工作。
企業數據治理建設方式
現階段,絕大多數企業,把數據治理作為一個由集團開展自上而下的專項項目。企業做數據治理以合規為導向,管制、控制數據,被動、靜態提供數據,供數據應用部門查閱使用。然而,企業數據治理不是一次性工作,而是持續的日常工作。
數據治理顯然不可能由單一部門去進行開展,而是由技術部門跟業務部門進行融合、協同的多部門協同工作。同時,數據治理本身不應該以管控為目標,應該以數據使用為目標,當需求人員使用數據的時候,數據是可用、一致的。數據治理本身不應該是被動的,而應該是主動的,隨時發現問題,隨時完成相應的調整。
此外,數據治理本身是動態的,數據治理高度關注最后的數據消費,所以企業需要把數據治理以目的為導向,把數據治理敏捷、日常的融入到協作當中,才能達成數據高質量的一致性的可用。

基于以上,企業數據治理建設路徑如下:
明確數據治理平臺的管理管控對象。結合數據規劃成果及數據管理需求,明確不同類型業務的數據管控對象及管控范圍。
完成數據治理平臺的架構設計。?結合數據管控對象,從IT建設角度,規劃數據治理支撐平臺的總體架構;基于數據管理工作的落地與實施,規劃平臺功能架構;從技術實現角度,規劃平臺技術架構;從軟硬件環境部署角度,規劃平臺部署架構。
完成數據治理平臺的軟硬件環境設計。?基于平臺的架構設計成果,進行硬件設備配置及技術參數的規劃,軟件產品、組件及選型的規劃。
完成數據治理平臺的實施路線規劃。從平臺的建設維度、實施維度,進行平臺實施階段劃分、階段目標及任務的規劃,以確保平臺建設工作及數據管理工作有條不紊地進行。
科杰科技數據治理實踐
科杰科技湖倉一體數據智能平臺KeenData Lakehouse,可以幫助企業建立數據治理體系規劃,從數據戰略、組織機制、數據文化等方面全面推進數據質量治理工作,以結果為導向,建立敏捷的數據治理體系,達成企業自適應的數據治理。

科杰科技數據治理平臺功能架構
基于科杰科技湖倉一體智能數據平臺KeenData Lakehouse,企業將被動、割裂的數據治理跟數據工程相融合,將訪問控制、管道連接、數據合并、主動元數據、數據探查等技術融入到數據工程上,并基于KeenData Lakehouse提供數據治理與數據工程相融合的自治理能力;數據同步系統Keen Dsync具有超強的兼容能力,可滿足企業復雜結構、多終端、多形態、多業務的數據同步交換需求;數據開發管理平臺Keen BDP提供離線/實時/算法開發一站式數據開發工程化能力,同時自研的大規模高性能智能調度引擎,可智能解析任務血緣,在工程化的全流程自動沉淀,可追蹤血緣關系的數據資產,在保障數據生產的時效性與穩定性同時極大的提高開發效率;主數據管理平臺Keen MDM、數據標準平臺Keen DSM、數據質量平臺Keen DQM、在數據離線/實時工程化過程中提供全局統一的主數據管理體系、統一的質量標準規范、全方位質量管控能力;在數據處理過程中主動的、實時的、自動化的完成治理,幫助用戶建設數據治理與數據工程相融合的自治理體系。

科杰科技數據底座產品矩陣
作為行業領先的大數據基礎軟件構建商,科杰科技基于領先湖倉一體技術,自主研發數據智能平臺,具有湖倉一體、批流一體、存算分離的技術架構特點,KeenData Lakehouse可以在數據處理全生命周期為您提供持續集成、持續開發、持續運維的DataOps一站式的強大的工具能力,并提供數據治理與數據工程相融合的開發體驗,保障數據資產的質量,釋放數據價值。