作為人類最重要的能量源,石油勘探開發是對計算和數據要求最高的行業之一。
六十年前的大慶,為了分析石油的地下分布,建設者們從地下11400米取出巖心,分析化驗多達160萬塊次,地層對比超1744萬次。
現在,石油勘探用上了震源車,重擊大地制造人工地震,單次產生上百TB的地震波數據。采集、分析、和處理數據是“找油”的關鍵。
為了分析地下石油分布,原國家地質礦產部(后改組歸入國土資源部)下屬計算所,在二十余年前即擁有著北京前二的計算機算力,僅次于氣象分析部門。
但站在2021年,相比于早已將數據作為核心資產的科技行業,石油勘探與采集領域的“大數據”才剛剛開始。
1 難采的數據
在數字化的大趨勢下,數據已經成為最重要的資產,甚至有學者認為,未來一切企業都是數據公司。但在更“重”的石油勘探開發領域,數字化并不容易。
數據采集困難
油井與抽油機并不會自動產生數據,像互聯網公司一樣自動獲得數據、為用戶畫像是幾乎不可能的任務。在偏遠難走的油田區,石油工人要花一天時間巡檢負責的油井,檢查設備狀態、手工記錄油井與抽油機的狀態。
開采的超高復雜度,也為數字化帶來挑戰。根據中石化華北石油局2017年公布的ERP部署進展,石油開采不同環節日常上報的報表多達55份:鉆井專業10類、測井專業1類、錄井專業25類、井下作業8類、采油氣專業3類、油氣集輸專業8類。
數據工具平臺匱乏
手工采集之后,數據錄入都因過于復雜而成了技術活兒,許多油田都設有專人負責生產數據的統計與錄入。2021年夏天,天津大港油田信息中心曾專門開展數據錄入競賽,以部門比拼的形式提升錄入能力。
數據分散建設,結構和標準不統一
建設時間、地質條件和地域因素不同,各個油田有著各自不同的管理方式。數據采集要求不同、統計口徑各異,使得將不同油田的數據匯總分析幾乎是不可能的任務。
數據分析能力薄弱,價值無法發揮
勘探數據的特殊性即使是在移動互聯網開始普及的2014年,絕大部分生產數據的匯報,都停留在Word、Excel或PPT的形式提交和管理。即便使用現在習以為常的大數據分析技術,面對油田經營生產中產生的大量且繁雜的數據,也無能為力進行數據的高效匯聚、治理、共享交換等一系列的管理和應用。因此盡管有著極大的數據量,石油管理者們能看到的大多是基于財務視角的各類報表,無法為生產、勘探和石化研究提供決策支持和業務提升。
數據孤島,數據拉通困難重重
此前,某石油集團曾邀請知名科學家協助研究,提升油田開采效率。但最初提供的油井數據只有8口,多方協調后才拿到200余口。
在開采石油的行業,數據成了更難被開采的原油。
2 十一年磨出的數據互聯
盡管數據采集艱難,石油開采的信息化建設與其它行業一樣在2000年后開始了快速建設。只是龐大的規模、分散的地理位置和極長的產業鏈條,使得信息化系統的應用也分散在了各個分公司、油田和科室。
這樣的建設模式,讓各業務單元能夠靈活建設最適合自己的系統,實現高效的單點提升。但其帶來的兼容問題,卻使得全局層面上的效率很難進化。
獨立建設的系統互不聯通,長期以來,油田、分公司與集團間的數據交互只能以最通用的Excel進行。但這樣的形式,無疑讓數據的合并、糾錯和分析成為工作量黑洞。各系統數據形成了孤島,這就導致小到數據格式無法互相讀取,大到數據開發管理低效復雜,更無法實現數據的自如應用。
為了解決這一問題,石油系統內外的IT人在十余年前開始了探索。2008年,江蘇油田立項研發“勘探開發一體化數據中心及集成平臺EDIBC”,試圖將物探、地質研究、鉆井、測井、錄井、井下作業、采油、集輸、生產調度、決策輔助等環節的數據統歸入一個平臺,并以符合石化行業規范的方式完成數據的采集、管理與流轉。
這可能是第一個將石油勘探開發的所有領域數據聯通在一起,并面向生產進行數據采集、分析和業務聯動的系統。
2014年,科技部組織倪光南院士領銜的專家團對EDIBC進行了評審,給予了極高評價。次年,中石化集團就決定推廣這一成果,以EDIBC為基礎建設具有自主知識產權的勘探開發業務管控平臺EPBP。
數十萬口油井的生產數據開始有了統一的數據規范和管理平臺,至2019年,EPBP完成了在中石化石油勘探開采領域的全覆蓋。最“重”的石油化工上游,用11年的時間完成了數據維度上的“車同軌、書同文”。
盡管EPBP的部署花費了整整四年 ,卻并不能定義為“慢”。曾為石化行業提供IT服務的軟件商王一(化名)告訴36kr,一套系統能夠將地質情況各異、管理方式不完全一樣的不同油田在數據層面打通,已是相當了不起的成就。
“原油開采不是互聯網,不管什么系統,首先一條是不能影響生產。”王一說,“新系統背后是新的工作流程,包括日常管理方式的變化,這都不是短期能夠完成的。”
協同平臺的部署,解決了業務現場的數據錄入和存儲問題。但這些數據就像“原油”,要用起來并不容易。
算力問題
傳統的數據技術架構難以滿足日益增長的業務需求。EPBP的數據庫由Oracle數據庫為內核搭建,能夠滿足數據的分類匯總和查詢功能,但沒有足夠的處理和應用數據的能力。
響應時效問題
當越來越龐大的數據量源源不斷地匯入時,系統缺乏敏捷的算力支撐,也難以實現數據的實時更新,當日錄入的各類數據往往要延遲到次日才能查看。許多數據整合和管理操作都還依賴于人工,效率低且質量不高。
數據交換和共享成本高
各環節的數據對接也成了問題,原有的數據庫沒有向外對接的接口,無法向科研、業務、管理所需的各類軟件直接導入數據。如果某一研究室需要特定時間段、特定類型的匯總數據,信息管理部門需要以寫腳本的形式調出數據再完成轉交。很長時間內,“數據管理”成了體力活。
數據安全管理問題
數據在面向各油田提供服務的同時更關鍵的可能是安全性,傳統數據架構缺乏服務審計和統一的數據標準,導致數據權限和安全防范的難度大增。
面對以上問題,受命管理數據的中石化石油勘探開發研究院在2019年立項,希望以數據中臺形式,承接前臺管理生產現場數據,為后端的應用層提供統一的數據資產,實現數據匯聚、治理、管理和服務,并不斷挖掘數據更多價值,充分發揮數據能力。在當時,數據中臺、云服務已不是新詞。但外部技術合作方的選擇卻讓負責中臺建設的團隊犯了難。
多年的信息化建設,使得市面上存在不少專為石油行業服務的軟件提供商。它們足夠了解行業,卻很難承接如此規模的大數據項目。在選型過程中重點考察以下幾點:全局體系化的數據規劃;構建自主的大數據能力;以及標準化的產品能力。
知名的互聯網大廠們能提供已被驗證的成熟技術和產品,但標準的“產品化”服務,意味著應用方既無法針對自身需求做調整,也不能由自己掌控數據安全,對于有著大量非公開數據、需求高度特化的石油開采,這一模式同樣無法被接受。
京東大數據背景的科杰科技,在具備大廠的能力同時有針對個性需求調整的可能性,因此得到了機會。在耗時一年的選型之后,中石化勘探院成了“主動上門”的甲方。
按照此前的經驗完成建設后的中臺,在對接后端應用時往往需要供應商的部署服務。但這一次,從應用接入到日常運維,完全由甲方自己完成。經歷了前期的公開招標、技術探討、方案選型完成后,中石化勘探院的信息團隊駐場在了科杰科技的辦公室,自學掌握了后續應用的部署方法,還同時完成了基于脫敏數據的算力測試。整個項目過程中讓于洋驚嘆的是來自傳統行業甲方的專業程度。
國企體系內的信息部門、碩博士為主的年輕團隊、經常加班至深夜,這次合作也顛覆了于洋對國企的認知。
雙方自2020年10月初次接觸起,僅用不到一年時間就完成了產品上線,并在上線后的一個月內為各應用部門交付了近100個數據服務。
中臺搭建完畢后,呈現在管理部門面前的就不再是以日、周、月為單位緩慢更新的匯總數據。在標準化的數據治理后,科杰團隊僅用幾天時間就搭建出了實時更新的大數據看板。隨著一線的數據錄入,總部可以在第一時間掌握每一座油井的運行狀況,讓管理決策能夠以數據為依據。
困擾管理和科研部門的算力與數據問題也被中臺解決,無需再處理雜亂無用的“臟數據”,也不用再因算力問題而拖慢效率。
更直接的效果是,統一的數據中臺建設,避免了各應用方、分公司和油田的重復建設,數據共享節約了大量成本。
從目前的建設成果看,中臺提供了全域化數據匯聚、數據治理、數據管理和數據服務的能力,讓數據成為可被利用的資產。“通常我們認為數字化的過程是信息化、數據化和智能化。”于洋說,“現在的石油勘探開發可能還處在數據化的過程中,剛剛開始具備數據能力。”
根據規劃,數據中臺未來還將接入科研、實驗室和勘探專業的大量地球物理數據,為石化行業上游的全流程提供支撐。
盡管遙遠,石油勘探與大數據結合的智能化已走在路上。