數據挖掘技術下數字化油氣藏研究論文
摘要:油氣藏在勘探開發(fā)及其研究與決策過程中,形成巨量的成果及數據。為了更加科學開發(fā)與管理油氣藏,充分運用和發(fā)揮好這些巨量數據的信息作用成為關鍵,數據挖掘作為一種有效的信息處理技術,可以在海量數據中快速找出有用信息,為研究與決策提供強有力的數據支持。長慶油田在油氣藏研究與決策支持系統(tǒng)(RDMS)建設中充分利用各專業(yè)數據庫及多種數據挖掘方法,構建了一個滿足勘探、開發(fā)、儲量管理、評價等綜合應用的數據管理、數據操作及可視化展示的一體化平臺,為油氣藏研究與決策人員提供全方位的數據處理與可靠決策,極大地提升了油氣藏的研究效率和決策質量。
關鍵詞:數字化油氣藏;研究與決策;數據挖掘
油氣藏研究包含了從地質勘查到石油產品最終用戶的復雜工藝流程,傳統(tǒng)的油氣藏研究方法存在工作效率低、準確性不高、過度依賴人工經驗等問題。決策者需要從海量的數據中找出有用的關鍵信息;論證現場中研究人員攜帶和使用的各類圖件無法充分展示其研究成果,也不能在論證現場短時間內消化大量資料并做出正確的決策,更不能使信息資源的共享和成果的交互上得到充分實現。信息落后的信息處理方法與單一的研究手段不但花費大量的精力與時間,更是造成大量寶貴的研究成果無法應用與共享。近年信息技術的快速發(fā)展,催生了數字化油藏,促進了數字油田的發(fā)展產,數據挖掘等信息技術與油氣勘探開發(fā)數據資源的融合不斷加深,能夠提供更智能化的數據分析功能,更好地支持油氣藏勘探開發(fā)決策,開創(chuàng)了一種全新的油氣藏研究工作模式,降低了決策風險,提升開發(fā)決策水平。長慶油田針對具有數量龐大的、結構不完整的、內容不清晰且含有干擾信息的油氣藏研究工作數據,開發(fā)了包括特征提取、規(guī)則劃分分類分析、關聯(lián)規(guī)則挖掘、聚類分析、模式分析及生成趨勢分析等[1-2]系列數據挖掘技術,從中提取出包含在內部的、不被人們知曉的、卻又含有有用的、重要的信息和知識[3-4],為長慶油田的高效開發(fā)、快速發(fā)展提供了有效的數據信息支持。
一、油氣藏研究與決策支持系統(tǒng)
通過借鑒國內外著名油氣公司在油氣勘探計算機軟件研發(fā)方面的經驗[5-6],依托長慶油田豐富的數據資源,利用先進的軟件研發(fā)技術,長慶油田研發(fā)出了一套數字化油氣藏研究(RDMS)系統(tǒng)。它以油氣藏研究為主線,業(yè)務驅動,數據鏈為手段,由協(xié)同工作平臺、數據整合平臺、數據可視化平臺等組成的一體化多學科協(xié)同工作環(huán)境。數字化油氣藏研究系統(tǒng)從功能架構上可劃分為數據服務、基礎工作、協(xié)同研究、決策支持和云軟件五大平臺。基礎工作平臺是以油氣藏數據鏈技術為基礎建立的系統(tǒng)底層框架,為各應用場景的協(xié)同工作提供基礎環(huán)境;協(xié)同研究平臺面向科研人員,通過對不同業(yè)務崗位定制不同工作場景和工作內容,為研究人員提供便捷的數據組織、共享和知識應用平臺;決策支持平臺面向技術主管和普通技術人員,為一體化技術交流及方案決策提供環(huán)境,并實現遠程異地協(xié)同決策;云軟件平臺基于虛擬存儲技術將勘探開發(fā)主流軟件統(tǒng)一部署在云中心服務器,實現專業(yè)軟件接口統(tǒng)一升級、許可動態(tài)調度和集中維護管理。目前,基礎工作平臺、研究工作平臺(29個研究主題)和決策支持平臺(16個決策主題)已基本開發(fā)完成,在勘探開發(fā)研究院、油氣工藝研究院、采油(氣)廠已推廣運行。圖1展示了數字化油氣藏研究與決策支持系統(tǒng)功能模塊的細分情況。
二、數字化油氣藏的數據挖掘技術
長慶油田建設的數字化油氣藏研究與決策支持系統(tǒng),為油田生產的勘探部署、產能建設等決策提供輔助。在決策支持系統(tǒng)的建設中采用了數據挖掘技術,在數據分類的'過程中使用了神經網絡技術,在數據關聯(lián)過程中使用了決策樹方法,在預測過程中使用了回歸分析和貝葉斯網絡。由勘探井的數據結合模型庫系統(tǒng)和數據倉庫系統(tǒng),為井位部署、產能預測、生產方法等決策提供支持。在圖2的結構中有一個模型庫系統(tǒng),它由模型庫、方法庫、數據庫、格式庫、衍生數據庫及其管理系統(tǒng)組成。該系統(tǒng)可被抽象為六元結構,即S={ModelD,methodD,FormD,ParaD,D,DeriveD}。其中,ModelD={model1,model2,…,modeln},它是模型庫,用于集成各種模型。模型庫為整個系統(tǒng)提供支撐。它有包含模型庫管理子系統(tǒng)(MDBMS)對模型庫進行統(tǒng)一的管理,具有對模型定義、建立、存儲、查詢等功能。模型庫是系統(tǒng)的核心結構。用于油氣藏研究的各種數據庫在模型庫中統(tǒng)一管理、調用;MethodD={method1,method2,…,methodn},它是方法庫,集成各模型計算的參數獲取方法。方法庫系統(tǒng)為系統(tǒng)提供算法模型支撐,它包含方法庫管理子系統(tǒng)(ADBMS)對方法庫進行統(tǒng)一的管理;FormD為數據格式庫,定義了每個數據的數據類型,數據格式;ParaD為參數庫,用于存放各種油氣藏分析程序運轉的各種參數;D為數據庫,用于存放計算數學模型所需的各種數據;DevriveD為衍生數據庫,存放油氣藏研究過程中產生的新數據。
三、油氣藏數據挖掘技術的實現
1.建立數據倉庫建立數據倉庫是實現數據挖掘的基礎。本系統(tǒng)中使用的是原型法,快速的實現數據倉,并根據反饋信息修改油氣藏決策步驟中不合理的需求分析和主題情況,為后面的決策工作提供技術基礎和經驗積累。本系統(tǒng)主題是油田勘探井位布置位置、測井實時數據、產能分析、儲量管理等主題。在對油氣藏決策系統(tǒng)進行分析之后,根據油氣藏決策系統(tǒng)中包含的油氣藏數據、決策內容進行邏輯分類。針對各個的分析主題,在油氣藏數據倉庫中建立關系表,用來描述與決策結果相關的各種信息,關系表主要從油氣藏系統(tǒng)數據庫中的流程表中提取數據,包括地質圖、地理圖、地震數據等。在數據倉庫的建設過程中,對油田的盆地、各級構造、圈閉、地震工區(qū)、勘探沉積相、各級儲量區(qū)塊、油田各類開發(fā)生產單元、井等勘探開發(fā)圖形對象的轉換、加載入庫,建立完成地質信息庫。
2.油氣藏研究工作數據抽象和總結技術數據總結的最終結果是對油氣藏研究數據進行抽象模型化,給出油氣藏研究決策工作流程的總體綜合描述。通過對油氣藏數據的歸納抽象,數據挖掘方法能夠將數據庫中的所有數據從較低的個體層次抽象總結到較高的總體層次上,從而實現對原始基本數據的總體把握。在本系統(tǒng)中使用的數據總結方法是目前最為成熟的數學方法,也就是利用數學方法計算出數據庫的各個數據項的統(tǒng)計學特征,如總和、方差、最大值、平均、最小值等;或者通過利用數學中的統(tǒng)計圖形工具,對數據制作統(tǒng)計圖形,如直方圖、餅狀圖等。長慶油田的數字化油氣藏研究系統(tǒng)中利用了OLAP技術實現對油田井位的地質圖、地理圖、地震數據的多維查詢,分析了多種數據的統(tǒng)計特征,同時用多個統(tǒng)計圖形描述了數據間的聯(lián)系。最后對多個數據進行歸納,提取統(tǒng)計信息。
3.數據分類數據挖掘中的分類是建立需要的分類函數或分類模型。通過這個分類模型可以將數據劃分到不同的組中。它的實現步驟一般是:首先分析工作數據的各種特征,并找出或者建立出工作數據的屬性模型,確定數據的歸屬組別,然后利用這些模型來分析工作數據,最后預測后面的工作數據可能會屬的分組。分類應用的實例很多,本系統(tǒng)的采油井中,將油田井位出油量分為好、一般和較差三種類型,以此分析這三種類型井位的各種屬性,特別是位置、地質等屬性,并決定它們分類的關鍵屬性及相互間關系。此后就可以根據這些關鍵屬性對每一個預期的井位進行分析,以便決定預期井位屬于哪一種類型。
4.關聯(lián)分析原始數據庫中各個工作數據都存在相互關聯(lián)、相互影響的聯(lián)系。兩個或多個工作數據的取值之間存在某種邏輯聯(lián)系。這種關聯(lián)關系主要有簡單關聯(lián)和時間關聯(lián)兩種。比如油田井位中的地質環(huán)境、地震數據和出油量存在關聯(lián)。關聯(lián)分析的目的是找出工作數據中隱藏的關聯(lián)網,描述眾多數據項目的密切度或關聯(lián)關系。由于事先往往并不知道工作數據的關聯(lián)是否存在,或者是否可以用精確的關聯(lián)函數描述。因此,關聯(lián)分析生成的規(guī)則通常都帶有置信度,置信度級別描述了關聯(lián)規(guī)則的強度。
5.聚類與分析油藏工作數據往往缺少比較詳細的描述信息,甚至是無法組織成任何分類模式時,通常可以采用聚類分析。通過聚類分析,按照約定的相近程度度量方法或者其他的標準,將工作數據分成許多有意義的子集合;每一個集合中的數據特征相近甚至相同,不同數據集合之間的數據性質差異較大,容易區(qū)分。長慶油田的數字化油氣藏研究在實現過程中,使用了Fayyad過程模型,如圖3所示。在數據挖掘的過程中,系統(tǒng)執(zhí)行一個循環(huán)迭代過程。在每一步的執(zhí)行中,從油田的盆地、各級構造、圈閉、地震工區(qū)、勘探沉積相、各級儲量區(qū)塊、油田各類開發(fā)生產單元等數據中,分析出勘探井位的位置信息,如果發(fā)現某個階段產生的結果和預想的內容有出入。則重復前面階段步驟。
四、結束語
長慶油田針對油氣藏研究數據量大、信息隱晦的技術現狀,建立了油氣藏研究與決策支持系統(tǒng)[7-10],并在其中開發(fā)和應用了系列數據挖掘技術,取得了較大進展:
(1)與眾多學科及技術相融合,形成了包括人工智能、統(tǒng)計學、數據倉庫、在線分析處理、專家系統(tǒng)、數據可視化、高性能計算等數據挖掘技術,將原始數據庫轉化為有用的研究知識,為油氣藏決策了有力支持。
(2)海量數據及其挖掘技術的開發(fā)為油氣藏研究與決策支持系統(tǒng)的高效應用打下了基礎,極大地提高了油氣藏的研究與決策水平,為長慶油田快速發(fā)展提供了強有力的技術支持。
參考文獻
[1]郭萌,王玨.數據挖掘與數據庫知識發(fā)現:綜述[J].模式識別與人工智能,1998,11(03):292-299.
[2]胡侃,夏紹瑋.基于大型數據倉庫的數據采掘:研究綜述[J].軟件學報,1998(01):54-64.
[3]GrossmanR,KasifS,MooreR,etal.Dataminingresearch:Op—portunitiesandchallenges[C].AreportofthreeNSFworkshopsonmininglarge,massive,anddistributeddata,1999.
[4]Deogu*JS,RaghavanVV,SarkarA,etal.Datamining:Re—searchtrends,challenges,andapplications[J].RoughsSetsandDataMining:AnalysisofImpreciseData,1997:9-45.
[5]王宏琳.油氣勘探計算機軟件:平臺體系結構框架[J].石油工業(yè)計算機應用,2004(02):3-8.
[6](美)HohmannL著.藍莉,曾永和譯.超越軟件架構創(chuàng)建和維護優(yōu)秀解決方案[M].北京:中國電力出版社,2005.
[7]石玉江.數字油田中的勘探井位快速部署技術[J].石油工業(yè)計算機應用,2016(12):11-16.
[8]王娟.數字油氣藏數據中心建設的關鍵技術[J].石油工業(yè)計算機應用,2016(1):16-18.
[9]付金華,石玉江,王娟,等.長慶油田勘探開發(fā)服務型共享數據中心構建研究[J].中國石油勘探,2017,22(6):1-8.
[10]王娟,姚衛(wèi)華,石玉江,等.基于云架構的油氣藏數據智能管理技術[J].天然氣工業(yè),2014,34(3):137-141.
【數據挖掘技術下數字化油氣藏研究論文】相關文章:
高校管理中數據挖掘技術的研究論文01-15
大數據時代數據挖掘技術教學研究論文01-20
數據挖掘技術在WEB的運用論文04-26
數據挖掘論文03-31
數據挖掘教學方法研究論文01-20
我國的數據挖掘技術現狀分析論文04-28
專利數據挖掘的論文06-26
基于數據挖掘的數字圖書館檢索技術研究論文11-06