學(xué)習(xí)啦 > 論文大全 > 畢業(yè)論文 > 計(jì)算機(jī)論文 > 計(jì)算機(jī)應(yīng)用 >

ERP系統(tǒng)中數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用

時(shí)間: 楊照華1 分享
摘要:隨著信息的日益豐富,知識(shí)爆炸成為必然,從數(shù)據(jù)中發(fā)現(xiàn)知識(shí)(KDD)和數(shù)據(jù)挖掘已成為重要的技術(shù)。在廣泛實(shí)施了ERP后,如何從海量的業(yè)務(wù)信息中找到有價(jià)值的知識(shí)已成為企業(yè)經(jīng)營(yíng)成敗的關(guān)鍵,在這種背景下,將數(shù)據(jù)遷移到數(shù)據(jù)倉(cāng)庫(kù)變得非常重要。數(shù)據(jù)倉(cāng)庫(kù)的建設(shè)是一個(gè)復(fù)雜、長(zhǎng)期的過(guò)程,特別是針對(duì)企業(yè)ERP系統(tǒng)的建設(shè)。我們通過(guò)一個(gè)汽修行業(yè)進(jìn)銷(xiāo)存系統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)的構(gòu)建,系統(tǒng)闡述了如何在ERP環(huán)境中構(gòu)建數(shù)據(jù)倉(cāng)庫(kù),并對(duì)系統(tǒng)的物理實(shí)施進(jìn)行了論述。
關(guān)鍵詞:信息;ERP;數(shù)據(jù)倉(cāng)庫(kù);OLTP;OLAP;數(shù)據(jù)挖掘
  當(dāng)今社會(huì)是一個(gè)信息爆炸的時(shí)代,信息豐富而知識(shí)貧乏的現(xiàn)象非常普遍。“啤酒搭著尿布賣(mài)”的故事曾經(jīng)觸動(dòng)了多少人的神經(jīng)。信息作為現(xiàn)代企業(yè)的寶貴資源,占據(jù)著越來(lái)越重要的地位,已經(jīng)成為現(xiàn)代企業(yè)科學(xué)管理的基礎(chǔ),正確決策的前提,有效調(diào)控的手段。
  目前,面對(duì)激烈的市場(chǎng)競(jìng)爭(zhēng),許多大型企業(yè)紛紛實(shí)施“以客戶為中心,以服務(wù)求發(fā)展”的經(jīng)營(yíng)策略。 如何優(yōu)化客戶關(guān)系,增強(qiáng)企業(yè)的競(jìng)爭(zhēng)優(yōu)勢(shì)已經(jīng)成為現(xiàn)代企業(yè)關(guān)注的焦點(diǎn)?,F(xiàn)有的應(yīng)用系統(tǒng)往往以“產(chǎn)品”為中心,以“單據(jù)(票證)”處理為基礎(chǔ),是面向聯(lián)機(jī)事務(wù)處理(Online Transaction Processing,簡(jiǎn)稱(chēng)OLTP)的系統(tǒng),而以客戶為中心的經(jīng)營(yíng)管理模式要求對(duì)現(xiàn)有業(yè)務(wù)系統(tǒng)的數(shù)據(jù)進(jìn)行有效的集成并加以重組,建立面向聯(lián)機(jī)分析處理(Online Analysis Processing,簡(jiǎn)稱(chēng)OLAP)的系統(tǒng)。通過(guò)分析客戶的行為,掌握不同類(lèi)型客戶的特征,進(jìn)而為客戶提供更加優(yōu)質(zhì)的服務(wù),尤其是個(gè)性化的服務(wù),同時(shí)全面掌握并理解、分析企業(yè)業(yè)務(wù)的發(fā)生情況,充分發(fā)揮企業(yè)現(xiàn)已積累的數(shù)據(jù),為各級(jí)管理人員提供科學(xué)化管理和決策的有力依據(jù),以提高企業(yè)的經(jīng)營(yíng)業(yè)績(jī),保證利潤(rùn)的持續(xù)增長(zhǎng)。
  同時(shí),隨著企業(yè)信息化程度的不斷提高,各類(lèi)應(yīng)用系統(tǒng)同時(shí)并存并支撐著企業(yè)的業(yè)務(wù)應(yīng)用。越來(lái)越多企業(yè)的信息化主管在開(kāi)發(fā)企業(yè)應(yīng)用時(shí)已經(jīng)考慮到數(shù)據(jù)集成和將來(lái)對(duì)數(shù)據(jù)的整體有效利用,因此,在實(shí)施了ERP解決方案之后,很多企業(yè)選擇實(shí)施數(shù)據(jù)倉(cāng)庫(kù)產(chǎn)品來(lái)避免信息孤島,實(shí)現(xiàn)應(yīng)用的內(nèi)部聯(lián)系和信息的共享。
  什么是數(shù)據(jù)倉(cāng)庫(kù)呢?一般認(rèn)為,數(shù)據(jù)倉(cāng)庫(kù)(Data Warehouse)是一個(gè)面向主題的(Subject Oriented)、集成的(Integrated)、相對(duì)穩(wěn)定的(Non-Volatile)、反映歷史變化(Time Variant)的數(shù)據(jù)集合,用于支持管理決策(Decision Making Support)。
  面向主題:操作型數(shù)據(jù)庫(kù)的數(shù)據(jù)組織面向事務(wù)處理任務(wù),各個(gè)業(yè)務(wù)系統(tǒng)之間各自分離,而數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)是按照一定的主題域進(jìn)行組織的。
  集成的:數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)是在對(duì)原有分散的數(shù)據(jù)庫(kù)數(shù)據(jù)抽取、清理的基礎(chǔ)上經(jīng)過(guò)系統(tǒng)加工、匯總和整理得到的,必須消除源數(shù)據(jù)中的不一致性,以保證數(shù)據(jù)倉(cāng)庫(kù)內(nèi)的信息是關(guān)于整個(gè)企業(yè)的一致的全局信息。
  相對(duì)穩(wěn)定的:數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)主要供企業(yè)決策分析之用,所涉及的數(shù)據(jù)操作主要是數(shù)據(jù)查詢(xún),一旦某個(gè)數(shù)據(jù)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)以后,一般情況下將被長(zhǎng)期保留,也就是數(shù)據(jù)倉(cāng)庫(kù)中一般有大量的查詢(xún)操作,但修改和刪除操作很少,通常只需要定期的加載、刷新。
  反映歷史變化:數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)通常包含歷史信息,系統(tǒng)記錄了企業(yè)從過(guò)去某一時(shí)點(diǎn)(如開(kāi)始應(yīng)用數(shù)據(jù)倉(cāng)庫(kù)的時(shí)點(diǎn))到目前的各個(gè)階段的信息,通過(guò)這些信息,可以對(duì)企業(yè)的發(fā)展歷程和未來(lái)趨勢(shì)做出定量分析和預(yù)測(cè)。
  一個(gè)典型的企業(yè)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)通常包含數(shù)據(jù)源、數(shù)據(jù)存儲(chǔ)與管理、OLAP服務(wù)器以及前端工具與應(yīng)用四個(gè)部分。
  數(shù)據(jù)源:是數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的基礎(chǔ),是整個(gè)系統(tǒng)的數(shù)據(jù)源泉。通常包括企業(yè)內(nèi)部信息和外部信息。
  數(shù)據(jù)的存儲(chǔ)與管理:是整個(gè)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的核心。在現(xiàn)有各業(yè)務(wù)系統(tǒng)的基礎(chǔ)上,對(duì)數(shù)據(jù)進(jìn)行抽取、清理,并有效集成,按照主題進(jìn)行重新組織,最終確定數(shù)據(jù)倉(cāng)庫(kù)的物理存儲(chǔ)結(jié)構(gòu),同時(shí)組織存儲(chǔ)數(shù)據(jù)倉(cāng)庫(kù)元數(shù)據(jù)(具體包括數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)字典、記錄系統(tǒng)定義、數(shù)據(jù)轉(zhuǎn)換規(guī)則、數(shù)據(jù)加載頻率以及業(yè)務(wù)規(guī)則等信息)。
  OLAP服務(wù)器:對(duì)分析需要的數(shù)據(jù)按照多維數(shù)據(jù)模型進(jìn)行再次重組,以支持用戶多角度、多層次的分析,發(fā)現(xiàn)數(shù)據(jù)趨勢(shì)。其具體實(shí)現(xiàn)可以分為:ROLAP、MOLAP和HOLAP。
  前端工具與應(yīng)用:前端工具主要包括各種數(shù)據(jù)分析工具、報(bào)表工具、查詢(xún)工具、數(shù)據(jù)挖掘工具以及各種基于數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)集市開(kāi)發(fā)的應(yīng)用。其中數(shù)據(jù)分析工具主要針對(duì)OLAP服務(wù)器,報(bào)表工具、數(shù)據(jù)挖掘工具既針對(duì)數(shù)據(jù)倉(cāng)庫(kù),同時(shí)也針對(duì)OLAP服務(wù)器。
  在傳統(tǒng)的ERP系統(tǒng)中,一般的核心應(yīng)用都是進(jìn)銷(xiāo)存管理和賬務(wù)管理,數(shù)據(jù)庫(kù)中的數(shù)據(jù)也是緊緊圍繞產(chǎn)品信息、票據(jù)和賬目明細(xì)進(jìn)行的。這樣的數(shù)據(jù)層可以很好地實(shí)現(xiàn)OLTP,但如果要為企業(yè)高層提供決策數(shù)據(jù)的話,就有必要對(duì)這樣原始的、松散的、孤立的數(shù)據(jù)進(jìn)行抽取、清洗、加上時(shí)間標(biāo)記并進(jìn)行合理的分類(lèi),以使之能夠進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)并支持OLAP。
  下面通過(guò)一個(gè)小型汽修行業(yè)進(jìn)銷(xiāo)存系統(tǒng)(以下簡(jiǎn)稱(chēng)A系統(tǒng))數(shù)據(jù)倉(cāng)庫(kù)的建立,來(lái)說(shuō)明ERP系統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)建立的步驟及應(yīng)注意的一些問(wèn)題。
  A系統(tǒng)原有的數(shù)據(jù)層是典型的數(shù)據(jù)庫(kù)系統(tǒng),核心表為產(chǎn)品信息表、客戶信息表、供應(yīng)商信息表、庫(kù)存表、銷(xiāo)售表、客戶明細(xì)表和供應(yīng)商明細(xì)表等。這些表格在運(yùn)行中很好地解決了OLTP,同時(shí)可對(duì)企業(yè)高層提供基本的一些OLAP,如庫(kù)存查詢(xún)、銷(xiāo)售查詢(xún)等,但這些功能相對(duì)高層決策的需求是遠(yuǎn)遠(yuǎn)不夠的,因此有必要對(duì)原系統(tǒng)的數(shù)據(jù)庫(kù)進(jìn)行改造,建立合理有效的數(shù)據(jù)集市或數(shù)據(jù)倉(cāng)庫(kù),以適應(yīng)企業(yè)遠(yuǎn)期的戰(zhàn)略目標(biāo)。
  數(shù)據(jù)倉(cāng)庫(kù)的建立是一個(gè)復(fù)雜的過(guò)程,首先要進(jìn)行規(guī)劃和分析,我們對(duì)原系統(tǒng)的數(shù)據(jù)進(jìn)行分析,將原來(lái)孤立分散的數(shù)據(jù)元素進(jìn)行抽取和清洗分類(lèi),把數(shù)據(jù)劃分成了以下幾個(gè)類(lèi):客戶類(lèi)(包含原有系統(tǒng)中的客戶信息、客戶賬目明細(xì)等相關(guān)客戶信息)、供應(yīng)商類(lèi)(包含相關(guān)供應(yīng)商所有信息)、賬目類(lèi)(包含進(jìn)銷(xiāo)存的帳目往來(lái)及明細(xì)數(shù)據(jù))、票據(jù)類(lèi)(包含相關(guān)帳目票據(jù))等。數(shù)據(jù)類(lèi)的劃分將原來(lái)松散孤立的數(shù)據(jù)根據(jù)使用特征有機(jī)地結(jié)合到了一起,可以有效地支持OLAP,同時(shí)為以后系統(tǒng)的擴(kuò)展及升級(jí)也打下了良好的基礎(chǔ)。不致于因一發(fā)而動(dòng)全身。
  將原有的數(shù)據(jù)庫(kù)數(shù)據(jù)進(jìn)行清洗分類(lèi)后,下一步即開(kāi)始數(shù)據(jù)倉(cāng)庫(kù)物理結(jié)構(gòu)及存儲(chǔ)的實(shí)施。目前,IBM、Oracle、Sybase、CA、NCR、Informix、Microsoft、和SAS等有實(shí)力的公司相繼(通過(guò)收購(gòu)或研發(fā)的途徑)推出了自己的數(shù)據(jù)倉(cāng)庫(kù)解決方案,BO和Brio等專(zhuān)業(yè)軟件公司也在前端在線分析處理工具市場(chǎng)上占有一席之地。在A項(xiàng)目數(shù)據(jù)倉(cāng)庫(kù)解決方案的選擇上,我們選擇了Microsoft的SQL Server 2005作為數(shù)據(jù)倉(cāng)庫(kù)實(shí)現(xiàn)工具。做為微軟新一代的數(shù)據(jù)庫(kù)產(chǎn)品,SQL Server 2005提供了很多新的功能,性能更加強(qiáng)大,同時(shí),A系統(tǒng)原來(lái)的數(shù)據(jù)層是采用SQL Server 2000,因此采用SQL Server 2005可以很好地實(shí)現(xiàn)數(shù)據(jù)的提取和轉(zhuǎn)換。同時(shí),由于都是微軟的產(chǎn)品,我們今后擴(kuò)充A系統(tǒng)時(shí),前臺(tái)的查詢(xún)和報(bào)表工具就可以采用dot net平臺(tái)實(shí)現(xiàn),無(wú)論采用C#還是VB.NET語(yǔ)言都可以實(shí)現(xiàn)強(qiáng)大的OLAP分析功能。
  最終,由于經(jīng)過(guò)了詳細(xì)的設(shè)計(jì)和建模,A系統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)的實(shí)施取得了良好的效果,系統(tǒng)的轉(zhuǎn)換較為成功,新系統(tǒng)在數(shù)據(jù)倉(cāng)庫(kù)的支持下為高層決策提供了極好的支持。同時(shí),由于采用了數(shù)據(jù)倉(cāng)庫(kù),A系統(tǒng)的功能和擴(kuò)展性也有了很大提高。為以后進(jìn)一步進(jìn)行操作數(shù)據(jù)存儲(chǔ)(ODS)和數(shù)據(jù)挖掘(DATA MINEING)打下了堅(jiān)實(shí)的基礎(chǔ)。
  
參考文獻(xiàn):
[1]張友生,徐峰 《系統(tǒng)分析師技術(shù)指南》 清華大學(xué)出版社 2004
[2]http://www.enet.com.cn/article/2006/1212/A20061212332464.shtml 《九大數(shù)據(jù)倉(cāng)庫(kù)解決方案的性能和特點(diǎn)比較》
[3]http://www.enet.com.cn/article/2006/1212/A20061212332464_2.shtml《九大數(shù)據(jù)倉(cāng)庫(kù)解決方案的性能和特點(diǎn)比較》
[4]朱德利《SQLServer2005數(shù)據(jù)挖掘與商業(yè)智能完全解決方案》 電子工業(yè)出版社 2007
[5]飛思科技產(chǎn)品研發(fā)中心編《Oracle 9i數(shù)據(jù)倉(cāng)庫(kù)構(gòu)建技術(shù)》電子工業(yè)出版社 2003。
20730