《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 業界動態 > 基于數據倉庫的數據挖掘技術研究現狀與進展

基于數據倉庫的數據挖掘技術研究現狀與進展

2009-06-12
作者:朱玉穎,劉宏偉,張 巖

  摘 要: 隨著時間的推移,社會的進步,越來越多的數據被海量積累下來,如何合理處理數據,并利用相關數據獲取人們所需的知識,是進入21世紀以來人們一直深入研究的方向。以此為出發點,從數據倉庫與數據挖掘的誕生談起,詳細介紹了數據倉庫的構建、幾種數據挖掘算法以及數據挖掘過程,分析提出了數據挖掘技術的進一步發展和研究方向。
  關鍵詞:SQL Server 2000;數據倉庫;數據挖掘

?

?  隨著計算機應用技術的快速發展,令各行各業收集數據的能力大力提升,隨之也就帶來了“數據爆炸”現象。如何將這些海量數據存儲與分析,令其轉換成信息和知識,輔助決策管理,成為亟待解決的問題。由此,數據倉庫與數據挖掘技術應運而生。
  20世紀90年代初期INMON W H.在其里程碑式的著作《Building the Datahouse》中提出了“數據倉庫”的概念[1],而后隨著數據庫與計算機技術的不斷進步,數據倉庫技術也得以快速發展,并逐漸滲透到生物醫學、零售、醫學信息系統、移動通信等行業中。
  數據挖掘技術自從1989年8月在底特律召開的研討會上提出后迅速發展,該研討會組委會在1997年開始擁有了自己的雜志“Knowledge Discovery and Data Mining”,并且在數據倉庫的基礎上,在保險業務、金融風險預測、基因工程研究、產品產量和質量分析等領域中得到了成功應用。
1? 數據倉庫技術
1.1 數據倉庫介紹

  數據倉庫不僅包含分析所需的數據,而且包含處理數據所需的應用程序,這些程序包括將數據由外部媒體轉入數據倉庫的應用程序,也包括了將數據加以分析并呈現給用戶的應用程序。
根據該定義,一個數據倉庫包括了數據以及負責管理與分析工作的程序管理器,其主要目的是提供可用的數據,使分析人員可以取得所需的正確統計信息,以作為管理決策的參考依據。
1.2 數據倉庫系統的架構
  一個數據倉庫的大小一般都是在100 GB以上,因為傳統的關系數據庫技術是針對OLTP而發展的,并不適用于數據量大而且復雜度高的數據倉庫系統,需要用不同的方式來設計和開發一個數據倉庫系統。
  因此提出一個新名詞——系統管理器,它是由多個程序所構成的,而成為層次式的架構,至于一個管理程序的功能與復雜度則會因數據倉庫系統而異。系統管理器向下可分為3個管理器:加載管理器(Load Manager)、倉庫管理器(Warehouse Manager)和查詢管理器(Query Manager)。圖1所示架構圖實現了一個數據倉庫系統的架構,就數據層面而言,圖中標示出了3個層次:數據、信息以及決策。而圖中各管理器職責為:
 ?。?)加載管理器:程序需實現抽取與加載,功能為抽取并加載數據,在加載數據之前與進行中執行簡單的轉換。
  (2)倉庫管理器:程序需實現整理與轉換、備份與備存,功能為轉換并管理數據倉庫數據、備份與備存數據。
  (3)查詢管理器:程序需實現查詢功能,從而可引導并管理數據倉庫的查詢。

1.3 數據倉庫設計
  數據倉庫的設計和創建是一個分布實施的連貫過程,在確定用戶需求的基礎上,完成數據倉庫的設計和建立、提取和加載,最后進行長期的使用和維護。從系統的角度看,數據倉庫的建立首先必須明確其設計方法,針對解決問題的短期性或長效性,將數據倉庫設計方法分為以下3種:
 ?。?)自頂向下的方法:該方法把企業需求作為實現數據倉庫的首要任務,其成本、難度和時間花費都遠遠大于自下向上的方法,一般適合于取得長期效益。
 ?。?)自底向上的方法:該方法設計較小的、更集中的數據倉庫應用,可以簡化整體處理過程,為兼顧縮短開發時間和可縮放企業應用提供了折中的方案,是快速實現數據集市、部門數據倉庫的有效手段。
 ?。?)聯合方法:是以上兩種方法的合成,企業在保持自底向上方法實現和基于應用的同時,還能利用自頂向下方法的規劃和決策,為企業保留建立長遠決策方案提供了機會[2]。
2 數據挖掘算法
2.1 數據挖掘理論
  數據挖掘是指從大量的、不完全的、有噪聲的、模糊的、隨機的數據中,提取隱含的、預先不知道的、但又潛在有用的信息和知識的過程。數據挖掘的相近術語,包括知識發現、數據分析、數據融合(Data Fusion)以及決策支持等。人們把原始數據看作是形成知識的源泉,就像從礦石中采礦一樣。原始數據可以是結構化的,如關系數據庫中的數據,也可以是半結構化的,如文本、圖形、圖像數據,甚至可以是分布在網絡上的異構型數據。發現知識的方法可以是數學的,也可以是非數學的;可以是演繹的,也可以是歸納的。已發現知識不僅可以被用于信息管理、查詢優化、決策支持、過程控制等,還可以用于數據自身的維護。
2.2 數據挖掘基本算法
2.2.1.關聯規則
 ?。?)關聯規則的定義

  如果項集的出現頻率大于或等于min_sup與D中事務總數的乘積,則項集滿足最小支持度min_sup;如果項集滿足最小支持度,則稱它為頻繁項集,頻繁k-項集的集合通常記作Lk。關聯規則分為兩步:找出所有頻繁項集和由頻繁項集產生關聯規則。
  (2)Apriori算法:使用候選項集找頻繁項集
  Apriori算法[4]是一種最有影響的挖掘布爾關聯規則頻繁項集的算法。Apriori使用一種稱作逐層搜索的迭代方法,k-項集用于探索(k+1)-項集。首先,找出頻繁1-項集的集合。該集合記作L1。L1用于找頻繁2-項集的集合L2,而L2用于找L3,如此下去,直到不能找到頻繁k-項集。找每個Lk需要一次數據庫掃描。
  為提高頻繁項集逐層產生的效率,用Apriori性質來壓縮搜索空間,該性質稱為Apriori性質:即頻繁項集的所有非空子集都必須也是頻繁的。Apriori性質基于如下觀察:根據定義,如果項集I不滿足最小支持度閥值min_sup,則I不是頻繁的,即P(I)??? (3)由頻繁項集產生關聯規則
  一旦由數據庫D中的事務找出頻繁項集,由它們產生強關聯規則是直截了當的,對于置信度,可以用下式,其中條件概率用項集支持度計數表示:
  

  其中support_count(A∪B)是包含項集A∪B的事務數,support_count(A)是包含項集A的事務數。根據該式,關聯規則可以產生如下:
  對于每個頻繁項集l,產生l的所有非空子集;
  對于l的每個非空子集s,如果

  Apriori算法在剪枝步中的每個元素需在交易數據庫中進行驗證來決定其是否加入,這里的驗證過程是算法性能的瓶頸,這個方法要求多次重復掃描可能很大的交易數據庫,還會產生大量的候選項集,這是Apriori算法的兩大缺點。
2.2.2 遺傳算法
  遺傳算法是進化計算方法的實例,是優化型算法。遺傳算法是一個計算模型,由5部分組成:個體的初始集合P、雜交技術、變異算法、適應度函數以及對P反復應用雜交技術和變異技術的算法。該算法用適應度函數確定P中應保留的最優個體。算法每次迭代都從種群中替換許多預先定義的個體,直至達到某一閾值為止。遺傳算法的優點是容易并行化,但它也存在許多缺點:遺傳算法對于最終用戶來說很難理解和解釋、問題抽象和個體表述十分困難、最佳的適應度函數難以確定以及雜交和變異過程難以確定。
2.2.3 決策樹
  決策樹[5]是一個類似于流程圖的樹結構,其中每個內部節點表示一個屬性上的測試,每個分枝代表一個測試輸出,而每個樹葉節點代表類或類分布。決策樹根據不同的特征,以樹型結構表示分類或決策集合,產生規則和發現規律。決策樹的算法主要有:ID3算法、C4.5算法、SLIQ算法和SPRINT算法。
3? 數據挖掘的過程
3.1 確定業務對象

  清晰地定義出業務問題,認清數據挖掘的目的是數據挖掘的重要一步。挖掘的最后結構是不可預測的,但要探索的問題應是可預見的,為了數據挖掘而數據挖掘則帶有盲目性,是不會成功的。
3.2 數據準備
??? (1)數據的選擇,搜索所有與業務對象有關的內部和外部數據信息,并從中選擇出適用于數據挖掘應用的數據;
??? (2)數據的預處理,研究數據的質量,為進一步分析作準備,并確定將要進行的挖掘操作的類型;
??? (3)數據的轉換,將數據轉換成一個分析模型,這個分析模型是針對挖掘算法建立的,建立一個真正適合挖掘算法的分析模型是數據挖掘成功的關鍵。
3.3 數據挖掘
  對所得到的經過轉換的數據進行挖掘,除了完善從選擇合適的挖掘算法外,其余一切工作都能自動地完成。
3.4 結果分析
  解釋并評估結果,其使用的分析方法一般應以數據挖掘操作而定,通常會用到可視化技術。
3.5 知識的同化
  將分析所得到的知識集成到業務信息系統的組織結構中去。
總之,數據挖掘過程需要多次的循環反復,才有可能達到預期的效果,如圖2所示。

?


4 研究展望
  隨著大量算法的完善,數據倉庫技術越發成熟,挖掘過程的系統化和規范化、挖掘工具的不斷推陳出新,數據倉庫與數據挖掘技術已顯示了它廣泛的應用前景。如:
 ?。?)應用的探索:目前正探索擴大其應用范圍,如生物醫學、電信等領域。
  (2)可伸縮的數據挖掘方法:一個重要方向是基于約束的挖掘,該方向致力于在增加用戶交互同時改進挖掘處理的總體效率。
 ?。?)數據挖掘與數據庫系統、數據倉庫系統和Web數據庫系統的集成:數據挖掘系統的理想體系結構是與數據庫和數據倉庫系統的緊耦合方式。
 ?。?)數據挖掘語言的標準化。
 ?。?)可視化數據挖掘:可視化數據挖掘是從大量數據中發現知識的有效途徑。
 ?。?)復雜數據類型挖掘的新方法:復雜數據類型挖掘是數據挖掘中一項重要的前沿研究課題。
  (7)Web挖掘:有關Web內容挖掘、Web日志挖掘和因特網上的數據挖掘服務,將成為數據挖掘中一個最為重要和繁榮的子領域。
 ?。?)數據挖掘中的隱私保護與信息安全。
  數據挖掘在研究領域和商業領域中越來越多的應用,已經得到人們的關注,促使這一技術得到迅速發展和完善。當看到它給人們帶來利益的同時,也不能忽視存在的問題,例如:數據挖掘方法的效率還有待提高,尤其是超大規模數據集中數據挖掘的效率,以及挖掘結果的無效性等等。目前應予綜合考慮的是:采用數據挖掘解決的商業問題的類型,為進行數據挖掘所作的數據準備,數據挖掘的各種算法和理論基礎。
  總之,數據挖掘技術是一個年輕且充滿希望的研究領域,如何在數據倉庫的基礎上,加大力度,促使每年都有新的數據挖掘方法和模型問世,仍然是探究的方向。

考文獻
[1]?INMON,W.H.Building the data warehouse,third edition.Copytightc2002 by John Wiley & Sons,Inc:21-24.
[2]?彭木根. 數據倉庫技術與實現[M].北京,電子工業出版社,2000:181-206.
[3]?陳華英,李京.莊成三.構建醫療衛生信息數據倉庫研究[J]. 四川大學學報(自然科學版),2001,38(4):505-508.
[4]?石麗,李堅.數據倉庫與決策支持.北京.國防工業出版社,2003:149-154.
[5]?朱邵文,胡紅銀,王泉德,等.決策樹數據采掘及發展[J].計算機工程,2000,26(10):1-3,35.

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
热re99久久精品国产66热_欧美小视频在线观看_日韩成人激情影院_庆余年2免费日韩剧观看大牛_91久久久久久国产精品_国产原创欧美精品_美女999久久久精品视频_欧美大成色www永久网站婷_国产色婷婷国产综合在线理论片a_国产精品电影在线观看_日韩精品视频在线观看网址_97在线观看免费_性欧美亚洲xxxx乳在线观看_久久精品美女视频网站_777国产偷窥盗摄精品视频_在线日韩第一页
  • <strike id="ygamy"></strike>
  • 
    
      • <del id="ygamy"></del>
        <tfoot id="ygamy"></tfoot>
          <strike id="ygamy"></strike>
          欧美高清在线播放| 蜜桃av久久久亚洲精品| 1024成人网色www| 久久激情中文| 最新成人av网站| 亚洲成色777777女色窝| 久久亚洲色图| 亚洲第一在线| 在线亚洲+欧美+日本专区| 欧美高清在线视频观看不卡| 国产亚洲精品自拍| 欧美视频在线观看一区| 老妇喷水一区二区三区| 激情视频亚洲| 在线国产精品一区| 一区二区高清视频| 亚洲综合视频一区| 欧美日韩美女一区二区| 亚洲男人的天堂在线观看| 国产精品入口| 美女脱光内衣内裤视频久久影院| 欧美日韩精选| 亚洲第一网站免费视频| 亚洲一卡二卡三卡四卡五卡| 欧美日韩一区二区三区在线视频| 91久久国产自产拍夜夜嗨| 欧美日韩的一区二区| 欧美四级剧情无删版影片| 国产精品v日韩精品v欧美精品网站| 欧美福利在线| 久久精品成人一区二区三区蜜臀| 亚洲电影自拍| 国模精品一区二区三区色天香| aⅴ色国产欧美| 亚洲国产婷婷综合在线精品| 国产精品视频久久一区| 午夜精品久久99蜜桃的功能介绍| 最新亚洲视频| 91久久久久久久久久久久久| 国产精品一区二区三区久久| 在线亚洲免费视频| 日韩一级在线观看| 在线视频国产日韩| 在线欧美亚洲| 蜜桃久久精品乱码一区二区| 亚洲人精品午夜在线观看| 亚洲免费成人av电影| 欧美日韩精品一区二区| 国产欧美日韩综合一区在线播放| 欧美日韩高清在线观看| 国产亚洲激情视频在线| 亚洲第一级黄色片| 亚洲天堂激情| 久久亚洲精选| 欧美一区2区视频在线观看| 亚洲欧美日韩在线| 亚洲男女自偷自拍| 噜噜爱69成人精品| 欧美在线视频免费播放| 国产日韩欧美不卡在线| 亚洲日本无吗高清不卡| 久久久久久网| 国产欧美日本一区视频| 另类图片综合电影| 国产精品福利久久久| 中文av字幕一区| 午夜一区二区三区不卡视频| 欧美国产日韩一区| 欧美在线观看一区二区| 日韩五码在线| 久久一区二区视频| 亚洲日本精品国产第一区| 亚洲精品久久久久久久久久久| 国产精品久久一区主播| 国内久久婷婷综合| 欧美日韩国产色视频| 久久精品一区二区国产| 久久久久久尹人网香蕉| 久久精品国产亚洲高清剧情介绍| 91久久夜色精品国产网站| 国产在线播精品第三| 亚洲自拍偷拍一区| 欧美不卡一卡二卡免费版| 国产欧美日韩精品在线| 一区二区三区无毛| 99在线|亚洲一区二区| 亚洲日本成人在线观看| 国产一区亚洲一区| 国产精品久久久久久一区二区三区| 娇妻被交换粗又大又硬视频欧美| 欧美女主播在线| 亚洲三级视频| 欧美视频一区二区三区…| 久久久91精品国产一区二区三区| 欧美精品成人91久久久久久久| 日韩一区二区精品视频| 欧美另类高清视频在线| 亚洲国产成人av| 欧美日韩高清在线一区| 欧美日韩精品免费观看视一区二区| 美玉足脚交一区二区三区图片| 国产精品亚洲一区二区三区在线| 亚洲欧美影音先锋| 欧美一级专区免费大片| 国产精品二区三区四区| 亚洲人精品午夜| 久久av一区二区三区| 免费视频一区二区三区在线观看| 亚洲欧美日本另类| 亚洲三级电影全部在线观看高清| 国产精品久久久久久久久果冻传媒| 香蕉久久夜色| 久久精品国产第一区二区三区| 亚洲福利国产精品| 欧美久久久久| 国产精品一区二区在线观看网站| 亚洲图片欧美日产| 国产精品理论片在线观看| 中文国产成人精品久久一| 亚洲精品影院| 中文国产成人精品久久一| 国产精品欧美日韩一区二区| 先锋影院在线亚洲| 亚洲欧美日韩精品久久久久| 国产乱码精品一区二区三| 欧美特黄视频| 欧美日韩免费一区二区三区| 亚洲精品永久免费精品| 韩国v欧美v日本v亚洲v| 欧美激情一区三区| 欧美午夜精彩| 亚洲精品国产日韩| 亚洲欧美久久久| 欧美日韩国产bt| 黄色另类av| 欧美电影打屁股sp| 一区二区三欧美| 国产精品专区一| 一本色道久久综合亚洲精品不| 99re国产精品| 欧美国产精品人人做人人爱| 欧美日韩一区二区精品| 亚洲精品国产精品乱码不99| 国内外成人免费激情在线视频网站| 欧美一级理论片| 国产在线观看精品一区二区三区| 久久精品一区蜜桃臀影院| 一区二区亚洲精品国产| 一本大道av伊人久久综合| 欧美香蕉大胸在线视频观看| 久久久久女教师免费一区| 欧美91福利在线观看| 亚洲中字黄色| 欧美精品v国产精品v日韩精品| 国产精品一区二区男女羞羞无遮挡| 国产日韩欧美日韩大片| 亚洲欧美视频在线观看视频| 一区二区在线观看视频在线观看| 亚洲小说区图片区| 久久婷婷人人澡人人喊人人爽| 欧美视频观看一区| 国产精品一区二区在线| 亚久久调教视频| 欧美激情1区2区3区| 蜜臀久久99精品久久久画质超高清| 免费国产一区二区| 国产欧美日韩在线观看| 欧美日韩国产麻豆| 久久综合久久美利坚合众国| 亚洲一区二区三区四区视频| 欧美日韩一区二区在线观看视频| 国内精品伊人久久久久av影院| 欧美激情综合色| 亚洲毛片在线看| 久久久成人精品| 一区二区三区三区在线| 欧美黄网免费在线观看| 一区二区三区欧美在线观看| 欧美巨乳在线| 好吊视频一区二区三区四区| 怡红院av一区二区三区| 欧美精品国产精品| 99人久久精品视频最新地址| 欧美成人在线免费观看| 9久re热视频在线精品| 亚洲一区精品电影| 欧美日韩在线观看视频| 国产日产精品一区二区三区四区的观看方式| 99精品免费视频| 亚洲欧洲三级| 欧美诱惑福利视频| 亚洲女女女同性video| 久久手机精品视频| 亚洲自拍偷拍麻豆| 久久精品国产久精国产一老狼| 欧美精品在线一区二区三区| 另类成人小视频在线| 好看的av在线不卡观看| 国产亚洲成精品久久| 国产精品福利在线| 国内精品久久久久久| 国内外成人免费视频| 久久久999精品视频| 久久久亚洲一区| 国产午夜精品在线观看| 你懂的国产精品永久在线| 久久久久久久久久久久久女国产乱| 国产真实久久| 欧美日韩亚洲一区在线观看| 亚洲午夜久久久久久久久电影院| 欧美日本三区| 欧美福利专区| 麻豆九一精品爱看视频在线观看免费| 欧美日韩直播| 国内成+人亚洲+欧美+综合在线| 国产欧美一区二区精品性色| 99re66热这里只有精品3直播| 美女91精品| 欧美高清视频| 亚洲精品资源美女情侣酒店| 欧美一区二区三区婷婷月色| 国产综合久久| 欧美亚洲综合网| 久久婷婷久久一区二区三区| 国产欧美1区2区3区| 一区久久精品| 一区二区三区日韩在线观看| 欧美好吊妞视频| 在线午夜精品| 久久一区二区精品| 欧美成人免费一级人片100| 久久国产天堂福利天堂| 亚洲人成在线观看| 欧美亚洲动漫精品| 亚洲视频欧洲视频| 免费在线国产精品| 欧美精品日日鲁夜夜添| 午夜亚洲福利在线老司机| 亚洲精品一区二区三区蜜桃久| 免费黄网站欧美| 欧美在线不卡视频| 久久久亚洲人| 日韩手机在线导航| 国产专区一区| 国产精品日本一区二区| 亚洲影视九九影院在线观看| 久久国产日本精品| 亚洲第一免费播放区| 国模叶桐国产精品一区| 国产欧美日韩免费看aⅴ视频| 国产精品久久久久久影院8一贰佰| 国内精品**久久毛片app| 国产麻豆精品theporn| 欧美精品一区二区蜜臀亚洲| 欧美日韩国产免费| 国产午夜精品理论片a级大结局| 亚洲人体一区| 亚洲国产午夜| 亚洲电影免费在线| 国产精品日韩二区| 久久精品在线播放| 久久久国产成人精品| 欧美日韩在线免费| 欧美国产日韩一区二区在线观看| 欧美成人免费在线| 91久久夜色精品国产网站| 免费亚洲电影| 欧美日韩在线视频一区二区| 极品av少妇一区二区| 国产精品啊啊啊| 国精产品99永久一区一区| 玖玖玖国产精品| 亚洲三级视频| 久久久亚洲成人| 欧美日韩视频在线观看一区二区三区| 欧美日韩亚洲一区二区三区在线观看| 欧美高清在线| 欧美久久精品午夜青青大伊人| 久热精品视频| 亚洲人www| 久久国产精品一区二区三区| 国产精品一区二区久久久| 欧美精品久久久久久| 欧美在线观看视频一区二区| 国产精品一区二区男女羞羞无遮挡| 欧美日韩一区二区免费在线观看| 欧美不卡视频一区| 亚洲国产精品成人综合色在线婷婷| 亚洲一区影音先锋| 巨胸喷奶水www久久久免费动漫| 国产精品欧美日韩一区| 欧美制服丝袜第一页| 亚洲欧洲视频在线| 欧美一区二区成人| 欧美激情视频给我| 欧美激情一二三区| 亚洲精品一区二区在线观看| 国产日韩精品电影| 国产精品99久久久久久白浆小说| 亚洲线精品一区二区三区八戒| 欧美丰满高潮xxxx喷水动漫| 欧美肉体xxxx裸体137大胆| 亚洲免费成人| 一区精品在线| 午夜精品一区二区三区四区| 国产视频一区二区在线观看| 国产精品揄拍一区二区| 国产精品自拍一区| 91久久嫩草影院一区二区| 欧美午夜在线| 99视频+国产日韩欧美| 亚洲精品小视频在线观看| 欧美在线视频导航| 日韩天天综合| 久久嫩草精品久久久精品一| 亚洲永久视频| 久久精品国产第一区二区三区| 国产精品拍天天在线| aa日韩免费精品视频一| 欧美wwwwww| 一本一本久久a久久精品牛牛影视| 国产欧美一二三区| 亚洲欧美日韩综合一区| 欧美喷潮久久久xxxxx| 在线亚洲美日韩| 欧美亚洲一区二区三区| 久久亚洲国产精品日日av夜夜| 欧美大胆a视频|