學(xué)習(xí)啦 > 論文大全 > 技術(shù)論文 > 圖片檢索技術(shù)論文(2)

圖片檢索技術(shù)論文(2)

時(shí)間: 家文952 分享

圖片檢索技術(shù)論文

  圖片檢索技術(shù)論文篇二

  網(wǎng)絡(luò)信息檢索中的圖像檢索技術(shù)

  [摘 要] 圖像檢索是網(wǎng)絡(luò)信息檢索中的重要的組成部分,而其檢索技術(shù)卻相對(duì)滯后?;趦?nèi)容的圖像檢索已成為網(wǎng)絡(luò)信息檢索技術(shù)的研究熱點(diǎn)。本文分析并總結(jié)了圖像檢索的概念,綜述了基于內(nèi)容的圖像檢索系統(tǒng)和相關(guān)技術(shù)。

  [關(guān)鍵詞] 網(wǎng)絡(luò)信息檢索; 基于內(nèi)容; 圖像檢索技術(shù)

  [中圖分類號(hào)] G354.47 [文獻(xiàn)標(biāo)識(shí)碼] A [文章編號(hào)] 1673 - 0194(2013)03- 0073- 02

  隨著網(wǎng)絡(luò)信息資源的迅速增加,信息多樣化的程度不斷加大,諸如圖形、圖像、音頻、視頻、動(dòng)畫等多媒體信息日漸豐富,其中圖像信息的需求尤為大量,而當(dāng)前主要以文本方式進(jìn)行檢索的技術(shù)已不能滿足人們對(duì)信息的需求。

  基于文本的檢索是搜索引擎將網(wǎng)站、網(wǎng)頁(yè)的內(nèi)容索引為一系列的關(guān)鍵字,當(dāng)用戶輸入相應(yīng)關(guān)鍵字后,系統(tǒng)根據(jù)數(shù)據(jù)庫(kù)中的倒排文檔將關(guān)鍵字映射為網(wǎng)站或網(wǎng)頁(yè)的地址。圖像信息基于文本的檢索技術(shù),即根據(jù)圖像信息的文件名、路徑名、ALT標(biāo)簽等,將其標(biāo)注為一系列關(guān)鍵字的描述,然后通過(guò)檢索這些描述以達(dá)到檢索圖像信息的目的。這種檢索技術(shù)很不實(shí)用。首先,由于目前的計(jì)算機(jī)視覺(jué)和人工智能技術(shù)都無(wú)法自動(dòng)對(duì)圖像進(jìn)行標(biāo)注,要由人工完整地標(biāo)注網(wǎng)絡(luò)上的所有圖像,不但費(fèi)時(shí)費(fèi)力,而且往往是不準(zhǔn)確或不完整的;其次,不同用戶對(duì)于同一張圖像的看法不盡相同,導(dǎo)致對(duì)圖像的標(biāo)注沒(méi)有一個(gè)統(tǒng)一標(biāo)準(zhǔn);再次,這種方法將注意力局限在圖像的著錄特征,即文字描述上,不能充分揭示和描述圖像中有代表性的畫面內(nèi)容特征。所以基于內(nèi)容的圖像檢索技術(shù)應(yīng)用而生。

  1 基于內(nèi)容的圖像檢索技術(shù)

  基于內(nèi)容的圖像檢索一般是指靜止圖像的檢索。這種圖像檢索技術(shù)通過(guò)分析圖像的內(nèi)容,提取其顏色、形狀、紋理等可視特征,建立特征索引存儲(chǔ)于特征庫(kù)中,在檢索時(shí),用戶只需把自己對(duì)圖像的模糊印象描述出來(lái)(繪制的草圖或通過(guò)掃描儀等在線輸入的圖像),就可以通過(guò)多次的近似匹配,在大容量圖像庫(kù)中查詢到所需圖像?;趦?nèi)容的圖像檢索具有較強(qiáng)的客觀性。

  基于內(nèi)容的圖像檢索算法涉及的相關(guān)技術(shù)比較多,主要有:圖像的分析與特征向量的提取技術(shù)、特征向量數(shù)據(jù)的組織與存儲(chǔ)技術(shù)、圖像數(shù)據(jù)的組織與存儲(chǔ)技術(shù)等。

  1.1 基于顏色特征的圖像檢索

  顏色特征是圖像檢索中最基礎(chǔ)的一種檢索依據(jù),顏色是人識(shí)別圖像的主要感知特征之一。在基于顏色特征的檢索算法中,通常用顏色直方圖來(lái)表示圖像的顏色特征。直方圖能較好地反映圖像中各顏色的頻率分布,橫軸表示顏色等級(jí),縱軸表示在一個(gè)顏色等級(jí)上,具有該顏色的像素在整幅圖像中所占的比例。直方圖可以對(duì)整幅圖像進(jìn)行最大匹配度檢索。目前關(guān)于色彩的索引方法有兩類:基于全局色彩的索引與基于局部色彩的索引。

  全局色彩的索引就是按全局色彩的分布來(lái)索引圖像,計(jì)算每種顏色的像素,檢索出具有相同顏色內(nèi)容的像素的圖像。其中最為簡(jiǎn)單有用的工具是灰度直方圖。利用圖像的灰度直方圖作為特征指標(biāo)來(lái)描述圖像,一般是利用二維直方圖,如紅—藍(lán)直方圖,它是紅光圖像的灰度值和藍(lán)光圖像的灰度值的函數(shù)。利用色彩直方圖進(jìn)行檢索的方法有許多,如:比例直方圖法、累加直方圖法等。

  色彩直方圖還不能為像素在圖像中的位置提供線索,為了盡可能少地丟失信息,提出了局部色彩方法。局部色彩的索引對(duì)象是局部相似的顏色區(qū)域,它考慮了顏色的分類和一些初級(jí)的顏色特征。用形狀面積、圓度、離心率等來(lái)描述形狀的特征矢量。

  1.2 基于形狀特征的檢索

  形狀是刻劃物體的本質(zhì)特征之一,利用形狀來(lái)檢索可提高檢索的準(zhǔn)確性和效率?;谛螤畹臋z索不僅包括傳統(tǒng)意義的基于二維形狀的檢索,還包括三維形狀的檢索。

  基于圖像內(nèi)物體形狀的檢索,首要問(wèn)題是采用合適的圖像分割算法把不同對(duì)象從圖像中分割出來(lái),關(guān)鍵是尋找符合人眼感知特性的形狀特征。目前,較好的方法是采用圖像的自動(dòng)分割方法結(jié)合識(shí)別目標(biāo)的前景和背景模型來(lái)得到比較精確的形狀特征。圖像自動(dòng)分割方法的具體思路是:將圖像分塊后,將每個(gè)塊看成是一幅小圖像,計(jì)算每個(gè)小圖像的顏色直方圖特征,則每個(gè)塊間的直方圖是不一樣的,為分析邊緣特征,將相鄰兩個(gè)塊構(gòu)成一個(gè)比較對(duì),將每個(gè)塊間的差值記錄下來(lái),同時(shí)記錄差值在一定范圍內(nèi)的數(shù)目,這樣就形成一個(gè)顏色特征差值表。圖像對(duì)象空間位置發(fā)生變化,其特征差值表也就不同。

  1.3 基于紋理特征的檢索

  紋理是指圖像在局部區(qū)域內(nèi)可能呈現(xiàn)出不規(guī)則性而在整體上卻表現(xiàn)出某種規(guī)律性。紋理特征是圖像中難以描述的特征,它是一種反映圖像像素灰度級(jí)空間分布的屬性。如果一個(gè)物體內(nèi)部以灰度級(jí)變化明顯而又不是簡(jiǎn)單的色調(diào)變化,那么該物體就有紋理。

  紋理分析的方法基本可以分為統(tǒng)計(jì)法、結(jié)構(gòu)法、模型法和空間法/頻率域聯(lián)合分析法等4類。基于統(tǒng)計(jì)的方法是對(duì)圖像中的顏色強(qiáng)度的空間分布信息進(jìn)行統(tǒng)計(jì),主要用于分析像木紋、沙地、草坪等細(xì)致而不規(guī)則的物體;基于結(jié)構(gòu)的方法將重點(diǎn)放在分析紋理元之間的相互關(guān)系和排列規(guī)則上,適用于像布料或磚瓦等一類元素組成的紋理以及排列比較規(guī)則的物體;基于模型的方法是假設(shè)紋理按某種類型分布,如Markov隨機(jī)場(chǎng)模型、分形模型等?;诳臻g/頻率域聯(lián)合分析法主要包括Cabor變換法和小波變換法等。

  1.4 基于知識(shí)的圖像檢索

  基于知識(shí)的圖像檢索也是基于內(nèi)容檢索的重要方法之一。圖像本身是一定數(shù)量的顏色像素點(diǎn)的集合,人類能夠識(shí)別出像素點(diǎn)集合的含義是人類以自身的知識(shí)賦予圖像意義的過(guò)程?;谥R(shí)的圖像檢索系統(tǒng)為用戶提供知識(shí)庫(kù),針對(duì)一個(gè)圖像需求,搜索引擎依次調(diào)入每一幅圖像的內(nèi)容描述,結(jié)合知識(shí)庫(kù)中的相關(guān)知識(shí),以圖像需求為目標(biāo)進(jìn)行推理,如果需求目標(biāo)得到滿足,則確定這幅圖像符合檢索要求。

  2 基于內(nèi)容的圖像信息檢索系統(tǒng)

  目前,基于內(nèi)容的圖像檢索技術(shù)的研究取得了很大的突破,較有影響力的有以下幾個(gè):   2.1 QBIC系統(tǒng)

  QBIC(Query By Image Content)是IBM公司于20世紀(jì)90年代研制的圖像和動(dòng)態(tài)影像檢索系統(tǒng),其含意是“根據(jù)圖像的內(nèi)容進(jìn)行查詢”。由IBM Almaden研究中心開發(fā),是基于內(nèi)容的檢索系統(tǒng)的典型代表。QBIC在檢索過(guò)程中用戶無(wú)須提供文字檢索詞(它也提供關(guān)鍵詞檢索),只要輸入以圖像形式表達(dá)的檢索要求,即可檢索出一系列相似的圖像。QBIC系統(tǒng)允許使用示例圖像、用戶構(gòu)建的草圖、選擇的顏色與紋理模式、鏡頭與目標(biāo)運(yùn)動(dòng)等,對(duì)大型圖像和視頻數(shù)據(jù)庫(kù)進(jìn)行查詢。

  2.2 Photobook系統(tǒng)

  Photobook系統(tǒng)是由美國(guó)麻省理工學(xué)院(MIT)的媒體實(shí)驗(yàn)室于1994年開發(fā)研制的用于瀏覽和搜索圖像的一套交互式工具,圖像在存儲(chǔ)時(shí)按人臉、形狀或紋理特性自動(dòng)分類,圖像根據(jù)類別通過(guò)顯著語(yǔ)義特征壓縮編碼。

  2.3 Virage系統(tǒng)

  Virage是由Virage公司開發(fā)的基于內(nèi)容的圖像搜索引擎。與QBIC相似,Virage支持基于顏色、顏色布局、紋理和結(jié)構(gòu)(對(duì)象邊界信息)的可視化查詢,但Virage比QBIC更進(jìn)一步,它也支持由4個(gè)原子查詢的任意組合,用戶可以根據(jù)他們自己的側(cè)重調(diào)整4個(gè)原子查詢的權(quán)重。

  2.4 CORE系統(tǒng)

  CORE是新加坡國(guó)立大學(xué)開發(fā)的一個(gè)基于內(nèi)容的檢索系統(tǒng)。其顯著的技術(shù)特色包括:多種特征提取方法、多種基于內(nèi)容檢索方法、使用自組織神經(jīng)網(wǎng)絡(luò)對(duì)復(fù)雜特征度量、建立基于內(nèi)容索引的新方法以及對(duì)多媒體信息進(jìn)行模糊檢索的新技術(shù)。

  2.5 VisualSEEK系統(tǒng)

  由美國(guó)哥倫比亞大學(xué)圖像和高級(jí)電視實(shí)驗(yàn)室開發(fā)。它實(shí)現(xiàn)了互聯(lián)網(wǎng)上基于內(nèi)容的圖像/視頻檢索系統(tǒng),提供了一套工具供人們?cè)赪eb上檢索圖像和視頻信息。用戶可以把頂部為紅橙黃色區(qū)域、底部為藍(lán)綠色區(qū)域,這樣的圖像作為查詢“日出”的草圖,使人們?cè)赪eb上可以方便地搜索和檢索圖像和視頻。

  3 基于內(nèi)容的圖像檢索體系結(jié)構(gòu)

  基于內(nèi)容的圖像檢索系統(tǒng)與傳統(tǒng)基于文本的檢索系統(tǒng)完全不同?;趦?nèi)容的檢索系統(tǒng)一般通過(guò)可視化界面和用戶進(jìn)行頻繁的交互,以便用戶能夠方便地構(gòu)造查詢和改進(jìn)檢索結(jié)果,用戶通過(guò)選擇具有代表性的一幅或多幅例子圖像來(lái)構(gòu)造查詢,然后由系統(tǒng)查找與例子圖像在視覺(jué)內(nèi)容上較相似的圖像,按相似度大小排列返回給用戶,即所謂的通過(guò)例子圖像的檢索(Query By Image Example)。

  基于內(nèi)容的圖像查詢和檢索是一個(gè)逐步求精的循環(huán)過(guò)程。其過(guò)程及各個(gè)模塊如下:

  3.1 圖像的預(yù)處理

  在特征抽象子模塊里,首先要進(jìn)行圖像的預(yù)處理,包括圖像格式的轉(zhuǎn)換,尺寸的統(tǒng)一,圖像的增強(qiáng)與去噪,圖像的邊緣提取,經(jīng)過(guò)邊緣提取獲得圖像的輪廓特征,對(duì)其進(jìn)行進(jìn)一步輪廓清晰化處理等功能,為圖像的特征提取打下基礎(chǔ)。

  3.2 圖像的目標(biāo)標(biāo)識(shí)

  圖像預(yù)處理后,要進(jìn)行圖像的目標(biāo)標(biāo)識(shí)。目標(biāo)標(biāo)識(shí)為用戶提供一種工具,以全自動(dòng)或半自動(dòng)(需要用戶干預(yù))的方式標(biāo)識(shí)圖像中用戶感興趣的區(qū)域或目標(biāo)對(duì)象,以便針對(duì)目標(biāo)進(jìn)行特征提取并查詢。當(dāng)進(jìn)行整體內(nèi)容檢索時(shí),利用全局特征,這時(shí)不用目標(biāo)標(biāo)識(shí)功能。目標(biāo)標(biāo)識(shí)是可選的。

  3.3 圖像的特征提取與表達(dá)

  圖像特征的提取與表達(dá)是基于內(nèi)容的圖像檢索技術(shù)的基礎(chǔ)。對(duì)圖像數(shù)據(jù)庫(kù)進(jìn)行特征提取,提取用戶感興趣的、適合檢索要求的特征。特征提取可以是全局性的,即整幅圖像,也可以是針對(duì)某個(gè)目標(biāo)的,即圖像中的子區(qū)域,如人的面部特征或指紋特征等。

  3.4 圖像數(shù)據(jù)庫(kù)

  作為圖像查詢的后臺(tái)基地,生成的數(shù)據(jù)庫(kù)由圖像庫(kù)、特征庫(kù)和知識(shí)庫(kù)組成。圖像庫(kù)為數(shù)字化的圖像信息,特征庫(kù)包含用戶輸入的特征和預(yù)處理自動(dòng)提取的內(nèi)容特征。知識(shí)庫(kù)包含專門和通用知識(shí),有利于查詢優(yōu)化和快速匹配,知識(shí)庫(kù)中知識(shí)表達(dá)可以更換以適用各種不同的應(yīng)用領(lǐng)域。

  3.5 圖像的查詢接口

  在基于內(nèi)容檢索中,由于特征值為高維向量,不具有直觀性,因此必須為其提供一個(gè)可視化的輸入手段。友好的人機(jī)交互界面是一個(gè)成功檢索系統(tǒng)不可缺少的條件,可采用的方式有3種:操縱交互輸入方式、模板選擇輸入方式和用戶提交特征樣板的輸入方式。另外,查詢返回的結(jié)果需要瀏覽,應(yīng)在用戶界面提供瀏覽功能。

  3.6 圖像的檢索引擎

  檢索是利用特征之間的距離函數(shù)進(jìn)行相似性匹配,模仿人的認(rèn)知過(guò)程,近似得到數(shù)據(jù)庫(kù)的認(rèn)知排隊(duì),存在一些不同的相似性測(cè)度算法,檢索引擎中包括一個(gè)較為有效可靠的相似性測(cè)度函數(shù)集。

  3.7 圖像的索引/過(guò)濾

  索引是用來(lái)提供快速、有選擇性地存取數(shù)據(jù)庫(kù)的一種機(jī)制,它相當(dāng)于一種映射機(jī)制,將屬性的值轉(zhuǎn)換為相應(yīng)數(shù)據(jù)地址域的地址集。過(guò)濾器作用于全部數(shù)據(jù),過(guò)濾出的數(shù)據(jù)集合再用高維特征匹配來(lái)檢索。索引用于低維特征,可以用R樹來(lái)索引以加快檢索速度。

  基于內(nèi)容的圖像檢索技術(shù)為用戶提供了一個(gè)在網(wǎng)絡(luò)上搜索感興趣的圖像信息資源的有效手段,但基于內(nèi)容的圖像檢索技術(shù)目前還存在許多有待發(fā)掘的內(nèi)容,因而,基于內(nèi)容的圖像檢索技術(shù)也需要隨著網(wǎng)絡(luò)技術(shù)、信息技術(shù)的發(fā)展而發(fā)展。

  主要參考文獻(xiàn)

  [1] 何惠芬. 圖書館中基于內(nèi)容的圖像數(shù)據(jù)庫(kù)檢索技術(shù)[J]. 情報(bào)雜志,2002(7).

  [2] 劉偉成,孫吉紅. 基于內(nèi)容的圖像信息檢索綜述[J]. 情報(bào)科學(xué),2002(4).

  
看了“圖片檢索技術(shù)論文”的人還看:

1.搜索引擎技術(shù)論文

2.關(guān)于檢索的學(xué)術(shù)論文

3.淺談基于PCA算法的人臉識(shí)別的圖片搜索引擎論文

4.計(jì)算機(jī)檢索技術(shù)論文

5.可視化圖形技術(shù)論文

2774655