圖片檢索技術(shù)論文

時間：2017-03-08 17:04:05 家文952由分享

圖片檢索技術(shù)論文

　　圖像檢索是網(wǎng)絡(luò)信息檢索中的重要的組成部分，小編整理了圖片檢索技術(shù)論文，歡迎閱讀!

　　圖片檢索技術(shù)論文篇一

　　Web圖像檢索技術(shù)綜述

　　【摘要】多媒體技術(shù)的迅速發(fā)展，促進(jìn)了Web圖像檢索技術(shù)的創(chuàng)新和發(fā)展。針對目前的發(fā)展?fàn)顩r，本文對Web圖像檢索技術(shù)做了深入的分析和研究，包括基于文本檢索、基于內(nèi)容檢索、語義檢索以及個性化Web圖像檢索，并詳細(xì)介紹了這4種流行圖像檢索技術(shù)的技術(shù)特點，最后指出了Web圖像檢索技術(shù)的發(fā)展趨勢和研究方向。

　　【關(guān)鍵詞】基于文本圖像檢索基于內(nèi)容的圖像檢索基于語義檢索個性化Web圖像檢索

　　一、引言

　　目前，Web圖像檢索技術(shù)和模型層出不窮，可大致分為基于文本的檢索、基于內(nèi)容的檢索、語義圖像檢索和個性化的Web圖像檢索四種。下面分別對其進(jìn)行介紹。

　　二、基于文本的圖像檢索

　　20世紀(jì)70年代，基于文本的圖像檢索技術(shù)(TBIR)得以發(fā)展。目前，該技術(shù)發(fā)展較為成熟，但需要較多人工參與，耗費大量的人力和時間，而且不同的人對同一張圖像的理解也不相同，這就導(dǎo)致對Web圖像標(biāo)注沒有統(tǒng)一標(biāo)準(zhǔn)，因而檢索的結(jié)果不能很好地符合用戶的需求[1]。同時在互聯(lián)網(wǎng)環(huán)境中，Web圖像數(shù)據(jù)不斷動態(tài)更新，采用人工方式對圖像進(jìn)行廣泛標(biāo)注也無法實現(xiàn)。

　　三、基于內(nèi)容的圖像檢索

　　上世紀(jì)90年代，基于內(nèi)容的圖像檢索(CBIR)技術(shù)產(chǎn)生。它主要采用圖像的視覺特征來表示圖像的內(nèi)容，然后通過特征匹配算法進(jìn)行圖像檢索。

　　(一)圖像特征提取

　　圖像的特征主要包括底層特征和語義特征。目前的CBIR系統(tǒng)主要使用圖像底層特征來檢索圖像。底層特征主要包括圖像的顏色、紋理、形狀等定量特征。目前，顏色特征主要有顏色直方圖、顏色矩和顏色相關(guān)圖等。紋理特征有Gabor變換、塔式小波變換、灰度共生矩陣等。而形狀特征表示主要有基于邊界表示法和基于區(qū)域表示法。此外，近些年許多學(xué)者也研究了基于文本和視覺兩種信息在內(nèi)的Web圖像檢索，如文獻(xiàn)[2]中提出一種融合文本關(guān)鍵詞和圖像視覺內(nèi)容的Web圖像檢索方法，在一定程度上提高了Web圖像檢索質(zhì)量。

　　(二)圖像相似性匹配

　　圖像檢索的匹配策略大致分為完全匹配和相似性匹配。完全匹配是指兩張圖像的特征完全相同時圖像匹配成功;而相似性匹配是指兩張圖像特征間的距離在某一閾值內(nèi)匹配成功。在基于內(nèi)容的圖像檢索中，圖像底層視覺特征對比的相似性檢索匹配占據(jù)著主導(dǎo)地位。

　　四、基于語義的圖像檢索

　　底層的視覺特征不能代表圖像豐富的內(nèi)涵，使得基于內(nèi)容的圖像檢索效果并不理想。因此，出現(xiàn)了基于圖像語義的檢索技術(shù)，主要包括語義層次模型、語義的提取方法和語義表示方法三方面內(nèi)容。

　　(一)語義層次模型

　　圖像語義是有粒度的，即具有層次性，所以可采用多層結(jié)構(gòu)對圖像語義進(jìn)行分析。

　　一般，根據(jù)圖像內(nèi)容可將圖像分為特征語義、對象和空間關(guān)系語義、高層語義3個層次。特征語義利用圖像的視覺特征及其組合進(jìn)行檢索。對象與空間關(guān)系語義，是分析圖像中對象的視覺特征、空間關(guān)系、位置等信息，得到圖像的語義描述。高層語義涉及到圖像的場景語義、行為語義和情感語義，該層語義是根據(jù)人的知識理解而來，主觀性較強(qiáng)，提取工作較復(fù)雜。

　　(二)語義提取方法

　　圖像語義的提取是由底層特征向高層語義映射的過程，但現(xiàn)今的技術(shù)水平，直接根據(jù)底層的視覺特征推理出圖像高層語義很困難，目前主要方法有基于知識語義提取、基于人工交互語義提取和外部信息的語義提取。

　　(三)語義表示方法

　　語義表示方法主要有文本表示法和基于人工智能知識表示法。文本表示法是用文本對圖像或圖像區(qū)域進(jìn)行解釋?；谌斯ぶ悄艿闹R表示方法，如語義網(wǎng)絡(luò)、數(shù)理邏輯等，該方法能夠表達(dá)較為復(fù)雜的關(guān)系，具備較強(qiáng)的模糊匹配能力，但目前通用性的知識表示模型尚不存在。

　　五、個性化Web圖像檢索

　　隨著多媒體技術(shù)的飛速發(fā)展，圖像的數(shù)量急劇增加，為了得到更準(zhǔn)確的符合個人需求的檢索結(jié)果，個性化Web圖像檢索成為研究熱點。個性化的實質(zhì)是針對不同用戶采用不同策略來提供不同的服務(wù)內(nèi)容。個性化圖像檢索則是根據(jù)用戶對檢索結(jié)果的反饋主動學(xué)習(xí)和記錄用戶的興趣信息，推測出用戶的興趣需求。用戶興趣模型(User Preference Profile)是個性化圖像檢索的核心，它用于存儲和管理用戶興趣信息，通過收集用戶的反饋信息，建立初始用戶興趣模型，經(jīng)過長期地學(xué)習(xí)，不斷更新用戶興趣模型，最終可以得到用戶的興趣傾向，針對不同用戶提供個性化服務(wù)。

　　由于獲取用戶興趣面臨低層特征和高層語義之間的“語義鴻溝”問題，一些學(xué)者作了研究，如HE等人[3]提出了一種應(yīng)用于個性化圖像檢索的用戶興趣模型的構(gòu)建方法，以彌補語義鴻溝。QIU等 [4]提出基于用戶多媒體數(shù)據(jù)管理模型的個性化圖像檢索，建立用戶多媒體數(shù)據(jù)管理模型為用戶提供個性化圖像檢索。文獻(xiàn)[5]為了在個性化搜索過程中能夠準(zhǔn)確地挖掘到用戶的潛在興趣并進(jìn)行相應(yīng)的聚類分析，提出采用潛語義空間的Zipf分布的特性，并結(jié)合PLSA(概率潛在語義分析)來獲取全文的語義。

　　六、總結(jié)和展望

　　圖像檢索從基于文本的檢索發(fā)展到語義檢索，經(jīng)歷了簡單到復(fù)雜、低級到高級的過程?；趫D像語義檢索，充分利用了圖像的語義信息，提高了圖像檢索的速度和質(zhì)量，應(yīng)用前景廣泛，但仍存在如何改進(jìn)語義提取方法以及語義描述方式等難題。目前，個性化Web圖像檢索成為主要研究熱點，但如何更好地解決語義鴻溝，建立和改善用戶興趣模型成為一個值得深入研究的問題。

　　參考文獻(xiàn)：

　　[1]魯珂，趙繼東，曾家智.一種適合Web圖像檢索的圖像降維算法研究.計算機(jī)科學(xué).2006，33(5)：255～260

　　[2]黃鵬，陳純，王燦，卜佳俊，陳偉，仇光.使用加權(quán)圖像標(biāo)注改進(jìn)Web圖像檢索.浙江大學(xué)學(xué)報(工學(xué)版).2009，43(12)：2129～2135

　　[3]賀琳，張菁，沈蘭蓀.個性化圖像檢索中用戶興趣模型的構(gòu)建方法.計算機(jī)工程與應(yīng)用.2009，45(31)：168～171

　　[4]邱兆文，張?zhí)镂?基于用戶多媒體數(shù)據(jù)管理模型的個性化圖像檢索.電子學(xué)報.2008，36(9)：1749～1749

　　[5]陳冬玲，王大齡，于戈，于芳.基于PLAS方法的用戶興趣聚類.東北大學(xué)學(xué)報(自然科學(xué)版).2008，29(1)：53～56

點擊下頁還有更多>>>圖片檢索技術(shù)論文

圖片檢索技術(shù)論文

圖片檢索技術(shù)論文篇一

相關(guān)文章

熱門文章