论文文献综述(完成)

发布时间 : 星期日 文章论文文献综述(完成)更新完毕开始阅读

( 2010 届)

毕业论文(设计)

文献综述

题 目: 一种基于多特征融合的风景图像检索方法 学 院: 数学与信息工程学院 专 业: 计算机科学与技术(本) 班 级: 计科061 学 号: 200632225115 姓 名: 潘江云 指导教师: 朱蓉

一、 前言部分随着多媒体技术、计算机技术、通令技术以及Internet网络的迅速发

展,图像成为了一种重要的信息资源。由于图像所包含的信息量远远超过文字,因此,如何有效、快速地从大规模图像数据中检索出所需的图像已成为一个研究的热点。

从20世纪70年代开始,有关图像检索的研究就已开始,当时主要是基于文本的图像检索技术(Text-based Image Retrieval,简称TBIR),利用文本描述的方式描述图像的特征,如绘画作品的作者、年代、流派、尺寸等。到90年代以后,出现了对图像的内容语义,如图像的颜色、纹理、布局等进行分析和检索的图像检索技术,即基于内容的图像检索(Content-based Image Retrieval,简称CBIR)技术。CBIR属于基于内容检索(Content-based Retrieval,简称CBR)的一种,CBR中还包括对动态视频、音频等其它形式多媒体信息的检索技术。

在检索原理上,无论是基于文本的图像检索还是基于内容的图像检索,

主要包括三方面:一方面对用户需求的分析和转化,形成可以检索索引数据库的提问;另一方面,收集和加工图像资源,提取特征,分析并进行标引,建立图像的索引数据库;最后一方面是根据相似度算法,计算用户提问与索引数据库中记录的相似度大小,提取出满足阈值的记录作为结果,按照相似度降序的方式输出。

为了进一步提高检索的准确性,许多系统结合相关反馈技术来收集用户对检索结果的反馈信息,这在CBIR中显得更为突出,因为CBIR实现的是逐步求精的图像检索过程,在同一次检索过程中需要不断地与用户进行交互。

二、 主题部分 从图像检索发展的历程来看主要经历了两个阶段:基于文本的图像检索和基于内容的图像检索。传统的基于文本的图像检索技术是通过关键字或自由文本进行描述,查询操作是基于该图像的文本描述进行精确匹配或概率匹配。基于文本的图像检索方式简单、易于理解,但检索时要指明文本特征。由于人工注释图像的主观性和不准确性等弊端,因此这种传统的图像检索方法并不能满足用户的需要。相对于基于文本的图像检索技术来说,基于内容的图像检索实现了自动化、智能化的图像检索和管理,主要利用了图像中的一些可视化信息,如颜色、形状、纹理等信息作

为检索的途径,从而提高了检索的效率和准确性.因此得到越来越多人的注关。

20世纪90年代以来,基于内容的图像检索技术得到了迅猛的发展,“以图找图”的特点引起人们的兴趣。以图像中包含的各类典型特征为客观检索对象,所用的图像特征分两类:一类为底层特征或物理特征.如颜色、纹理、形状等;另一类为高层特征或语义特征,即图像内容的语义描述以及各类物理特征之问的逻辑关系。目前基于内容的图像检索技术主要以图像底层特征的相似性匹配检索为主.辅助以图像语义特征。

基于颜色特征检索

从人类视觉角度来看,颜色特征是人类感知和区分不同物体的一种基本视觉特征。世界也因为有了颜色而显得多姿多彩。颜色是一种重要的视觉信息属性,相对于其他特征,颜色特征对图像本身的尺寸、方向、视角的依赖性较小,从而具有较强的鲁棒性 ],而且颜色特征计算简单,因此成为现有的检索系统中应用最广泛的特征。

利用颜色特征进行图像检索可以追溯到Swain和BallardE32提出的颜色直方图法。颜色直方图法的主要思想是根据相同颜色的像素个数在整幅图像中所占的比例,然后采用颜色直方图的交来度量两幅图像色彩的空间信息。颜色直方图计算简单,而且具有尺度、平移及旋转不变性。颜色直方图的主要缺点:它只包含了某一彩以出现的频数而丢失了像素所在的位置信息。任一幅图像都能唯一的给出一幅与它相对应的直方图,但不同的图像可能有相同的直方图,也就是说直方图与图像是一对多的关系,这显然与人的视觉感应不符,即误检率较高。

为了克服颜色直方图的缺陷,提出了许多改进方法。Pass等人提出了用图像的颜色聚合矢量CCV(color coherence vector)作为图像的颜色特征。其核心思想是当图像中颜色相似的像素所占据的连续区域的面积大于一定的阈值时,则该区域的像素为聚合像素,否则为非聚合像素。这样统计图像所包含的每种颜色的聚合像素和非聚合像素的比率就称为该图像的颜色聚合矢量,在检索过程中匹配目标图像的聚合矢量和检索图像的聚合矢量。聚合矢量的聚合信息在某种程度上保留了图像颜色的空间信息。Strickd和Orenges~ 提出了累计颜色直方图方法,并提出了色彩矩的方法,主要对每种色彩分量的一阶、二阶和三阶矩进行统计。何恒等人提出了模糊直方图方法,将模糊理论应用到图像检索中。为了避免将两个相似的图像块归入不同的类别,而导致错误的比较。给出了一个图像块对于多个类别的隶属性,这样每一个图像块就可以以不同的隶属从属于不同的类别,因此,要进一步提高检索的

精度及其实用性,在实际应用中应和其它检索方法相结合才会更有效。 基于纹理特征的检索

纹理是图像中一个重要而又难以描述的特征,很多图像的局部区域内可能呈现出不规则性,而在整体上却表现出某种规则性。习惯上把图像中这种局部不规则性而整体有规律的特性称之为纹理。即纹理特征是所有的图像所具有的内部特征,包括粗糙度、方向性、对比度以及规则性等。纹理特征适用于检索诸如水波、布匹、草坪等类别的图像,它包含了关于表面的结构安排以及周围环境的关系。

基于纹理特征检索的分析方法主要有两类:结构分析方法和统计分析方法。结构分析方法包括形态学算子、边界图等。对于纹理规则的图像采用结构分析方法是很有效的。统计分析方法通常在频率域和空间域上进行。在频率域上主要采用傅立叶级数变换和小波分析,而在空间域上主要采用Haralick等人提出的关于纹理的共生矩阵表示。“纹理的共生矩阵表示”方法建立在估计图像的二阶组合条件概率密度函数的基础上,是一种空间域方法L6]。该方法探索的是纹理的空间依赖关系,首先根据图像像素之间的方向和距离构造一个共生矩阵,然后从该矩阵中提取有意义的统计作为纹理表述。该方法的缺点是矩阵很大且含有大量的冗余信息。Tamura方法是纹理分析的另一主要方法。Tamura提出的纹理特征集很好的对应于人类的视觉感知,这些感知包括糙度、对比度、方向度和线像度、规整度和粗略度,因此Tamura法得到了广泛的应用。但Tamura方法是对整幅图像进行处理,效果不是很好。改进的方法是采用直方图。

基于形态特征的检索

形状特征是描述图像内容的另一个重要特征,也是计算机视觉和模式识别研究的一个基本问题。采用形状特征进行检索,用户可以通过勾勒图像的形状或轮廓,从图像库中检索出形状相似的图像。基于形状特征的检索有两种:一种是分割图像经过边缘提取后得到目标的轮廓线。针对这种轮廓线进行图像特征检索;另一种是基于图像的区域特征进行检索。

针对形状轮廓特征的描述方法主要有:边界直方图、链编码、曲率尺度空间、傅立叶描述符等,其中最典型的方法为傅立法描述符。它的基本思想是用物体边界的傅立叶交换作为形状描述.利用区域边界的封闭性和周期性将工作问题转化为一维问题,从而提高了检索的效率。针对区域特征的描述方法主要有形状的无关矩、区域的面积、形状的纵横比率 。对于基于形状的检索来说.形状的提取、描述及

联系合同范文客服:xxxxx#qq.com(#替换为@)