RSS
热门关键字:  数据挖掘  人工智能  数据仓库  搜索引擎  数据挖掘导论

基于内容的图像检索中的相关反馈研究

来源: 作者:unkonwn 时间:2004-12-05 点击:

1引言
CBIR试图使图像数据库中的索引过程自动化。CBIR方法通过基于图像内在属性如颜色、纹理和形状的描述而进行检索工作。尽管如此,今天的CBIR算法的检索精确度仍然有限。除了其他许多困难外,CBIR的瓶颈是底层视觉特征与高层语义特征之间的缺口。这一瓶颈的根源在于这样一个事实,即:视觉相似性度量,如颜色直方图等,总的来说未必与图像在人类主观定义上的语义相匹配。更为糟糕的是,对同一幅图像,不同的人们往往有不同的语义解释,甚至同一个人对同一幅图像在不同时间会有不同的理解。为了解决这一瓶颈,人们提出了交互式相关反馈技术。其中心思想是我们应该将人类理解的主观性融入图像检索过程并且给用户以评价检索结果的机会,在用户评估的基础上再进一步改进检索过程。近几年来,这一研究主题已成为CBIR研究团体所讨论的焦点。
相关反馈,最初发源于文本文档检索,是一种用来提高信息系统有效性的有监督的学习技术。其主要思想是通过来自用户的肯定或否定的样例(正例或反例)提高系统性能。对一个给定的查询,系统首先根据预先确定的相似性规则检索出一系列有序图像。然后,用户对这些图像标上查询相关(正例)或查询无关(反例),系统将基于这些反馈改进查询并检索出新的一系列图像提交给用户。因此,相关反馈的主要问题是怎样将正例和反例合并分析以改进查询和(或)调整相似性度量。
尽管文档检索中的相关反馈技术研究较少,但被引进给CBIR研究团体后,它却成为近年来最活跃的研究课题。导致这种现象的主要因素是常规CBIR算法的检索精确度较低以至于直接应用源于文本文档检索的相关反馈框架能够显著地提高精确度。
2 CBIR中的相关反馈
在CBIR的相关反馈方法中有很多观点,如学习方案、特征选择、索引结构和可量测性。我们现在不详细审视CBIR现有的相关反馈算法的优点和缺点,而是主要考虑CBIR中的相关反馈是一个机器学习问题并且将我们的视角详细地扩展到学习和寻找每个算法的本质上。为了给出相关反馈的一些背景,我们先回顾一下文档检索的典型的相关方法。
2.1经典相关反馈算法
早期CBIR的相关反馈方案主要从那些经典文本文档检索而来。那些经典方法被分成两类:查询点移动(query point movement,query refinement)和再加权(re-weighting,similarity measure refinement)[1],这两种方法都是基于矢量模型发展而来,而矢量模型是用在信息检索中的最流行的模型。
查询点移动方法本质上是通过使"理想查询点"移向好的样本点并远离坏的样本点来提高其评估值。提高这一估计的经常使用的技术是Rocchio提出的如下公式,该公式是操作于由用户给出的相关文档 和非相关文档 的集合的[5]:

数据挖掘研究院


 
其中, , 和 是适当的参数; 和 分别是 和 中文档的数量。这一技术在MARS中被实现[6]。实验证明这种相关反馈方法能够大大提高检索性能。
再加权方法的基本思想是提高那些有助于检索相关图像的特征尺度的权重,同时降低有碍于检索相关图像的特征尺度的权重。MARS系统实现了被称为标准背离方法的再加权方法的较小的改进[6]。
当前,人们提出实现全局特征优化的在计算上更加健壮的方法。由Ishikawa等设计的MindReader检索[3]系统阐明了参数估计过程中的最小化问题。与传统的那些距离函数可用排列于坐标系中的椭圆来表示的检索系统不同,MindReader系统提出的距离函数不必使用坐标轴排列表示。因此,它允许每个部分不同权重之外的属性之间的相关性。在他们的CBIR系统中,不仅公式化了最优化问题而且考虑了多尺度图像模型。

资料全文下载 数据挖掘研究院

最新评论共有 0 位网友发表了评论
发表评论
评论内容:不能超过250字,需审核,请自觉遵守互联网相关政策法规。
匿名?