图像检索基于文本的图像检索 (图像检索基于什么技术)

本文目录导航:
图像检索基于文本的图像检索
图像检索技术的一种陈腐方法是基于文本的检索,它并不依赖于对图像视觉元素的间接剖析。
同样,这种方法经过识别图像的元数据启动索引,包括图像的称号、尺寸、紧缩格局、作者和创作年代等消息。
查问通常是基于关键词,用户可以输入相关形容来搜查图像,例如Getty AAT经常使用大概133,000个专业术语来形容艺术、历史、修建和文明对象,并经过30多个具体目录,从概念、物理个性、类型和标识号等多维度启动分类。
Gograph网站则将图像划分为灵活图像、照片、图标等八大一级类别,每个类别下又进一步细分了子类,便于查找和治理。
在数字化之前,档案治理员和图书治理员重要依赖于图像所在的页面主题、文件名、与图像严密相关的文本内容,以及图像链接地址等文本消息,启动图像的剖析和整顿。
经过对这些文本内容的剖析,可以推断出图像的特色和或者的主题,从而成功准确的检索。
从20世纪70年代开局,无关图像检索的钻研就已开局,过后重要是基于文本的图像检索技术(Text-based Image Retrieval,简称TBIR),应用文本形容的方式形容图像的特色,如绘画作品的作者、年代、流派、尺寸等。
到90年代以后,产生了对图像的内容语义,如图像的色彩、纹理、规划等启动剖析和检索的图像检索技术,即基于内容的图像检索(Content-based Image Retrieval,简称CBIR)技术。
CBIR属于基于内容检索(Content-based Retrieval,简称CBR)的一种,CBR中还包括对灵活视频、音频等其它方式多媒体消息的检索技术。
图像检索基于内容的图像检索
图像检索重要依托图像内容、语义以及高低文关联启动消息搜查,其指标是寻觅与查问图像具备相似个性的图像。
因为图像数据通常比文本消息更为宏大,因此,这种检索方式在速度和效率下面临着更高的要求。
通常中,曾经有许多基于内容的图像检索系统被宽泛运行,例如IBM公司的QBIC系统,它是最早成功商业化的例子之一;哥伦比亚大学的WebSeek系统以及麻省理工学院的Photobook系统也是其中的佼佼者。
为了成功基于内容的Web图像检索,首先须要从网络中提取图像,构建图像集,而后对每个图像对象启动特色剖析和相似度婚配,这一环节触及到图像处置模块、查问模块以及对象库、特色库和常识库等关键组成局部。
图像处置模块担任图像的预处置,包括去噪、增强和格局转换等,确保图像品质适宜作为检索特色。
查问模块则接纳用户输入的图像或形容,将其转化为可以被系统了解的特色示意。
对象库贮存了少量的图像数据,而特色库则存储对这些图像启动剖析后的特色形容。
常识库则或者蕴含对于图像内容、高低文相关等元数据,有助于提高检索的准确性。
经过这些模块的协同上班,基于内容的图像检索系统能够高效地在海量图像中找到相关结果。
从20世纪70年代开局,无关图像检索的钻研就已开局,过后重要是基于文本的图像检索技术(Text-based Image Retrieval,简称TBIR),应用文本形容的方式形容图像的特色,如绘画作品的作者、年代、流派、尺寸等。
到90年代以后,产生了对图像的内容语义,如图像的色彩、纹理、规划等启动剖析和检索的图像检索技术,即基于内容的图像检索(Content-based Image Retrieval,简称CBIR)技术。
CBIR属于基于内容检索(Content-based Retrieval,简称CBR)的一种,CBR中还包括对灵活视频、音频等其它方式多媒体消息的检索技术。
基于内容的图像检索的技术概述
CBIR的外围是经常使用图像的可视特色对图像启动检索。
实质上讲,它是一种近似婚配技术,融合了计算机视觉、图像处置、图像了解和数据库等多个畛域的技术成绩,其中的特色提取和索引的建设可由计算机智能成功,防止了人工形容的客观性。
用户检索的环节普通是提供一个样例图像(Queryby Example) 或描画一幅草图(Queryby Sketch) ,系统抽取该查问图像的特色,而后与数据库中的特色启动比拟,并将与查问特色相似的图像前往给用户。
CBIR 的成功依赖于两个关键技术的处置:图像特色提取和婚配。
图像特色提取分为两类:①低层视觉,其内容重要包括色彩、状态、纹理等;②语义内容,它蕴含上层的概念级反响(如“海回升明月”),须要对物体启动识别和解释,往往要借助人类的常识推理。
因为目前计算机视觉和图像了解的开展水平所限,使得CBIR还不可真正允许基于语义的图像检索,所以目前钻研得较多也比拟成熟的检索算法大局部是基于图像的低层特色的,即应用图像的色彩、纹理、状态等特色来检索。
提取后的图像特色数据须要经过索引、降维等处置。
首先,图像由特色向量示意,而这些特色向量普通都是高维向量, 在宏大的图像数据库中,对高维向量启动顺序比拟的环节是相当费时的。
在实践运行环节中, 为了让基于CBIR的图像检索系统能够真正适宜大型的图像数据库, 提高检索效率,尽或者缩小查问时的特色矢量比拟期间,往往将降维技术和多维索引技术联合起来。
图像相似度是指人类对图像内容意识上(即语义)的差异,造成经过计算查问样图和候选图像之间在视觉特色上存在距离。
假设这个距离满足必定条件,咱们则可以说这两图像相似度婚配。
当然,假设能将语义特色和视觉特色联合起来, 相似度婚配水平会更高,检索结果会更让人满意,但这是目前钻研的一大难题。
文章评论