基于内容的图像检索的语义鸿沟 (基于内容的图像检索)

本文目录导航:
基于内容的图像检索的语义鸿沟
英文称号:Semantic Gap理论人们在判别图像的相似性时并非建设在图像低层视觉特色的相似上,而是建设在对图像所形容的对象或事情的语义了解的基础上。
这种了解不可从图像的视觉特色间接取得,它须要经常使用人们日常生存中积攒的少量阅历和常识来启动推理和判别。
其中,尤其关于一些高档次的形象概念,如一幅关于节日的图像所表白出的欢畅和喜庆的觉得等,更须要依据人的常识来判别。
换言之,人们是依据图像的语义消息来启动图像相似性判别的。
正是由于人对图像相似性的判别依据与计算机对相似性的判别依据之间的不同,形成了人所了解的“语义相似”与计算机了解的“视觉相似”之间的“语义鸿沟”的发生。
在传统的基于文字的查问技术中,不存在这个疑问,由于查问关键字基天性够反映查问用意。
然而在基于内容的图像查问中,就存在一个底层特色和下层了解之间的差异(这也就是驰名的semantic gap)。
重要要素是底层特色不能齐全反映或许婚配查问用意。
补偿这个鸿沟的技术手腕重要有:关系反应(relevance feedback)依照最后的查问条件,查问系统前往给用户查问结果,用户可以人为介入(或许智能)来选用几个最合乎他查问用意的前往结果(正反应),也可以选用最不合乎他查问用意的几个前往结果(负反应)。
这些反应消息被送入系统用来降级查问条件,从新启动查问。
从而让随后的搜查更合乎查问者的实在用意。
图像宰割(image segmentation)图像的特色可以包含全局特色和部分特色。
假设启动必定水平的图像宰割,划分出不同的宰割区域,这样可以参与部分特色的消息量,也或许在必定水平补偿语义鸿沟。
建设复杂的分类模型(Machine Learning)一些比拟复杂的非线性分类模型,比如允许向量机(Support Vector Machine)自身就可以起到必定水平的成果来补偿语义鸿沟。
怎么申报国度人造迷信基金
1、登陆国度人造迷信基金委的网站,随时关注关系名目标放开灵活,确定名目申报的期间,普通自己所在的科研治理部门会有提示的。
2、首先确认自己能否够条件放开关系的名目。
国度人造迷信基金资助的是人造迷信基础钻研和部分运行钻研,普通是国际高校和科研单位中的钻研人员。
海外或许港澳台地域放开是需国际附丽单位的。
3、依据自己的职称和年龄确定自己能够放开的类型,如面上名目、青年迷信基金等。
4、向自己所附丽的单位科研治理部门放开国度人造迷信基金名目申报系统的账号和明码,由关系治理人员在人造迷信基金消息isis系统中参与本单位名目放开人。
5、登陆人造迷信基金网络消息ISIS系统确认自己放开的名目能否须要在线填写还是离线填写。
6、依据提示填写关系的消息,提交名目放开书。
确认提交后,打印名目放开书,自己及关系介入人员亲笔签字后,交单位盖章,由单位一致寄送国度基金委。
图像检索技术的图像检索技术钻研的三个方向
基于文本和基于内容是图像检索开展的两个分支,不过从目前图像检索钻研的趋向而言,尤其联合网络环境下图像的特色——嵌入在具备文本内容的Web文档中,发生了三个不同的钻研着眼点。
立足于文本,对图像启动检索。
试图将传统的文本检索技术移植于对多媒体消息的检索上,由于基于文本的检索技术开展曾经成熟。
如Page-Rank方法、概率方法、位置方法、摘要方法、分类或聚类方法、词性标注法等,不只技术开展较为成熟,同时剖析和成功的难度略小。
然而由于受控词汇自身的局限,易歧义,降级慢,所以不太容易应答网络上突飞猛进的各类图像。
立足于图像内容,对图像启动剖析和检索。
相比而言,虽然图像检索曾经发生了诸如直方图、色彩矩、色彩集等多种表征图像特色的方法,然而要打破对低档次特色的剖析,成功更高语义上的检索,成功难度大,停顿慢。
不过,基于内容的图像检索建设在多媒体消息的内容语义上,能够更为主观地反映媒体实质的特色。
联合文本和内容,启动融合性钻研。
施展各自的长处促成图像的高效、便捷检索模式的成功,尤其是网络环境下,联合图像所在Web文档的特色剖析,推断图像的特色,同时联合对图像的内容剖析,独特标引到达对图像的剖析和检索。
可以说,三个方向都是相互影响和促成的,任何一个方向的停顿都会促成图像检索技术向前更进一步。
文章评论