首页 二次元 正文

什么叫主题词 我须要一个比拟威望的解释 (什么叫主题词的扩展检索,它的优越性何在)

二次元 2024-09-18 14

本文目录导航:

什么叫主题词,我须要一个比拟威望的解释。

一、什么叫主题词、主题词表和检索言语(一)主题词。

主题词也称叙词,是一些以概念为基础的,规范化的,具备组配性能,并可显示词间语义相关的词和词组。

主题词分正式主题词和非正式主题词。

正式主题词用来标引和检索文献,非正式主题词是查找正式主题词的疏导词。

(二)主题词表。

主题词表也称叙词表,是指由人造言语中优选进去的语义相关、族性相关的名词术语按字顺陈列所组成的一种规范化的灵活词典。

(三)《公文主题词表》。

《公文主题词表》是用于公文主题标引与检索的主题词表。

它是顺应机关办公智能化,尤其是计算机数据处置的须要,为党政机关公文主题标引与检索而编制的一部术语控制工具。

(四)检索言语。

检索言语是依据人们检索上班的须要而发明的一种人工言语,它是存储、查找文献的独特依据,也叫标引言语。

检索言语又分为分类言语和主题言语。

分类言语的概念。

是指以阿拉伯数字或以拉丁字母和数字混协作为类指标识符号,以基本类目作为词汇,以类目的附属相关表白复杂概念的一类检索言语。

主题言语的概念。

是以直接论述的事物、对象为依据,以人造言语为基本词汇,以概念之间的逻辑相关作为构词法的一类检索言语。

二、为什么要标引公文主题词(一)标引公文主题词无利于建设先进的公文检索体系,辅佐指导同志决策。

消息量的参与,数据量的增大,单纯的分类检索方法难以满足人们对多主题文件查找的要求。

主题检索方法补偿了分类检索方法的无余,检索更自在,查找跨度更大。

(二)标引公文主题词是建设机关办公智能化检索系统的前提条件。

办公智能化系统经过文件上标注的主题词将文件归入检索系统。

办文人员在办公智能化系统上经过主题词来查找无关主题的文件。

(三)标引主题词是成功公文治理现代化的基础。

档案上班人员可以依据公文主题词编制档案、文件主题索引或主标题录、专标题录等手工检索工具。

办文人员可直接应用依据公文主题词而建设的档案编目计算机检索系统查找文件。

(四)对提高秘书上班人员业务素质有关键作用。

三、《公文主题词表》的体系结构《公文主题词表》由范围表、字顺表、附表三大局部组成。

1、范围表。

范围表又称分类表,它依据公文的关键内容和职能部门的分工划分若干范围,将字顺表中所列款目词按词义归入无关类目,满足按类查词和按族性检索的要求。

范围表设两级类目,一级类目19个,用一个汉语拼音字母标识。

二级类目70个,用两个拼音字母标识。

2、字顺表。

字顺表由正式主题词与非正式主题词款目(词单元)、款目词的汉语拼音、范围号和词的参照相关四局部组成,一般词还有注释。

例如,第121页:财政政策款目词汉语拼音→cai zheng zheng ce①汉语拼音。

注上汉语拼音关键是便于按音排序和按音查词。

②款目词。

款目词单元按汉语拼音字顺规则的同音同调同形陈列,起陈列和查找作用。

③范围号。

范围号即每个款目词所属的分类范围编号。

这是字顺表与范围表咨询的渠道,经过范围号可以在范围表中查找与该主题词同属一个类别的相关主题词。

④参照相关。

参照相关有同等相关、属分相关和相关相关三种。

同等相关指两个以上概念相反或相近的主题词之间的相关,也叫用代相关,用“Y”示意正式主题词,用“D”示意非正式主题词;属分相关指概念上具备附属相关的主题词之间的相关。

不同附属相关主题词区分用 “F”、 “S”、 “.”、“..”和“Z”示意。

“F”是下位词指引符,该词之后的主题词为下位词,用“.”、“..”示意,黑点多少示意词的等级,黑点越多示意该词越专指;“S”是上位词指引符;“Z”是族首词指引符,同时带有“*”号。

相关相关指主题词之间具备的交叉、统一、矛盾、对应等相互参照的相关,用C示意。

3、附表。

附表有三个,内容为:组织机构称号表;中国地域称号表;环球各国和地域称号表。

附表中的主题词与字顺表中的主题词具备同等效能。

四、怎么标引公文主题词(一)公文主题剖析。

1、审读文件,了解主题。

审读文件的重点。

2、剖析主题类型,确定主题概念。

主题类型分为单主题和多主题两种。

单主题是指一份公文所钻研和论述的只要一个对象或疑问。

多主题是指一份公文所钻研和论述的主题对象不仅一个,而是两个或许更多,而且都是并列的独立主题。

3、剖析主题结构,确定主题起因。

主题起因分为主体起因、通用起因、位置起因、期间起因和文献类型起因五局部。

主体起因是指公文论述的主题中的关键性概念,它是公文主题的关键成分,其余主题起因都隶属于这个主体起因;通用起因是构成主题的一些通用概念,它说明主体起因的灵活和趋向。

通用概念没有专指性也没有独立检索价值,不宜独自经常使用;位置起因是标明主体起因所处的位置和范围,文件规则适用的地域、位置和对象。

位置起因包括国度称号、地域称号和组织机构称号; 期间起因是从期间上对主体起因启动限定,把主题对象放在特定的期间范围之内。

期间起因包括年代、时代、朝代、期限等;文献类型起因包括文献种类、公文文种、文件称号编号等。

(二)查表选词,转换主题概念。

经过查找主题词表启动主题概念转换时,必定驳回词表上规范化的主题词。

转换主题概念关键有两种方式:一是直接转换。

二是直接转换。

(三)主题词组配标引。

组配,就是用两个或两个以上主题词构成逻辑相关组合以表白一个专指概念的一种方式。

它以词间语法相关和逻辑相关为基础,只要相容相关的概念词才可以组配,而且,不是字面上的组配,选择的起因是逻辑相关。

组配标引有概念交叉组配、概念限定组配、上位词或下位词组配。

应优先思考交叉组配和限定组配。

交叉组配是指两个组配的概念之间具备交叉相关,两个概念的外延有一局部重合。

限定组配是以概念的限定为基础,由属概念过渡到种概念的组配。

(四)直接上位词标引和靠词标引。

上位词标引要求两个概念之间具备属分相关。

靠词标引要求两个概念必定是同一范围、同一属性。

无论是直接上位词标引或是靠词标引,都不能越级标引。

(五)自在词标引。

自在词标引是用未经规范化处置的人造言语表述公文主题概念,并作为表白公文主题概念的检索标识。

自在词标引范围:一是某些主题概念只管可以驳回组配标引或上位词标引,但经常使用频率较高;二是新产生的主题概念,包括新科技、新政策、新切实、新名词术语等;三是人物、期间和年代称号;四是地域、组织机构称号。

自在词标引应遵守的规则:一是应仔细地查找词表,确实没有适合的专指的主题词,才启动自在词标引。

二是可选择其余词表以及威望性参考书、工具书上的词。

三是所选的词必定具备较强的检索性能和组配性能,具备适用性,能检索,能组配。

四是应尽或许做到词形便捷、概念明白。

五是在标出自在词的同时相应标出它的上位主题词(或类别词)。

六是在自在词后标上“△”符号,并适时将新词注销在主题词表上。

选择《词表》以外的地名(组织机构名)、期间、人名、文献称号等公用名词作自在词标引时,不作△标志。

五、标引上班中一些详细疑问(一)主题词的陈列。

反映公文全体(概述)内容的主题词在前,反映公文局部(分述)内容的主题词在后。

在单主题公文中,反映核心内容的主题词在前,反映其余方面的主题词在后;在多主题公文中,反映公文全体(概述)内容的主题词在前,反映公文其余内容的各主题词按产生的先后秩序陈列。

作为自在词标引的地名(组织机构名)、期间、人名等,应置于体现公文内容的主题词前面,置于体现公文方式的主题词前面。

同时出如今同一公文中,则按地名(组织机构名)、期间、人名的顺序陈列。

(二)文种的标引。

文种作为正式主题词,标在一切主题词的最末位。

在转(印)发类型通知中,被转(印)发的公文的文种可不作为主题词标引。

但假设被转(印)发的公文属法规性质,其称号为条例、规则、方法等,则应作为主题词标引。

(三)标点符号的标引。

公文主题词普通不应产生标点符号。

在《公文主题词表》中带有标点符号的正式主题词,应予保管。

由于这些标点符号有不凡性能,删去后容易引发歧义。

自在词标引时普通不要带标点符号。

什么叫主题词 我须要一个比拟威望的解释 (什么叫主题词的扩展检索,它的优越性何在)

罕用的全文消息关键包括哪些?

全文消息检索是以全文本消息为关键检索对象,准许用户以布尔逻辑和人造言语,依据资料的内容而不是内在特色来成功检索的先进检索技术。

全文检索系统标引方式有词典法标引、单汉字标引、不凡标引等。

全文消息(Full Message)由WAA颁布的一种广告规范,关键是针对SMS和GSM网络消息的颁布。

是一种了应用SMS发送蕴含所有160个字符的广告方式。

全文数据库和全文消息检索,保管在数据库中的记载数据,从类型上可以分为两种。

其一是结构化数据,象字符、日期、数值、货币等,这些数据都是具备有限长度或固定格局的数据;其二是非结构化数据,也叫全文数据,象简历、简介、论文等,这些数据都是以不定长、非固定格局保管的字符型数据。

现有的数据库系统,都是以结构化数据为检索的关键指标,由于成功相对便捷。

比如数值检索,可以建设一张排序好的索引表,以二分法成功查找,速度很快。

但关于非结构化数据,即全文数据,要想成功检索,相对难度要大的很多了。

1.网络基于字词联合的消息处置方式。

奇妙处置了中文消息的了解疑问,提高了搜查的准确性和查全率。

2. 网络支持干流的中文编码规范。

包括GBK(汉字内码裁减规范)、GB2312(简体)、BIG5(繁体),并且能够在不同的编码之间转换。

3. 网络的智能相关度算法。

驳回了基于内容和基于超链剖析相联合的方法启动相关度评估,能够主观剖析网页所蕴含的消息<。

4. 网络的检索结果能标示丰盛的网页属性(如标题、网址、期间、大小、编码、摘要等),并突出用户的查问串,便于用户判别能否浏览原文。

5. 网络搜查支持二次检索。

罕用的大数据工具备哪些?

未至科技魔方是一款大数据模型平台,是一款基于服务总线与散布式云计算两大技术架构的一款数据剖析、开掘的工具平台,其驳回散布式文件系统对数据启动存储,支持海量数据的处置。

驳回多种的数据采集技术,支持结构化数据及非结构化数据的采集。

经过图形化的模型搭建工具,支持流程化的模型性能。

经过第三方插件技术,很容易将其余工具及服务集成到平台中去。

数据剖析研判平台就是海量消息的采集,数据模型的搭建,数据的开掘、剖析最后构成常识服务于实战、服务于决策的环节,平台关键包括数据采集局部,模型性能局部,模型口头局部及成绩展现局部等。

未至科技小蜜蜂网络消息雷达是一款网络消息定向采集产品,它能够对用户设置的网站启动数据采集和降级,成功灵敏的网络数据采集指标,为互联网数据剖析提供基础。

未至科技泵站是一款大数据平台数据抽取工具,成功db到hdfs数据导入性能,借助Hadoop提供高效的集群散布式并行处置才干,可以驳回数据库分区、按字段分区、分页方式并行批处置抽取db数据到hdfs文件系统中,能有效处置大数据传统抽取造成的作业负载过大抽取期间过长的疑问,为大数据仓库提供传输管道。

未至科技云计算数据核心以先进的中文数据处置和海量数据撑持为技术基础,并在各个环节辅以人工服务,使得数据核心能够安保、高效运转。

依据云计算数据核心的不同环节,咱们专门装备了系统治理和保养人员、数据加工和编撰人员、数据采集保养人员、平台系统治理员、机构治理员、舆情监测和剖析人员等,满足各个环节的须要。

面向用户咱们提供面向政府和面向企业的处置打算。

未至科技显微镜是一款大数据文本开掘工具,是指从文本数据中抽取有价值的消息和常识的计算机处置技术, 包括文本分类、文本聚类、消息抽取、实体识别、关键词标引、摘要等。

基于Hadoop MapReduce的文本开掘软件能够成功海量文本的开掘剖析。

CKM的一个关键运行畛域为智能比对, 在专利陈腐性评估、科技查新、文档查重、版权包全、稿件溯源等畛域都有着宽泛的运行。

未至科技数据立方是一款大数据可视化相关开掘工具,展现方式包括相关图、期间轴、剖析图表、列表等多种表白方式,为经常使用者提供全方位的消息展现方式。

作文自创章回小说回目式拟亮丽标题 2019年高考作文备考 (自创文章怎么写)
« 上一篇 2024-09-18
如何了解课程内容结构化 (如何了解课程内容)
下一篇 » 2024-09-18

文章评论