·
搜索结果:找到“主题词”相关结果5204条
排序: 按相关 按相关 按时间降序
  • 【专利】 一种基于多特征融合的主题词提取方法

    作者:胥桂仙 年份:2017
    摘要:本发明涉及一种基于多特征融合的主题词提取方法,包括以下步骤:通过用户输入的网址自动采集其能访问到的所有页面内容,以获取网页的藏文文本;根据藏文关键词表对获取的藏文文本进行匹配,将出现在藏文关键词表中的词汇选为候选主题词;对所述候选主题词进行权重计算,根据权重对所述候选主题词进行排序,并从排序后的候选主题词中确定一个或多个主题词。本发明提出了一种构建关键词表,将一些重要的低频词筛选为主题词的方法,有效的提高人们从海量数据中获取所需信息的准确性。
  • 【期刊】 基于共现分析的文本主题词聚类研究

    刊名:图书馆杂志 作者:阮光册 ; 夏磊 关键词:主题模型 ; 齐普夫定律 ; 共词分析 ; 主题词聚类 机构:华东师范大学经济与管理学部 ; 华东师范大学经济与管理学部 ; 上海图书馆 年份:2018
    摘要:本文将共现分析应用于非结构化文本文件,挖掘文本主题的语义关联。由于文本文献不同于科技文献,缺少关键字等描述信息,本文引入主题模型对文本进行语义降维,生成的主题词作为共词分析的研究对象。实验发现中频主题词能更好地反映文本的主题特征,为此,本文结合齐普夫定律和同词频理论选取中频主题词,通过共词分析识别语义关联,并采用K-means聚类算法实现主题词的聚类。本文以"创新创业"相关新闻文本进行实验,实现文本集主题词的聚类,通过实验对比分析,本文的方法能够更好地体现文本主题的语义联系。
  • 【专利】 一种从单个中文文本中提取多主题词的方法

    作者:马甲林 ; 王志坚 年份:2014
    摘要:本发明提供了一种从单个中文文本中自动提取多主题词的方法,包含以下步骤:首先使用传统方法对文档进行预处理后初步得到由特征词组成的向量;其次利用《知网》词义与概念间的对应关系对同义词进行归并,根据语义类与上下文语境的相关性对多义词进行排歧,构造概念向量模型表示该文档;再利用《知网》中概念的相关语义信息计算概念相似度,通过“预设种子”的方法改进K-means算法对概念进行聚类,形成多个主题概念簇;最后根据概念和词的对应关系,得到多个子主题词集。该方法考虑了语义信息,克服K-means算法对初始中心的敏感性和时空开销不稳定等缺陷,提高了提取主题的质量。
  • 【期刊】 基于主题词频共现的渔业科学数据推荐

    刊名:现代计算机 作者:蒋庆朝 ; 徐硕 ; 陈孟婕 ; 王立华 关键词:词频共现 ; 推荐 ; 主题融合 机构:中国水产科学研究院渔业工程研究所 ; 中国水产科学研究院渔业工程研究所 年份:2020
    摘要:内容推荐方法难以发掘用户潜在兴趣;并且对融合多种主题和关键词的物品推荐程度较低;针对这一问题;提出一种基于主题词频共现的推荐算法;并进行了验证;通过对比主题词频共现的推荐算法与内容推荐、协同过滤、人口统计的推荐结果;发现相较于其他推荐方法;所提出的方法具有更高的准确率和击中率;同时;推荐结果能够体现多种主题融合;并且可以发掘用户感兴趣的主题;弥补推荐结果主题过于集中的缺陷;
  • 【专利】 一种基于网站主题词查询的建立方法及系统

    作者:车天文 ; 雷大伟 ; 石志伟 ; 周步恋 ; 杨振东 ; 王喜民 年份:2013
    摘要:本发明涉及信息检索领域,提供了一种基于网站主题词查询的建立方法,包括,获取网页数据;根据网页数据统计词汇的网站间重要性;根据网页数据提取网站主题词;根据提取的网站主题词信息,建立存储资源词典;建立网站主题查询接口。本发明还提供了一种基于网站主题词查询的建立系统。采用本发明的技术方案,流程简单易实现,可快速的实现更新完善,供线下、线上使用来提升专业化搜索体验。
  • 【期刊】 一种以主题词为特征的排序划界网站聚类算法

    刊名:西安工业大学学报 作者:路文华 ; 罗钧旻 ; 赵丹 ; 高武奇 关键词:主题词 ; 自我意识 ; 语义Web ; Web语义结构 ; 聚类 机构:西安工业大学计算机科学与工程学院 ; 西安工业大学计算机科学与工程学院 年份:2018
    摘要:为了设计出基于自我意识的语义Web中网眼agent的自我意识即Web的语义结构,文中分析了网站及网页的组成元素和组成结构,收集互联网的主题词并精简处理得到Web特征词,根据特征词的出现频率对主题词进行排序;把这个主题词序列作为网站特征值的结构,根据这些特征词在某个网站上是否出现把对应位置为1或0,计算出网站的特征值;提出并实现了一种基于主题词的网站特征值排序划界聚类算法,最后通过两组数据对该算法的有效性进行了验证.
  • 【期刊】 基于医学主题词共现网络的链接预测研究

    刊名:情报杂志 作者:宫雪 ; 崔雷 关键词:链接预测 ; 共词网络 ; 机器学习 ; 知识发现 机构:[1]中国医科大学图书馆 ; [1]中国医科大学图书馆 年份:2018
    摘要:[目的/意义]共词网络作为一类特殊的科学知识网络,不仅能从微观层面揭示科学知识体系内部的实体关系特征,还能以其演化过程反映科学知识概念的增长规律。但目前对于共词网络的研究大多集中于“描述”阶段。对医学主题词的共现网络进行链接预测研究,试图找到一种新的预测科学发展方向的途径。[方法/过程]构建以医学主题词/副主题词为节点的共词网络,抽取没有共现关系的主要主题词/副主题词词对为研究样本,计算各个词对的公共近邻、最短路径等属性值。利用朴素贝叶斯、SMO、J48决策树3种分类算法,对词对的共现关系进行预测,并通过属性选择对各属性的重要性进行排序。[结果/结论]3种算法中朴素贝叶斯算法得到了正确预测的共现词对。资源配置指标及Adamic-Adar指数的加权形式指标在预测中起到了更重要的作用。通过链接预测技术,预测两个词在下一个时段是否能够共现,是预测科学发展方向和知识发现的一种新尝试。
  • 【期刊】 民国时期图书主题词标引应注意的问题

    刊名:科技情报开发与经济 作者:马晓菊 ; 侯薇 关键词:民国图书 ; 图书著录 ; 主题词标引 机构:辽宁大学图书馆 ; 辽宁大学图书馆 年份:2015
    摘要:民国时期图书出版发行信息记载不规范,使得主题词标引成为民国图书书目数据著录工作的难点。以民国时期出版发行史料和相关立法为依据,针对民国图书的内容特点,以相关实例探讨了民国时期图书主题词标引应注意的问题,提出了相应的解决方法。
  • 【期刊】 我国印发型公文主题词表分析及分面改造

    刊名:《图书馆工作与研究》 作者:郝嘉树 关键词: ; 综合电子政务主题词表 ; 分面化改造 ; 基于网络的维护管理系统 机构:国家图书馆 ; 国家图书馆 年份:2016
    摘要:各级政府、党务和行业部门产生了庞大的纸质公文资源,另外数字化办公及政府信息公开也催生了大量的电子政务信息。我国虽然颁布了专门的主题词表用于公文的标引,政务网站也通过分类的方式组织资源,但词表性能、使用和修订机制、分类体系构建等方面的问题导致该类资源得不到有效地组织和利用,同时也未引起图情界知识组织领域的重视。面对该情况,本文对使用面广而又问题突出的印发型公文主题词表进行了分析研究,以期帮助图情人员快速了解该类词表的情况、特点和问题,并在此基础之上给出利用已有词表进行分面化改造的方案和相关建议,包括分面分类体系的构建、结构的建立和开发网络环境下的维护管理系统,从而提高各部门和行业公文标引、检索和组织的效率,也为政务网站构建分类体系组织资源提供参考。
  • 【期刊】 日本首相施政报告中相关教育内容的主题词分析

    刊名:外国问题研究 作者:刘桂萍 关键词:主题词 ; 日本首相施政报告 ; 教育 机构:东北师范大学中国赴日本国留学生预备学校 ; 东北师范大学中国赴日本国留学生预备学校 年份:2017
    摘要:通过对日本历任首相施政报告中相关教育内容的分析,可从“教育、原动力、百年大计、要务、青少年、国民性、变革”七个高频率出现的语词看出,自1885年第1任首相起至今已130余年,重视教育的施政理念贯穿始终。尤其是二战后,日本历任首相都将教育问题作为施政要务及国家发展的百年大计予以关注,并将目光置于青少年的教育和培养上,特别值得瞩目的是日本的教育政策始终为适应时代潮流而处于不断的变革和修缮中。
  • 【期刊】 主题词组合新颖性与论文学术影响力的关系研究

    刊名:图书情报工作 作者:任海英 ; 王德营 ; 王菲菲 关键词:主题词 ; 组合新颖性 ; 被引频次 ; 共现网络 年份:2017
    摘要:[目的/意义]研究学术论文内容的组合新颖性与其学术影响力的关系,为研究论文的学术影响力提供新的研究视角.[方法/过程]采用文本挖掘方法对论文题目、摘要和关键词中的主题词进行提取,通过构建领域主题词共现网络,为每篇论文设计了新颖组合率、中等组合率和常规组合率3个指标,将领域论文划分为不同的新颖性/常规性类型,然后对不同类型论文中高被引论文所占的比例进行统计分析.[结果/结论]同时具有主题词组合高新颖性和高常规性特点的论文成为高被引论文的几率显著高于其他类型的论文,因此建议研究者在科学研究中应注重新颖知识与常规知识的适当组合.
  • 【期刊】 基于词向量技术与主题词特征的微博立场检测

    刊名:《计算机系统应用》 作者:郑海洋 ; 高俊波 ; 邱杰 ; 焦凤 关键词:主题词集 ; 立场检测 ; 主题词特征 ; 词向量 ; 立场特征 机构:上海海事大学信息工程学院 ; 上海海事大学信息工程学院 年份:2018
    摘要:微博话题随着移动互联网的发展变得火热起来,单个热门话题可能有数万条评论,微博话题的立场检测是针对某话题判断发言人对该话题的态度是支持的、反对的或中立的.本文一方面由Word2Vec训练语料库中每个词的词向量获取句子的语义信息,另一方面使用Text Rank构建主题集作为话题的立场特征,同时结合情感词典获取句子的情感信息,最后将特征选择后的词向量使用支持向量机对其训练和预测完成最终的立场检测模型.实验表明基于主题词及情感词相结合的立场特征可以获得不错的立场检测效果.
上一页 1 2 3 4 5 6 7 8 9 10 下一页 跳转