·
搜索结果:找到“作者名消歧”相关结果8989条
排序: 按相关 按相关 按时间降序
  • 【期刊】 文献数据库中作者名消歧算法研究

    刊名:现代图书情报技术 作者:郭舒 关键词:作者名消歧 ; GHOST ; 文本挖掘 ; 消歧算法 机构:中国科学院国家科学图书馆 ; 中国科学院国家科学图书馆 ; 中国科学院大学 年份:2013
    摘要:在深入分析基于图的人名识别框架GHOST的基础上,针对其存在的局限性,结合对文献信息的文本挖掘提出一种更适用于文献数据库的作者名消歧算法,并从中选取标题以及出版物名称这两个特征进行实证研究,该算法在准确率、召回率等指标方面都有良好的表现,F1平均值达到84%,具备较好的消歧效果。
  • 【期刊】 基于机器学习的论文作者名消歧方法研究

    刊名:四川大学学报(自然科学版) 作者:邓可君 ; 华凯 ; 邓昌明 ; 姜宁 ; 袁玲 ; 彭一明 ; 张治坤 关键词:作者名消歧 ; 机器学习 ; 文本特征提取 机构:北京大学计算中心 ; 北京大学计算中心 年份:2019
    摘要:本文提出了一种基于规则匹配和机器学习的论文作者名自动化消歧方法:首先基于人工构建的人名匹配规则确定候选作者,对于存在多个候选人的情况,基于论文的属性信息(例如合作者、标题、摘要、关键词和出版物名称等)提取特征,然后选取合适的机器学习算法进行消歧.实验效果表明K近邻和Softmax分类器较适合于论文作者名消歧任务;此外,将作者信息与论文的其他信息分开提取特征能够有效提高作者名消歧的准确性.
  • 【期刊】 一种面向篇级数据的作者名消歧规则和算法

    刊名:现代图书情报技术 作者:肖晶 ; 梁冰 ; 张晓丹 ; 吕世炅 关键词:作者名消歧 ; 模糊匹配 ; 篇级数据 ; 消歧算法 机构:中国科学技术信息研究所 ; 中国科学技术信息研究所 年份:2012
    摘要:在深入分析NSTL篇级元数据特点的基础上,结合模糊匹配算法,提出一种适合NSTL现有数据的人名消歧规则集,并给出基于该规则集的人名消歧算法。通过对实际数据集的实验,该算法在准确率、召回率等指标方面都有良好的表现,具备较好的消歧效果。
  • 【专利】 一种中文文献作者名消歧的方法

    作者:孙星恺 ; 陆浩 ; 袁勇 ; 王飞跃 ; 关晓炟 ; 吕宏强 年份:2015
    摘要:本发明公开了一种中文文献作者名消歧的方法,该方法包括:对文献数据集进行规范化预处理;作者初次抽取及形式化表达;对有重名歧义的作者根据其基础属性计算两两间的基础属性相似度得分;构建重名作者关键词关系对应表并计算关键词相似度得分;对重名作者建立合作关系网络并计算两两间的合作关系相似度得分;根据相关基础属性、关键词及合作关系网络计算综合相似度指数进行重名作者判定;根据判定结果更新作者相关信息。通过本发明可以实现对中文文献中存在的作者重名现象进行消歧,为通过学术文献分析进而应用在科技评价、学术研究等方面提供了一种提高学术分析精准化程度的方法。
  • 【论文】 科技文献作者名消歧与实体链接

    作者:宋文强 关键词:作者识别 ; 重名消歧 ; 聚类算法 ; 实体链接 机构:哈尔滨工业大学 ; 哈尔滨工业大学 年份:2012
    摘要:随着网络的普及,在线文献系统也随之发展,出现了如DBLP、微软学术等以作者为核心的文献集成系统,而同名作者识别是该类系统亟待解决的问题。本文将作者识别分为作者名消歧与实体链接两个子问题:对于作者重名问题本文尝试了基于聚类的消歧方法和基于特征关系图的消歧识别方法;在解决文献与教师链接问题时,针对中英文文献采用了不同的实体链接方法。具体研究内容包括以下几个方面: 第一:文献测试数据集的构建与特征选择方法。本文首先给出了文献记录的获取方法,测试数据集的构建策略及消歧实验的通用评价方法。其次根据文献中不同信息特征对于消歧的作用强弱,给出了文献识别问题中的特征选择方法,并设计了统一的特征消歧能力测试算法。测试结果表明合作者、期刊与关键词特征具有最好的区分作用,摘要和标题虽然有一定的消歧能力,但有较大的误差。了解特征属性,对改进消歧算法和提高作者识别的准确度均有很好的指导意义。 第二:基于聚类算法的作者消歧方法。一般重名消歧问题的研究思路都是将消歧问题转化为聚类问题,本文尝试了层次、k-means、AP三种不同的聚类消歧方法,在分析了各个方法优缺点的基础上,根据文献的各属性特征在聚类中起的作用不同,提出了分步聚类消歧方法。实验结果表明分步聚类方法比普通聚类方法更有效,使得消歧的准确率达到90%,召回率也接近75%。 第三:基于特征关系图的消歧方法。本文在文献作者消歧问题中引入了特征关系图的概念,将消歧问题转化成图的划分问题,给出了两种分别采用基于图的层次聚类消歧方法和基于连通子图划分的消歧方法。结果显示,特征关系图的消歧方法明显优于传统基于聚类的方法,其中基于连通子图划分的方法取得了最好的效果,消歧结果的召回率提高到84%,平均准确率达到了94.5%。 第四:实体链接与Tnet系统实现。实体链接主要解决文献中的作者与教师实体库的教师链接问题,针对中英文文献采用了不同的实体链接方法,最后将作者识别问题的研究成果应用到Tnet系统的文献展示模块。
  • 【期刊】 基于融合特征的中文图书作者名消歧方法研究

    刊名:电脑知识与技术 作者:李孟亚 关键词:中文图书作者 ; 人名消歧 ; 互斥放大 ; 空缺缩小 机构:北方工业大学计算机学院 ; 北方工业大学计算机学院 年份:2018
    摘要:中文图书作者中一人多名和多人同名现象普遍存在;且各属性描述参差不齐。融合特征消歧算法处理过程中准确率有所下降。本文将作者属性分为实体特征、上下文关系特征、社会关系特征。借助向量空间模型用属性互斥放大和特征矩阵空缺缩小方法调整属性和矩阵权重系数后计算作者相似度。通过基于凝聚的层次聚类实现消歧,构建中文图书作者信息模型。用B_Cubed指标评测消歧结果,准确率、F值分别达到为89.42%、87.45%。
  • 【期刊】 一种针对已知作者的姓名消歧方法

    刊名:图书馆杂志 作者:范午攸 关键词:作者姓名消歧 ; 数据标注 ; 分类算法 ; 朴素贝叶斯 机构:上海交通大学图书馆 ; 上海交通大学图书馆 年份:2018
    摘要:在外文期刊数据库中,同一姓名简称代表多位作者的现象十分普遍,严重影响作者检索的精度。本次研究将规则与算法相结合,依据规则为分类算法标注训练数据,从而在无监督条件下使用有监督算法,实现作者的精确检索。该算法适用于论文查证等已知作者身份的姓名消歧问题,相比通用的消歧方法,该方法结合无监督算法无需人工标注的优点,以及有监督算法高效率、易对应实体的优点。实践结果表明,该方法具有较高的准确度。
  • 【期刊】 文献数据库中作者名自动化消歧方法应用研究

    刊名:情报杂志 作者:郭舒 关键词:数字图书馆 ; 文献数据库 ; 作者名歧义 ; 自动化消歧 ; 名称消歧 机构:中国科学院国家科学图书馆 ; 中国科学院国家科学图书馆 ; 中国科学院大学 年份:2013
    摘要:在数字图书馆环境下,作者名歧义现象会降低文献数据库检索的准确性,影响文献数据集质量,自动化消歧方法相比于传统的方法将更有效地解决海量数据增长、人工辨识效率偏低的矛盾。在简述现有的具有代表性的作者名自动消歧方法的基础上,根据聚类方式和特征选取方式的不同,为其建立起一个较为完整的分类体系,并对其进行对比分析。然后针对文献数据库中存在的国内外作者名歧义现象,提出相应的不受限于某种数据库和语种的通用的人名消歧框架,从而为指导文献数据库系统如何应用合适的消歧方法提供技术支持。
  • 【期刊】 名消歧方法研究进展

    刊名:情报工程 作者:付媛 ; 朱礼军 ; 韩红旗 关键词:姓名消歧 ; 机器学习 ; 聚类 机构:中国科学技术信息研究所 ; 中国科学技术信息研究所 年份:2016
    摘要:为应对日益严重的姓名歧义现象给提高搜索引擎查全率和查准率带来的挑战,同时给姓名消歧方法研究提供参考建议,对研究现状和主要成果进行总结。首先,介绍研究姓名消歧的目的和意义。其次,对国内外现有姓名消歧方法研究进展进行梳理,主要方法包括基于特征的、基于机器学习的、基于社会网络的、基于网络知识资源的姓名消歧等多种方法来解决姓名歧义问题。最后,文章分析各种方法的特征和不足,总结姓名消歧待解决的问题以及未来的研究方向。
  • 【期刊】 利用优化的DBSCAN算法进行文献著者人名消歧

    刊名:图书馆理论与实践 作者:任景华 关键词:人名歧义 ; 人名消歧 ; DBSCAN ; 文献著者 机构:武汉大学新闻与传播学院 ; 武汉大学新闻与传播学院 ; 昌吉学院中文系 年份:2014
    摘要:通过对文本聚类算法DBSCAN算法优化对文献著者人名进行消歧,结果表明,相对标准文本聚类算法来说,优化后的算法能取得更好的人名消歧效果。
  • 【论文】 科技文献作者消歧方法研究

    作者:郑威杰 关键词:作者消歧 ; 层次聚类 ; 相似度计算 ; RDF 机构:杭州电子科技大学 ; 杭州电子科技大学 年份:2017
    摘要:近年来,网络海量科技文献知识库为科技工作者提供便捷的文献检索和学习研究服务,同时大量的作者同名现象降低了检索的准确性,因此作者消歧是该类知识库亟待解决的一个问题。作者消歧一般采用聚类方法来处理,针对目前聚类消歧方法没有充分利用作者间关系,本文研究提出一种基于二阶段层次聚类的作者消歧方法,用于解决同单位和不同单位的同名作者消歧问题,首先根据启发式策略从待消歧候选作者中发现同人的作者,通过聚类合并实现消歧,然后充分利用全局合著者关系,在聚类的迭代过程中补充合著者关系并结合作者的属性特征实现消歧。本文的主要研究工作如下:(1)作者消歧数据预处理。首先,针对网上不同文献知识库的文献格式不统一的问题,设计研发了科技文献数据的采集和抽取框架,将文献存储为标准的结构化数据;其次构建作者和论文实体,将结构化数据转化为RDF三元组来表示,利用D2R工具展示作者和文献实体及实体之间的关系;最后分析作者属性特征和关系特征的消歧能力,选择合适的特征用于作者消歧任务。(2)通过构建论文-合著者的关系图,研究提出一种基于图的作者消歧模型,建立消歧矩阵。研究提出利用词向量构建文档向量实现作者的属性相似度计算;研究提出基于图的合著者关系相似度计算;针对不同合著者对同名作者的区分度不同,研究提出利用姓名模糊度来衡量合著者的权重;最后提出一种基于属性特征和合著者关系的线性组合的相似度计算方法,结合作者的属性特征、合著者关系特征以及姓名模糊度,实现同名作者间的相似度计算。(3)充分利用合著者关系这一强特征,提出一种基于二阶段层次聚类的作者消歧方法。在第一阶段,针对可信合著者关系稀疏的问题,利用合著者扩展和共现关系实现待消歧候选作者的聚类合并;在第二阶段,针对合著者关系可信度低的问题,提出一种合著者关系的全局计算,结合线性组合的相似度计算方法进一步实现聚类合并。实验表明,本方法具有更优的准确性。
  • 【期刊】 地名知识辅助的中文地名消歧方法  

    刊名:《地理与地理信息科学》 作者:马雷雷 ; 李宏伟 ; 连世伟 ; 梁汝鹏 ; 龚竞 关键词:地名 ; 知识 ; 地名本体 ; 地名消歧 ; 关联度 机构:信息工程大学地理空间信息学院 ; 信息工程大学地理空间信息学院 ; 四川省应急测绘与防灾减灾工程技术研究中心 年份:2016
    摘要:地理空间中对位置的描述可以基于形式化的地理坐标,也可以利用自然语言文本中的非形式化地名来表达。文本中的同一地名可能指向很多地理位置,这就引起了地名歧义,地名消歧就是消除概念指称上的认知分歧,为地名分配唯一的地理位置。该文从地名知识的角度出发,首先提出了一种基于地名本体的地名知识统一表达方法,介绍了地名知识来源和地名知识库建库流程;然后给出了中文地名消歧原理和算法流程,从语义关系、拓扑关系、距离关系和地名密度4个维度计算地名实体之间的地理关联度进行地名消歧;最后通过实验对消歧方法进行了验证与评价,结果表明该消歧方法具有较高的准确率、召回率、覆盖率和F值。
上一页 1 2 3 4 5 6 7 8 9 10 下一页 跳转