·
搜索结果:找到“全文检索”相关结果17093条
排序: 按相关 按相关 按时间降序
  • 【期刊】 基于Lucene的多源数据全文检索的研究与实现

    刊名:现代计算机(专业版) 作者:邱敏明 ; 任洪敏 ; 顾利军 关键词:全文检索 ; Lucene ; 数据订阅 ; 数据消费 机构:上海海事大学信息工程学院 ; 上海海事大学信息工程学院 年份:2018
    摘要:在软件开发过程中会产生格式各样的文档数据,例如Word文档、PDF文档等,同时这些文档还存储在不同的数据源,例如文件系统、My SQL数据库、Git仓库等。多数据源情况下,还没有一种统一的方式从多种数据源中检索结构化和非结构化的数据。而基于Lucene的多源数据全文检索系统提出通过使用XML配置文件的方式对多种数据源索引模型创建,以此实现检索系统索引的可配置化。全文检索系统提供方便统一的检索方式来从多种数据源中检索数据,解决多数据源统一检索的问题。
  • 【期刊】 基于全球剖分网格的空间数据全文检索方法

    刊名:地理信息世界 作者:褚福林 ; 濮国梁 ; 程承旗 ; 冯洋 关键词:全文检索 ; Geo SOT ; 空间区位编码 ; 剖分编码 ; 全球剖分网格 机构:北京大学遥感与地理信息系统研究所 ; 北京大学遥感与地理信息系统研究所 ; 北京大学航空航天信息工程研究所 ; 中国科学院电子学研究所 年份:2015
    摘要:目前,国内外不同部门的空间数据管理系统彼此独立,数据共享检索效率低。针对此问题,本文提出了一种基于全球剖分网格的空间数据全文检索方法。该方法描述了基于全球剖分网格原理,根据地理空间实体的区位信息建立全球唯一的空间区位标识编码,通过全文索引引擎对空间区位标识编码建立全文索引,实现对地理空间数据的检索。通过对比试验可知,在大数据量的时候,基于全球剖分网格的空间数据全文检索方法比基于B+树的传统关系型数据库检索效率高,在海量空间数据的检索上具有一定应用价值。
  • 【期刊】 企业网站静态页面生成与全文检索技术研究

    刊名:中国管理信息化 作者:李苑 ; 李明 关键词:全文检索 ; 企业网站 ; 静态页面生成 机构:昆明冶金高等专科学校商学院 ; 昆明冶金高等专科学校商学院 ; 云南瑞升烟草技术(集团)有限公司 年份:2019
    摘要:从企业网站中用户经常使用的信息浏览和信息检索两个需频繁读取数据库的功能入手,介绍了可有效降低数据库读取频率的静态页面生成技术和站内全文检索技术的原理和实现方式。
  • 【期刊】 基于蚁群算法的陶瓷云全文检索优化

    刊名:福建电脑 作者:李超 ; 章义来 关键词:全文检索 ; 蚁群算法 ; 陶瓷云 ; 建模 机构:景德镇陶瓷学院 ; 景德镇陶瓷学院 ; 江西陶瓷企业信息化工程技术研究中心 年份:2014
    摘要:本文针对陶瓷行业云中全文检索的功能进行建模并优化,通过结合蚁群算法使其能够在云中更快速、合理的找到所需访问的数据,构建数据缓存,减少链路上的负荷,从而很大程度上提高云计算的效率。
  • 【论文】 异构文档库全文检索系统的设计与实现

    作者:潘冬 关键词:全文检索 ; 增量更新 ; 网络爬虫 ; 倒排索引 机构:华中科技大学 ; 华中科技大学 年份:2016
    摘要:随着信息化时代的发展,不仅互联网信息量正在以指数级的速度增长,企业内部长期积累的文档资料也越来越多。如何在海量资料中快速检索到自己所需要信息的问题亟需解决。基于Solr的全文检索系统,通过采集文档的元数据信息以及解析其文本内容,为企业内异构文档库中的文档建立索引结构,为用户提供了快速检索所需文档的工具。采用B/S结构的全文检索系统,服务端按功能主要划分为异构文档库文件获取、文档解析、分词、索引管理以及信息检索五大模块。异构文档库文件获取模块为驻留在服务器上的网络爬虫服务,采用增量更新模式,定期获取异构文档库上已被修改的文档,对文件目录文档库使用JCIFS抓取,对SVN及Polarion文档库使用SVNKIT抓取,对文档数据库直接通过数据库连接抓取。文档解析模块对抓取到的各种类型文档进行解析获取其文本内容,对office文档采用POI解析,对PDF文档采用PDFBOX解析,对XML文档采用JDOM解析,对Polarion文档采用自定义的方式解析。分词模块将开源中文分词包IKAnalyzer集成到Solr中,提供中文文本的分词功能。索引管理模块整合文档的文本内容及元数据信息,将其更新到索引库,其中索引库为利用Solr构建的倒排索引结构。信息检索模块利用服务端提供的服务接口,为用户提供检索界面并提供系统设置、文件上传等功能界面。为企业搭建了一个基于全文检索的搜索引擎,为用户提供了方便快速的文档搜索功能。系统测试表明,服务端索引更新速度较快,文档搜索的响应速度、查全率、查准率都达到了用户的需求,实现了系统功能。
  • 【期刊】 TRS全文检索系统在松辽委网站检索中的应用

    刊名:东北水利水电 作者:张程 ; 任海霞 ; 张继军 关键词:网站 ; TRS ; 检索 ; 松辽委网站 机构:[1]松辽水利委员会水文局(信息中心) ; [1]松辽水利委员会水文局(信息中心) 年份:2018
    摘要:本文介绍了利用TRS全文检索系统构建网站检索系统的体系结构,各部分的功能,以及网站检索系统建设应用。
  • 【期刊】 基于全文检索的文本相似度算法应用研究

    刊名:计算机与数字工程 作者:王格 ; 吴钊 ; 李向 关键词:文本相似度 ; 余弦VSM ; Simhash 机构:湖北文理学院数学与计算机科学学院 ; 湖北文理学院数学与计算机科学学院 ; 中国地质大学(武汉)计算机学院 年份:2016
    摘要:在大量的文本数据中,针对不能快速有效地提取或查找有用信息及知识这个问题,以文本相似度计算为基础的文本数据挖掘成为数据挖掘研究领域里的一个重要的课题。论文主要研究两种不同的方法 VSM余弦算法和Simhash来实现文本相似度的计算,首先采用传统的VSM余弦算法和Simhash算法,按照余弦公式通过内积最终计算出文本间的相似度大小n(0
  • 【期刊】 基于Solr的电子病历全文检索系统的设计与实现

    刊名:中国医疗设备 作者:彭红波 ; 韩晟 ; 王婷婷 关键词:全文检索 ; Solr ; 电子病历 ; 搜索引擎 机构:空军军医大学第三附属医院信息科 ; 空军军医大学第三附属医院信息科 年份:2019
    摘要:目的构建一个简单、高效和异构的电子病历全文检索平台。方法以Solr为搜索引擎,通过对电子病历存储格式的异构处理,完成电子病历内容的索引化,从而实现电子病历的全文检索。结果该技术屏蔽了电子病历存储格式的差异,构建的全文检索平台不依赖于电子病历系统本身,易于操作且查询效率较高。结论本文构建的电子病历全文检索系统,不仅为用户提供了一个操作便捷的搜索平台,而且还提高了检索效率和查准率,同时为进一步的科研统计工作提供了数据支撑。
  • 【期刊】 基于Spark SQL的分布式全文检索框架的设计与实现

    刊名:计算机科学 作者:崔光范 ; 许利杰 ; 刘杰 ; 叶丹 ; 钟华 关键词:全文检索 ; Spark SQL ; 翻译转换框架 ; 检索并行化 ; 检索优化 机构:中国科学院大学 ; 中国科学院大学 ; 中国科学院软件研究所 年份:2018
    摘要:随着信息化的深入,大数据在各个领域产生了巨大的价值,海量数据的存储和快速分析成为新的挑战。传统的关系型数据库由于性能、扩展性的不足以及价格昂贵等方面的缺点,难以满足大数据的存储和分析需求。Spark SQL是基于大数据处理框架Spark的数据分析工具,目前已支持TPC-DS基准,成为大数据背景下传统数据仓库的替代解决方案。全文检索作为一种文本搜索的有效方式,能够与一般的查询操作结合使用,提供更加丰富的查询和分析操作。目前,Spark SQL仅支持简单的查询操作,不支持全文检索。为了满足传统业务迁移和现有业务的使用需求,提出了分布式全文检索框架,涵盖了SQL文法、SQL翻译转换框架、全文检索并行化、检索优化4个模块,并在Spark SQL上进行了实现。实验结果表明相比于传统的数据库,在两种检索优化策略下,该框架的索引构建时间、查询时间分别减少到传统数据库的0.6%/0.5%和1%/10%,索引存储量减少为传统数据库的55.0%。
  • 【期刊】 TRS全文检索系统在松辽委网站检索中的应用

    刊名:东北水利水电 作者:张程;任海霞;张继军; 关键词:网站;;TRS;;检索;;松辽委网站 机构:松辽水利委员会水文局(信息中心) ; 松辽水利委员会水文局(信息中心) 年份:2018
    摘要:本文介绍了利用TRS全文检索系统构建网站检索系统的体系结构,各部分的功能,以及网站检索系统建设应用。
  • 【期刊】 大数据分布式全文检索系统的设计与实现

    刊名:计算机产品与流通 作者:黄惠南;潘苗; 关键词:大数据;;分布式;;全文检索 机构:无锡江南计算技术研究所 ; 无锡江南计算技术研究所 年份:2017
    摘要:现在已经步入了大数据时代,各行各业的数据都在大幅增长,如何能快速从海量数据中寻找到自己所需要的信息是信息技术行业中面临的重要问题。本文首先介绍了设计大数据分布式全文检索系统的技术架构,并对系统进行了设计、实现与测试。
  • 【期刊】 大数据分布式全文检索系统的设计与实现

    刊名:计算机与数字工程 作者:李聪颖 ; 王瑞刚 ; 于金良 关键词:大数据 ; 搜索 机构:西安邮电大学 ; 西安邮电大学 年份:2016
    摘要:论文是基于一种开源企业搜索引擎Solr实现对大数据分布式数据库HBase中数据的检索.论文简单地介绍了分布式存储技术HBase和分布式索引技术SolrCloud,实现了基于Solr和Zookeeper的分布式搜索方式SolrCloud模式对HBase表的索引的建立.该系统通过python程序在对HBase中的Rowkey建立索引的同时还对每列数据都建立索引,实现了Hbase的二级索引,克服了HBase只能通过Rowkey单一查询的不足.经过反复测试,充分地表明了基于Solr的分布式搜索系统的高效性及高可靠性.
上一页 1 2 3 4 5 6 7 8 9 10 下一页 跳转