·
搜索结果:找到“主题”相关结果200693条
排序: 按相关 按相关 按时间降序
  • 【专利】 一种主题网页爬取方法及主题爬虫系统

    作者:彭涛 ; 包铁 ; 徐凯旋 ; 张雪松 ; 王上 年份:2018
    摘要:本申请提供了一种主题网页爬取方法及主题爬虫系统,方法包括:从包括种子链接的第一待爬取链接集合中获取未爬取的链接;确定获取的链接对应的目标网页对应的第一相关度和第二相关度,第一相关度和第二相关度分别为目标网页中目标文本内容和目标链接与指定主题的相关度;根据第一相关度和第二相关度确定目标网页的温度值,并存储目标网页的待展示内容;若目标网页的温度值大于或等于预设温度值,将目标链接放入第二待爬取链接集合;若第一待爬取链接集合中不存在未获取过的链接,从第二待爬取链接集合中获取与指定主题相关度最高的未爬取的链接继续爬取。本申请使得用户可从网络上获取大量与指定主题相关的网页。
  • 【专利】 一种基于数据增强的主题建模方法

    作者:刘业政 ; 朱婷婷 ; 孙见山 ; 姜元春 ; 孙春华 ; 杜非 ; 熊强 年份:2018
    摘要:本发明公开了一种基于数据增强的主题建模方法,其特征是按如下步骤进行:步骤一、获取文档集合并表示;步骤二、使用潜在狄利克雷分布模型抽取所述文档集合D的主题,得到K个主题‑词分布和|D|个文档主题分布;步骤三、对单词进行主题影响力赋值;步骤四、对每篇文档进行数据增强;步骤五、建立数据增强的主题模型,并得到最终的主题‑词分布。本发明能在数据稀疏情况下充分利用文档信息进行数据增强,从而提高主题质量。
  • 【专利】 一种主题公园塑石假山的安装方法

    摘要:本发明提供一种主题公园塑石假山的安装方法,包括如下步骤:第一步:集成支撑平台:1)安装马道工作平台;2)安装楼梯通道:3)安装安全绳系统;第二步:网片面板安装:1)网片运输;2)网片安装:第三步:喷涂:1)封装层砂浆拌浆;2)封装层砂浆喷浆:第四步:雕刻:第五步:养护。本发明提供的主题公园塑石假山的安装方法为主题公园的塑石假山安装提供了一整套施工工艺,改善了主题公园内大型塑石假山的施工工艺随意性大,施工质量参差不齐的状况。
  • 【专利】 一种交互式的主题河流可视化方法

    作者:李天瑞 ; 陈馨菂 ; 杨欢欢 年份:2017
    摘要:本发明公开了一种交互式的主题河流可视化方法,包括如下步骤:1)对给定的主题,计算每个主题时间序列数据的离散系数,并根据离散系数对主题进行初始排序;2)计算主题河流的所有极值点;3)对每个极值点计算波动强度与贡献度;4)得到用户选择的波动强度筛选比例与贡献度筛选比例,对极值点进行筛选得到歧义点;5)对歧义点进行可视化设计,并在界面中展示;6)在用户获得歧义点的标识信息后,通过交互对河流进行个性化重排序。本发明有效地解决了信息可视化中主题河流在展示河流波动时,下层河流波动对上层河流的干扰,从而导致用户观察局部数据时产生的歧义,为用户提供个性化的读图功能。
  • 【专利】 一种主题公园喷泉水池用防堵喷头

    作者:酆庆 年份:2016
    摘要:本实用新型属于喷泉装置技术领域,具体涉及一种主题公园喷泉水池用防堵喷头,包括接管和喷嘴,所述喷嘴的球表面上端连通设有若干个喷水管,所述接管的下端设有螺旋卡圈,所述接管的内壁上一体设有第一凸起垫圈,所述第一凸起垫圈下端面设有粗过滤网,所述第一螺纹孔和第二螺纹孔之间穿设有第一螺栓,所述接管的出水端管内于内螺纹紧邻一体设有第二凸起垫圈,所述第二凸起垫圈下端面设有细过滤网,所述细过滤网边沿设有与第三螺纹孔对应的第四螺纹孔,所述第三螺纹孔和第四螺纹孔之间穿设有第二螺栓。本实用新型的目的是:解决现有的喷泉喷头不能够高效过滤掉水中的垃圾沉淀物使喷泉不能正常工作,导致喷泉的使用寿命短的问题。
  • 【期刊】 主题概率模型在微博主题挖掘方面的研究综述

    刊名:信息工程大学学报 作者:陈静 ; 刘琰 ; 王煦中 关键词:主题 ; 微博 ; 主题概率模型 ; 主题提取 ; 社团发现 机构:信息工程大学 ; 信息工程大学 年份:2017
    摘要:近年来,微博凭借着自身的特点发展成为社会公共舆论的重要平台,对国家安全和社会发展产生了深远的影响,由此对微博文本主题提取显得格外重要.目前,文本主题挖掘的主流技术是主题概率模型.为此,首先对主题概率模型中LDA模型进行了详细地介绍;其次分析了微博的数据特点,从存在噪音词汇、微博文本短小以及微博的时序性等3个方面综述了主题概率模型在微博主题挖掘方面的研究;近一步又综述了利用主题模型发现基于主题的社团关系的研究;最后总结了未来主题模型在挖掘微博主题方面存在的挑战.
  • 【专利】 一种基于LDA主题模型的法条推荐方法

    作者:葛季栋 ; 李传艺 ; 雷妙妙 ; 李忠金 ; 冯奕 ; 周筱羽 ; 骆斌 年份:2018
    摘要:本发明是一种基于LDA主题模型的法条推荐方法,包括以下步骤:提取裁判文书集构建训练语料;将裁判文书进行预处理,包括抽取出案件基本情况段落和引用法条列表,将案件基本情况进行中文分词,去除法律专有停用词以及法条名称标准化;对案件情况进行预处理;训练LDA主题模型提取与案件情况相似的裁判文书集;提取推荐法条集,设计法条关联度打分机制计算法条与案件的关联度,并结合频繁项集挖掘关联法条;输出推荐法条列表。本发明模拟法官在实际审判过程中,经常查阅相似裁判文书来决定法条引用的真实场景,从语义层面度量了裁判文书的相似度,能准确获得相似的裁判文书并进行关联法条推荐,提高了法条推荐的准确性。
  • 【专利】 一种基于主题模型的半监督哈希算法

    作者:姜志国 ; 张浩鹏 ; 麻义兵 ; 谢凤英 年份:2018
    摘要:本发明公开了一种基于主题模型的半监督哈希算法,使用主题模型将单词特征转化为主题特征,然后对主题特征进行半监督训练,实现了半监督条件下准确、稳定并能涵盖所有数据,增强了模型对数据的泛化能力,使模型对数据分布有更准确的描述,从而获得更准确的哈希码;通过替换核化监督哈希的核方法,减少随机因素,使得模型更加稳定。
  • 【专利】 一种模板化网页主题信息的提取方法

    作者:董雄飞 年份:2016
    摘要:本发明公开了一种模板化网页主题信息的提取方法,方法的主要特点为:1)直接对主题信息进行提取,而不需要通过去除网页噪音的方式来提取主题信息;2)对同模板产生的大量网页,通过机器学习生成模板后,便可直接提取网页主题信息,而不需要对每一个网页都进行分析处理,且该方法能够准确、快速地提取模板网页集的主题信息。此方法可以应用于大型搜索引擎,且可以大大地减少索引量,提高搜索引擎的检索速度和精确度。
  • 【期刊】 PubMed与Embase的主题标引及主题检索功能比较研究

    刊名:中华医学图书情报杂志 作者:王岩 ; 张静仪 ; 何晓阳 关键词:PubMed ; Embase ; MeSH ; Emtree ; 主题标引 ; 主题检索 机构:陆军军医大学图书馆 ; 陆军军医大学图书馆 ; 西南大学计算机与信息科学学院 年份:2018
    摘要:目的:比较分析PubMed与Embase的主题标引及检索功能。方法:从词表的发展历程、结构体系、主题标引、主题检索4个方面对Pubmed和Embase进行比较分析。结果:MeSH的历史悠久,成熟稳定,应用更广。MeSH和Emtree的结构类似,Emtree的体量更大; PubMed的主题标引在规范性方面更为出色。结论:PubMed和Embase二者各有特色,PubMed更方便易用,Embase更注重可视化操作以及检索结果处理的多样性。
  • 【专利】 一种模板化网页主题信息的提取方法

    作者:董雄飞 年份:2016
    摘要:本发明公开了一种模板化网页主题信息的提取方法,方法的主要特点为:1)直接对主题信息进行提取,而不需要通过去除网页噪音的方式来提取主题信息;2)对同模板产生的大量网页,通过机器学习生成模板后,便可直接提取网页主题信息,而不需要对每一个网页都进行分析处理,且该方法能够准确、快速地提取模板网页集的主题信息。此方法可以应用于大型搜索引擎,且可以大大地减少索引量,提高搜索引擎的检索速度和精确度。
  • 【专利】 一种基于主题模型的相似文章推荐方法

    作者:郑子彬 ; 黄炼楷 年份:2017
    摘要:本发明涉及一种基于主题模型的相似文章推荐方法,首先通过文章原始文本预处理,提取单纯的文章内容;然后对文章内容进行分词、词性分析,筛选出名词词性的词语,词袋抽取,形成文章主要的词语特征向量;跟着利用所有文章的词语特征向量训练TFIDF模型,基于该TFIDF模型对每篇文章的词语特征向量计算,形成TFIDF特征向量;再之,利用所有文章的TFIDF特征向量训练LSI主题模型;最后使用LSI模型计算得到该文章的潜在主题特征向量,由向量相似度计算可以得到相似文章。本发明能帮助互联网用户高效挖掘感兴趣文章,具有适用范围较大、人工标记成本较低、推荐多样性较好等优点。
上一页 1 2 3 4 5 6 7 8 9 10 下一页 跳转