·
搜索结果:找到“话题”相关结果38120条
排序: 按相关 按相关 按时间降序
  • 【专利】 一种基于Single-pass去除小话题影响的话题发现方法

    作者:陈星 ; 郭文忠 ; 林晓红 年份:2015
    摘要:本发明涉及一种基于Single-pass去除小话题影响的话题发现方法,包括如下步骤:将待处理文档集进行两遍Single-pass聚类,分别获取经第一遍Single-pass聚类的第一聚类结果以及经第二遍Single-pass聚类的第二聚类结果;将所述两遍聚类后的聚类结果进行整合,并分别对应获取候选话题;将所述候选话题对应与已有正式话题进行合并。本发明所提出的一种基于Single-pass去除小话题影响的话题发现方法,有效地减弱阈值依赖的影响以及话题类中心也不断偏移的问题。
  • 【专利】 基于上下文相关性的对话话题分割方法和系统

    摘要:本发明公开了一种基于上下文信息的对话话题分割方法和系统,所述方法包括:采集多轮对话数据,对其进行随机抽样获取训练数据集;对所述训练数据集进行向量化处理,得到所述训练数据集相应的语料向量空间;对所述语料向量空间整理为句子序列;计算相邻句子之间的相关性;根据相邻句子之间的相关性识别多轮对话数据的话题边界,形成话题分割模型,实现多轮对话数据的话题分割。本发明的话题分割方法具有测试准确度高、可靠性强且稳定的有益效果。
  • 【专利】 基于频繁词集的并行化话题跟踪方法

    作者:孙健 ; 许强 ; 陆川 ; 张明 年份:2018
    摘要:本发明公开了一种基于频繁词集的并行化话题跟踪方法,包括将报道流中一定数量或一段时间内的多个文本通过文本聚类算法计算得到多个话题文本集;通过并行化计算对话题文本集进行频繁词集挖掘;通过词向量模型并行的将频繁词集转换为频繁词向量集,计算报道流的频繁词向量集和先验报道的频繁词向量集之间的相似度;将相似度与设定的话题跟踪阈值进行对比,决定话题归属,完成话题跟踪。本发明利用词集来表示话题文本集,减少了相似度计算开销;提出基于Word2vec词向量模型的相似度计算方法来计算词集间的相似度,可以提高词集间相似度比较的准确性;采用并行化的计算方式进行频繁词集挖掘和词向量转换处理,利用了并行计算的优点,提高话题跟踪的效率。
  • 【期刊】 基于话题集合的中文微博对比话题摘要生成

    刊名:计算机应用与软件 作者:张旭 关键词:微博 ; 话题集合 ; 对比话题摘要 机构:兰州理工大学计算机与通信学院 ; 兰州理工大学计算机与通信学院 年份:2017
    摘要:微博作为一种流行的信息交流平台,已经受到人们的广泛关注.如今有关微博搜索结果处理的研究也已经成为热点,其中微博对比话题摘要是一个比较新颖的微博搜索结果处理方法.不同于基于微博消息的对比话题摘要生成算法,基于话题集合的中文微博对比话题摘要生成算法是将话题集合进行对比并生成微博对比话题摘要.实验数据表明,以话题集合为单位生成对比话题摘要可以改善单条微博消息信息量不足的缺点,提高对比话题摘要的代表性.
  • 【专利】 一种基于社区文本数据的话题发现系统

    作者:熊桂喜 ; 朱宁 ; 何滔 ; 邹哲讷 ; 赵再让 年份:2017
    摘要:本发明公开了一种基于社区文本数据的话题发现系统,包括移动终端服务系统和服务器端系统;移动终端服务系统包括社区文本数据上传模块,负责社区文本数据的采集、提取和上传,接收采集的社区文本数据,并提取社区文本数据的类型,并将社区文本数据及类型送上传至服务器端系统的数据预处理模块;社区文本数据的类型包括TXT格式、HTML格式、XML格式;服务器端系统包括数据预处理模块、向量提取模块、热点话题提取模块、数据可视模块和数据存储与管理模块;本发明使社区居民,社区服务人员以及城管参与到社区管理中,加快工作效率,实现社区的智慧化管理提供高效的服务。
  • 【专利】 一种微博话题舆情计算与分析的方法

    作者:王振飞 ; 刘凯莉 ; 张利莹 ; 郑志蕴 ; 李钝 年份:2016
    摘要:本发明公开了一种微博舆情计算与分析的方法。方法包括以下步骤:S1利用爬虫软件抓取微博数据,将抓取到的数据进行预处理;S2建立情感计算所需要的文本情感词库和表情符号情感词库。S3依据微博的点赞数、评论数、转发数计算微博话题的扩散度。将计算出的扩散度作为计算微博话题舆情的一个因素。S4计算微博话题情感倾向。对于不包含表情符号的微博内容,直接以建立的文本情感词库为情感词典,利用朴素贝叶斯完成;对于包含表情符号的微博,分别计算文本情感倾向和表情符号的情感倾向,最后综合两部分的情感倾向实现情感倾向计算。S5微博舆情分析。融合微博话题扩散度和话题情感倾向实现对微博舆情的分析。该方法使计算出的微博话题的舆情更加准确。
  • 【专利】 基于三部图模型的微博热点话题溯源方法

    作者:肖寒春 ; 于海洋 ; 李艳军 ; 陈迪强 年份:2018
    摘要:本发明涉及社交网络热点话题分析领域,特别涉及一种基于三部图模型的微博热点话题溯源方法,包括:利用网络爬虫或者各种社交软件提供的应用程序编程接口API对数据进行获取;对单条微博消息进行传播路径模型还原;以单条微博消息的传播路径还原为基础,建立“消息‑路径‑用户”话题三部图;对根据话题三部图计算得到的消息、路径和用户得分序列排序,将排名靠前的N个作为热点话题源点序列;本发明在针对节点自身属性与话题无关性和语义技术的局限性对溯源分析的影响,在三部图中引入HITS排名思想,考虑到消息与用户相互影响关系的同时,改进排序算法,提高算法的准确度。
  • 【期刊】 找准话题支点 彰显生本对话精彩

    刊名:广西教育 作者:陈燕 关键词:话题 ; 生本对话 ; 覆盖性 ; 启发性 ; 填补性 机构:玉林市福绵区樟木镇塘基小学 ; 玉林市福绵区樟木镇塘基小学 年份:2017
    摘要:阅读的过程,其实也是生本对话的过程。当前语文课堂教学中虽有对话,但是存在各种问题。本文论述彰显生本对话精彩的三种做法:找准“谈话点”,让话题覆盖生本对话;找准“中心点”,让话题启发生本对话;找准“制高点”,让话题填补生本对话。
  • 【期刊】 微博预置话题与突发话题的特征挖掘研究

    刊名:情报探索 作者:何跃 ; 王欣瑞 ; 韩玫 ; 肖敏 关键词:预置话题 ; 突发话题 ; 节点分析 ; 博文量趋势 ; 情感趋势 ; Ward聚类 机构:四川大学商学院 ; 四川大学商学院 年份:2020
    摘要:[目的/意义]借鉴拉斯韦尔5W传播模型;探讨微博中预置话题与突发话题的特征;[方法/过程]基于因子分析的关键节点影响力评价方法来研究话题节点特征;利用Ward方法对话题博文量曲线进行聚类;并对曲线进行多项式拟合;对话题情感度曲线进行聚类;并对不同类型话题的峰度和整体情感加权平均高峰期进行研究;[结果/结论]话题首节点多是信息分享;其中突发话题的传播多是从事件的客观描述开始;话题微博按博文量可分为前热型、中热型、后热型、爆发型和持续型;其中突发话题比预置话题爆发得更早、持续时间更长;话题出现72小时后公众情感趋于中立;但突发话题情感曲线高峰期比预置话题更集中;整体情感加权平均高峰期更早出现;曲线趋势更复杂;
  • 【期刊】 百家媒体聚焦引爆年中最热话题

    刊名:浙商 作者:汪菁璐 关键词:话题 ; 自媒体 ; 引爆 ; 浙江日报 ; 投融资 ; 新华社 ; 电视台 ; 客户端 年份:2019
    摘要:“这几天;我的朋友圈都被这场大会刷屏了;”6月12日-13日;参加第16届浙商(投融资)大会暨20195G+峰会的嘉宾纷纷晒出会场的各个精彩瞬间;与此同时;本次大会还引起了新华社、浙江日报等国内百家媒体的关注;报纸、电视台、网站、客户端、微博、自媒体都对本次大会做了详尽的报道;
  • 【论文】 蒙古国留学生话题兴趣与教材话题匹配调查研究

    作者:谭晓敏 关键词:蒙古国留学生 ; 话题兴趣 ; 教材话题 ; 匹配 机构:内蒙古师范大学 ; 内蒙古师范大学 年份:2016
    摘要:本文通过查阅并参考了关于留学生话题兴趣与教材话题匹配的相关文献,对180名在内蒙古大学、内蒙古师范大学、内蒙古工业大学学习汉语的蒙古国留学生进行话题兴趣问卷调查;从三所高校的蒙古国留学生使用的三部综合课汉语教材:《汉语教程》(修)、《发展汉语》(初)(第二版)、《成功之路》(初)课文题目概括出话题类别;运用有关教材话题话题兴趣、二语习得理论、对外汉语教学理论来分析蒙古国留学生的话题兴趣与教材话题相匹配情况。针对分析的结果及对教师的访谈,对对外汉语教材编写和对外汉语课堂教学提出建议。问卷的设置以《国际汉语教学课程通用大纲》中的话题分类为依据,并结合三套教材涉及的话题。问卷中共有八大话题群,话题群下设有五十项子话题。基于问卷调查使用定量分析法。留学生方面:对留学生话题兴趣度的高低进行排序,分析了话题群兴趣度在不同学习者中的差异性;教材方面:将三部综合课汉语教材话题做了分类,统计了教材中话题群及子话题所占比例,最后结合蒙古国留学生在学习汉语过程中的感兴趣话题,得出教材话题与留学生话题兴趣的匹配情况。本文由引言、正文和结论三个部分组成。引言主要阐述了相关文献综述、选题缘由、研究主要目的、意义、方法。正文分为三部分。第一部分:调查研究的设计与方法。第二部分:蒙古国留学生话题兴趣分析。第三部分:蒙古国留学生话题兴趣与三套综合课汉语教材话题匹配分析。结语是从学习者、教材、教师三方面做了总结。希望能对国别化教材编写这一领域提供有意义的参考。通过调查研究,结论如下:1.学习者的话题兴趣度从高到低依次是:“娱乐休闲”>“社会交往”>“日常生活”>“社会问题”>“中国传统文化”>“学习与工作”>“感情生活”>“旅游与交通”2.三部教材话题总体分布特征是:“日常生活”和“社会交往”话题数目最多;其次是“学习与工作”;“感情生活”与“娱乐休闲”的话题数目相仿;其余三类话题兴趣度较低。3.从话题匹配的角度考察:北京语言大学于2008-2009年出版社的《成功之路》最为匹配,其次是北京语言大学于2006年出版社的《发展汉语》(初),再次也是由北京语言大学于2006年出版社的《汉语教程》(修)。
  • 【专利】 一种利用局部嵌入话题建模的文本表示方法

    作者:罗森林 ; 刘望桐 ; 潘丽敏 ; 毛炎颖 ; 魏超 年份:2017
    摘要:本发明涉及一种利用局部嵌入话题建模的文本表示方法,属于计算机科学与信息检索技术领域。在该方法中,根据文本在词空间的欧氏距离选取近邻集,构造局部加权正则项,把正则项加入传统的自编码网络进行训练获得模型,进而构造一个显示映射函数,并最终利用编码网络抽取样本外文档的向量表示。本发明引入局部加权正则项,有效地保持文本所在空间的内部固有几何结构。此外,本发明生成了一个观测空间和低维流形之间的显式嵌入映射,提供了一种从样本外文本提取嵌入向量表示的简便方法。
上一页 1 2 3 4 5 6 7 8 9 10 下一页 跳转