·
搜索结果:找到“中文”相关结果1072000条
排序: 按相关 按相关 按时间降序
  • 【专利】 一种基于Word2Vec的中文语句相似度计算方法

    作者:姜涛 ; 王庆 ; 宫俊 年份:2018
    摘要:本发明公开了一种基于Word2Vec的中文语句相似度计算方法。该方法基于大型语料库训练得到词向量模型,并且通过LTP句法分析器将句子表示成句法成分树结构。该计算方法包括:接受用户输入的问题Q;对用户输入的问题Q进行分词,词性分析以及句法分析;将用户输入的问题Q与问题模板中的每个问题A进行匹配计算,获得问题Q与问题A之间的相似度调节系数score1和语义相似度得分score2;根据相似度调节系数score1和语义相似度score2计算获得问题Q与问题A之间的语句相似度score。本发明通过将句子的结构信息添加到语句相似度计算中,以及通过计算词汇之间的句法关系有效提高了相似度计算的准确率。
  • 【期刊】 基于JSP技术项目开发中中文乱码问题研究

    刊名:电脑编程技巧与维护 作者:王卫 ; 李天琦 ; 汤伟 ; 王海涛 ; 施秀萍 ; 杨铖 关键词:字符编码 ; JSP技术 ; 中文乱码 ; Servlet技术 ; 中文参数 机构:国网北京市电力公司 ; 国网北京市电力公司 ; 中电普瑞电力工程有限公司 ; 国网安徽省电力有限公司 ; 国网黑龙江省电力有限公司 年份:2018
    摘要:JSP/Servlet技术被广泛应用在Java Web实际开发中。由于Java是跨平台语言,平台之间的切换比较频繁,以及编码和解码方式不一致,容易出现使程序员头疼的中文乱码问题。以实际的JSP项目开发经验为基础,着重介绍在JDK+Tomcat+My SQL开发环境和Eclipse开发工具下,JSP项目开发中可能产生中文乱码问题的几种情况,并且针对每种情况提出了解决方案,以供程序员参考使用。
  • 【专利】 一种可分类放置高中文科生用学习工具袋

    作者:吕可山 年份:2017
    摘要:本实用新型公开了一种可分类放置高中文科生用学习工具袋,包括工具袋和书写工具存放仓,所述工具袋内部间隔式设置有第一储存仓和第二储存仓,所述第一储存仓的侧板边缘处设置有磁铁块,且两磁铁块之间设置有限位块,所述第一储存仓和第二储存仓的顶部一侧拐角处均焊接有标签放置片,所述第一储存仓和第二储存仓的一侧焊接有连接软布,所述工具袋的侧板上设置有线绳固定头和书写工具存放仓。本实用新型中,在工具袋中设置有第一储存仓和第二储存仓,且第二储存的一侧未连接限位布,使得第二储存仓放置物品时,可以进行两面放置,方便用户对于物品进行储存,特别是对于试卷,可以更加平整的保存其中。
  • 【专利】 一种中文分词网店商品搜索系统的设计

    作者:不公告发明人 年份:2016
    摘要:本系统是一个对网店商品的原始数据进行加工处理,集成一个存储所有商品信息的词条字典的系统,本系统通过结合全切分算法,以此实现对输入关键词的完全切分,并通过和词条字典的匹配得到所有候选的词条组合,使中文分词网店商品搜索系统完美化、自动化,减少了用户在搜索过程中不必要的麻烦。
  • 【专利】 一种可分类放置书本的高中文科用单肩包

    作者:吕胜战 年份:2017
    摘要:本实用新型公开了一种可分类放置书本的高中文科用单肩包,包括单肩包体,所述单肩包体包括主袋体、内贴袋A、内贴袋B、内贴袋C和外贴袋,所述内贴袋A设置在主袋体上,所述内贴袋B单肩包体的内侧,并且内贴袋B的顶部安装有内贴袋C。本实用新型通过设置的主袋体、内贴袋A、内贴袋B、内贴袋C和外贴袋,能够存放不同的文科书本,主袋体主要放置文科用书本,而内贴袋A、内贴袋B、内贴袋C和外贴袋则主要放置重要的复习资料,以及学生的个人物品,通过设置的水杯槽,学生在去图书馆复习时,能够装带一杯水,以便复习时饮用,而设置的荧光层不仅具有美观效果,而且在夜晚发光,能够提醒车辆,注意行人。
  • 【专利】 利用电子束辐照降解水中文拉法辛的方法

    作者:彭诚 ; 李东阳 ; 李劲松 ; 张振永 ; 程航 ; 胡冕 ; 王云 年份:2018
    摘要:本发明公开了一种利用电子束辐照处理水体中抗抑郁药文拉法辛,主要是通过电子辐照处理的方法,属核技术应用、水处理及环境保护技术领域。本发明方法利用电子加速器辐照条件下产生高能量电子,对含有文拉法辛的水体进行处理,使其降解。本发明采用电子加速器,电子辐照剂量为0.5~5KGy。所用的文拉法辛的样品预处理溶液中加入浓硫酸调节溶液的pH值达2~7,并向溶液中加入1~5mM的过氧化氢,使辐照降解的效果得到促进,同时可适当降低辐照剂量。本发明能去除水体中的文拉法辛药物污染,反应速率快,降解效率高,相对其它传统方法有着更好适用性,是一种高效节能性的水处理技术。
  • 【专利】 一种基于中文教育视频提取拓展词的方法

    作者:曹妤 ; 林淑金 ; 周凡 年份:2017
    摘要:本发明公开了一种基于中文教育视频提取拓展词的方法,其中,所述方法包括:获取中文教育视频,生成视频内容文本,将其备份标记为文本集1和文本集2;将文本集1去停用词、词性标注,保留名词;并提取关键词和关键短语,获得关键词集1;根据关键词集1中的关键词对文本集1中的文本信息进行分类;根据不同类别信息,爬取相关类别的文章,将该类别的典型文章构建类别语料库;将文本集2进行分词,根据类别语料库提取关键词,获得关键词集2;将其和关键词集1取并集,对其重叠关键词按照视频内容文本长短重新分配权重;根据权重倒序排序,获得对应数量和难度的拓展词。实现本发明实施例,能全面准确的提取出视频中需要进行知识拓展的词条来帮助观看者在理解和学习。
  • 【期刊】 探究高中语文教材中文化素材有效运用策略

    刊名:《亚太教育》 作者:肖永福 关键词:高中语文 ; 教材 ; 文化素材 ; 运用 机构:四川省中江实验中学 ; 四川省中江实验中学 年份:2016
    摘要:语文教材,其本身蕴含着丰富的文化元素,特别是高中语文教材,通过对文化素材的利用能极大的提高语文课堂教学效率,能有效地促进高中语文教学质量的提高,能更有效地提升学生的语文素养。在新环境下,随着课程改革的深入,高中语文教材也发生了一定的改变,在这种情况下,为了有效提升学生的语文素养和人文素养,就需要充分挖掘利用语文教材中的文化素材。
  • 【专利】 一种基于MPI的ML‑KNN多标签中文文本分类方法

    作者:王进 ; 晏世凯 ; 邵帅 ; 李颖 ; 欧阳卫华 ; 胡峰 ; 李智星 ; 邓欣 ; 陈乔松 ; 雷大江 年份:2017
    摘要:本发明请求保护一种基于MPI的ML‑KNN多标签中文文本分类方法,涉及文本分类和机器学习中的多标签分类算法。为解决ML‑KNN算法在具体实现中大规模文本分类问题和求解优化问题,控制计算的时间和空间的开销,本发明采用的技术方案是,采用MPI编程实现中文文本数据的预处理、特征提取、ML‑KNN算法及分类的并行化。相比传统的串行多标签中文文本分类方法,本发明极大的提高了多标签中文文本分类的效率。同时,在数据量一定的情况下,算法的效率一般会随着计算资源(进程数)的增加而增加。值得一提的是,在基于MPI并行化ML‑KNN步骤中,对数据集进行划分时既可以以样本为单位划分,又可以以特征为单位划分,这使得本发明在处理高维文本数据的时候,具有更大的优势。
  • 【专利】 一种用于期刊PDF文件中文章内容的解析方法

    作者:胡利鹏 年份:2018
    摘要:本发明属于内容解析方法,具体涉及一种用于期刊PDF文件中文章内容的解析方法。它包括:解析参数预设值的步骤;读取PDF文字内容的步骤;整理并接合的步骤;以及形成文章列表的步骤。本申请的显著效果是:本发明提供了一种用于期刊PDF文件中文章内容的解析方法,抽取文章内容片段:标题、作者、单位信息、摘要、关键词、中图分类号、文献标志码、文章编号、正文、参考文献。解析发现分栏、分隔的内容片段、顺序转接的接合文章内容。对关键词临近的个别标点乱码具有容错处理,对大部分常规格式期刊中文献文章片段具有识别处理。
  • 【专利】 一种基于主动学习的中文正式文本分词方法

    作者:王亚强 ; 何梦秋 ; 何思佑 ; 唐聃 ; 舒红平 年份:2018
    摘要:本申请提供一种基于主动学习的中文正式文本分词方法,包括:使用当前的标注数据集L训练一个朴素贝叶斯分类器;使用当前的朴素贝叶斯分类器标注未标注数据集U;使用抽样方法选择最有信息量的片段给专家标注;将新抽样的标注好的片段添加到标注数据集L中;不断迭代直到预先设定的满足条件停止。本申请的方法能够有效减少人工标注数据的同时得到一个性能较好的分词器。采用主动学习的方法抽取数据训练得到的模型比随机抽取的方法抽取数据训练得到的模型性能(采用F值度量)提升5个百分点左右。主动学习结合EM迭代后抽取数据训练得到的模型比单独采用主动学习方法抽取数据训练得到的模型,每次性能均提升1.5个百分点左右。
  • 【专利】 一种中文通告文档问题答案对自动生成方法

    作者:李州 ; 叶茂 ; 苏杨 ; 徐培 年份:2018
    摘要:本发明提供了一种中文通告文档问题答案对自动生成方法,属于数据处理领域。本发明通过由中文通告文档生成出相应的问题答案对,问答系统就可以对用户提出的问题返回相应的答案,采用自然语言处理与深度学习相结合的算法,保证了生成出来的问题答案的通顺性和与原通告文档的相关性,具有良好的扩展性和鲁棒性,在技术上具有超前性。
上一页 1 2 3 4 5 6 7 8 9 10 下一页 跳转