·
搜索结果:找到“贡正仙”相关结果32条
排序: 按相关 按相关 按时间降序
  • 【期刊】 基于多类型文本的半监督性别分类方法研究

    刊名:山西大学学报(自然科学版) 作者:贡正仙 ; 戴斌 ; 李寿山 ; 周国栋 关键词:性别分类 ; 半监督学习方法 ; 文本分类 机构:苏州大学自然语言处理实验室 ; 苏州大学自然语言处理实验室 年份:2017
    摘要:提出一种基于多种文本类型的半监督性别分类方法,即根据微博平台中用户所产生的不同类型的文本(如:原创微博、转发微博等)对用户的进行性别分类.文中的方法是一种基于协同训练(Co-training)的半监督学习方法,旨在减少分类器对大量标注样本的依赖.首先将不同类型的文本分为不同的独立视图;其次,在每个视图中利用LSTM分类器挑选置信度最高的未标注样本;最后,将挑选出来的未标注样本加入训练模型迭代训练.实验结果表明我们的方法能够有效利用非标注样本信息,并明显优于其他现有的半监督性别分类方法.
  • 【期刊】 基于中英文可比较语料的中文零指代消解

    刊名:北京大学学报(自然科学版) 作者:贡正仙 ; 杨紫怡 ; 孔芳 ; 周国栋 关键词:中文零指代 ; 双语 ; 对等句 ; 识别 ; 消解 机构:苏州大学计算机科学与技术学院 ; 苏州大学计算机科学与技术学院 ; 自然语言处理实验室 年份:2017
    摘要:针对中文篇章中的零指代问题,提出一种基于中英文可比较语料进行中文零指代识别和消解的方法,并提出英文对等句的概念.利用对等句,重新定义句子间隔,并引入双语词对齐特征.在基准平台基础上,从零指代项识别和零指代项消解两个方面进行研究.在OntoNotes5.0语料上的实验结果表明,与目前性能最好的系统相比,新提出的基于中英对等语料的中文零指代方法取得更好的性能.
  • 【期刊】 基于加权词汇衔接的文档级机器翻译自动评价

    刊名:北京大学学报(自然科学版) 作者:贡正仙 ; 李良友 关键词:词汇衔接 ; 文档级评价 ; 机器翻译 ; 自动评价 ; PageRank 机构:苏州大学计算机科学与技术学院 ; 苏州大学计算机科学与技术学院 年份:2014
    摘要:在文档词汇衔接评价LC方法的基础上,提出基于权重的LC,即WLC,该方法通过在文档词图上运行PageRank算法获得词汇权重。根据词性信息使得PageRank算法偏向特定的词汇,并提出PWLC方法。实验表明,在文档级别上,所提出的两种方法与人工评价的相关度都优于LC;融合两种方法后,BLEU和TER在文档级别上的评价性能有显著提高。
  • 【专利】 一种基于历史反馈的服务网格调度方法

    作者:贡正仙 ; 朱巧明 ; 李培峰 ; 许兰 ; 刘钊 ; 李蓥 年份:2007
    摘要:本发明公开了一种基于历史反馈的服务网格调度方法,其特征在于包括如 下步骤:(1)对于每一个需要调度的服务,调度器计算其在布置了该服务的各个 节点上运行的可靠性Re;(2)调度器计算在布置了该服务的各个节点上的预计 运行时间;(3)调度器对各个节点的性能进行实时评测;(4)据此计算每个资源节 点X的评估值,选择评估值最大的节点调度运行所需服务。本发明利用服务 的历史执行信息自适应调整预测模型并进行服务的反馈选择,将服务请求提交 到性能较优和网络负载较少的节点上,从而提高了网格的效率,且具有良好的 自适应性。
  • 【期刊】 一种基于历史信息的自适应动态网格作业调度方法

    刊名:计算机应用与软件 作者:贡正仙 ; 许兰 ; 朱巧明 ; 李培峰 关键词:网格计算 ; 作业调度 ; 历史信息 ; 自适应 机构:苏州大学计算机科学与技术学院 ; 苏州大学计算机科学与技术学院 ; 江苏省计算机信息处理技术重点实验室 年份:2008
    摘要:目前,国内外围绕着网格中的作业调度算法已做了大量研究,先后提出了很多调度算法。但是,这些算法并不能很好地适应网格的动态性、自治性和分布性等特征。对此,提出了一种动态的网格作业调度方法—基于历史信息的自适应动态网格作业调度方法ASHI。该方法利用每个资源上最近作业的执行信息自适应调整预测模型,然后再根据网格的动态性和实时性等因素,对资源进行反馈选择后将作业提交负载较轻的资源上执行。实验证明,ASHI不但能及时有效地对作业进行调度,而且还可有效提高整个网格的吞吐量和均衡系统的负载。
  • 【期刊】 一种基于历史信息反馈的动态服务资源选择模型

    刊名:计算机应用 作者:贡正仙 ; 许兰 ; 朱巧明 ; 李培峰 关键词:自适应 ; 动态资源选择 ; 不定因素 ; 历史信息反馈 ; 资源可靠性 机构:苏州大学计算机科学与技术学院 ; 苏州大学计算机科学与技术学院 ; 苏州大学计算机科学与技术学院 ; 苏州大学计算机科学与技术学院 ; 苏州大学计算机科学与技术学院 ; 江苏苏州215006江苏省计算机信息处理技术重点实验室 ; 江苏苏州215006江苏省计算机信息处理技术重点实验室 ; 江苏苏州215006江苏省计算机信息处理技术重点实验室 ; 江苏苏州215006江苏省计算机信息处理技术重点实验室 年份:2007
    摘要:针对真实服务网格环境中资源的不确定性,如CPU、网络的负载、安全性和动态性,提出了一种动态选择网格资源的技术——基于历史反馈的动态资源选择模型。该模型利用服务的历史执行信息自适应调整预测模型,并在考虑了网格环境中资源的实时性、安全性和不确定性的基础上,进行资源的反馈选择,最后将服务请求提交到整体性能较优的节点上。
  • 【论文】 基于网格的Web信息抽取技术的研究与实现

    作者:贡正仙 关键词:Web信息抽取 ; 相似页面 ; 噪声处理 ; 网格应用 ; GT4 机构:苏州大学 ; 苏州大学 年份:2006
    摘要:Web文档往往用各种复杂的HTML标记来包装内部数据,但这种方式给应用系统直接使用Web文档中的数据带来了困难。Web信息抽取是处理海量数据且需要各种复杂算法支持的一种技术,因此它在一般平台上的工作效率不是很好。网格能为复杂应用提供分布式并行环境,它面向服务的开放式结构能提高应用的灵活性和代码重用率。因此,结合网格技术来开发一个自动的Web信息抽取应用有着非常重要的意义。 本文首先介绍了Web信息抽取的有关技术,分析了自动抽取系统RoadRunner的算法和优缺点;接着,介绍了网格的相关知识,重点研究网格应用的特性。在这之后,本文重点解决两个问题:如何自动抽取Web信息和如何在网格中实现。在第一阶段,本文通过有效的启发规则解决自动获取一批相似页面的问题,提出并实现了二级页面噪声处理的方案和算法,完成了自动归纳抽取规则的算法,并最终实现了一个完整的面向数据密集型页面的Web信息抽取系统。在第二阶段,本文首先分析了Web抽取应用的可并行化部分,给出了相应的网格应用模型和编程模式,安装和配置了网格平台,开发和部署了一组相应的服务,并最终结合Java多线程技术解决了抽取应用的并行化问题。 本课题主要有两方面的意义:从Web信息抽取方面来看,能提高抽取系统的自动化程度和数据抽取精度;从网格应用方面来看,通过Java线程和网格服务相结合的方式能有效改善传统应用的运行效率,并为网格应用开发提供了一种新的实现思路。
  • 【期刊】 一种快速的网格任务调度算法的设计

    刊名:计算机应用与软件 作者:贡正仙 ; 许兰 ; 朱巧明 ; 陈静 关键词:网格 ; 信息处理 ; 基于历史信息 ; 任务调度 机构:苏州大学计算机科学与技术学院 ; 苏州大学计算机科学与技术学院 ; 苏州大学计算机科学与技术学院 ; 苏州大学计算机科学与技术学院 ; 苏州大学计算机科学与技术学院 年份:2008
    摘要:网格任务的执行环境具有动态性、分布性等特征,为了能顺利完成任务并使其具有较好的执行效率,需要一种有效的策略来进行任务的调度。结合信息处理的特点,提出一种快速有效的网格任务调度算法。该算法采用历史信息预测任务的执行时间,根据任务的截止时间要求对子任务进行合理分组。最后,给出了该算法在网格模拟器上的测试结果,并与一些算法进行了比较。结果表明,本算法对大作业以及截止期限紧急的作业具有较好的调度效果。
  • 【期刊】 基于短语的统计机器翻译中短语表的过滤

    刊名:计算机应用与软件 作者:贡正仙 ; 狄萍 ; 周宥良 ; 周国栋 关键词:统计机器翻译 ; 短语表过滤 ; C-value ; 短语粘结度 机构:苏州大学计算机科学与技术学院 ; 苏州大学计算机科学与技术学院 年份:2011
    摘要:大多数基于短语的统计机器翻译系统将任意连续的词串看作短语,并没有考虑短语的合理性。使用了C-value以及短语粘结度两种方法,有效地对短语表进行过滤,减小了搜索空间,同时还提高了翻译质量。实验表明,在翻译结果的BLEU评价提高0.02的情况下,短语表可以缩减为原来的78%。并且当短语表缩减为原来的47.5%时,BLEU评价仍提高了0.0158。
  • 【期刊】 一种优化服务组合执行的设计方案

    刊名:微电子学与计算机 作者:贡正仙 ; 许兰 ; 朱巧明 ; 朱剑非 关键词:服务网格 ; 服务执行 ; 优化性能 ; 服务组合 机构:苏州大学计算机科学与技术学院 ; 苏州大学计算机科学与技术学院 ; 苏州大学计算机科学与技术学院 ; 苏州大学计算机科学与技术学院 ; 苏州大学计算机科学与技术学院 年份:2007
    摘要:分析了目前大多数服务网格平台上的服务,提出了范围型服务(RangeService,RaS)的概念;并根据RaS输入参数的信息和并行处理思想,提出了网格环境下参数优化的设计方案。该方案可有效地利用服务的历史执行数据,优化当前服务的执行。从而在服务组合执行前,就可大大降低服务的执行规模,有利于缩短服务组合的执行时间,提高服务组合执行的成功率。
  • 【期刊】 基于多通道LSTM的不平衡情绪分类方法

    刊名:中文信息学报 作者:贡正仙 ; 殷昊 ; 李寿山 ; 周国栋 关键词:情绪分类 ; 不平衡分类 ; LSTM 机构:苏州大学计算机科学与技术学院 ; 苏州大学计算机科学与技术学院 年份:2018
    摘要:情绪分类是自然语言处理问题中的重要研究问题之一。情绪分类旨在对文本包含的情绪进行自动分类,该任务是情感分析的一项基本任务。然而,已有的研究都假设各情绪类别的样本数量平衡,这与实际情况并不相符合。该文的研究主要面向不平衡数据的情绪分类任务。具体而言,该文提出了一种基于多通道LSTM神经网络的方法来解决不平衡情绪分类问题。首先,该方法使用欠采样方法获取多组平衡训练语料;其次,使用每一组训练语料学习一个LSTM模型;最后,通过融合多个LSTM模型,获得最终分类结果。实验结果表明该方法明显优于传统的不平衡分类方法。
  • 【期刊】 基于网格的Web信息抽取系统的设计与实现

    刊名:计算机应用与软件 作者:贡正仙 ; 支丽艳 ; 朱巧明 ; 李培峰 关键词:Web信息抽取 ; 网格 ; Globus ; 调度 机构:苏州大学计算机科学与技术学院 ; 苏州大学计算机科学与技术学院 ; 江苏省计算机信息处理技术重点实验室 年份:2007
    摘要:Web信息抽取已经成为下一代Web应用的一个研究热点。在分析了当前Web信息抽取技术面临问题的基础上,结合网格技术的发展,提出了一个基于网格的Web信息抽取系统(GWIES),并给出了GWIES的设计方案,描述了系统实现的关键技术。
上一页 1 2 3 下一页 跳转