搜索结果:找到“蒋艳凰”相关结果33条
排序: 按相关 按相关 按时间降序
  • 【期刊】 类别严重不均衡应用的在线数据流学习算法

    刊名:计算机科学 作者:蒋艳凰 ; 赵强利 关键词:在线学习 ; 数据流挖掘 ; 回忆与遗忘机制 ; 不均衡数据学习 机构:湖南商学院计算机与信息工程学院 ; 湖南商学院计算机与信息工程学院 ; 国防科技大学高性能计算国家重点实验室 ; 国防科技大学高性能计算国家重点实验室 年份:2017
    摘要:集成式数据流挖掘是对存在概念漂移的数据流进行学习的重要方法.对于类别分布严重不均衡的应用,集成式数据流挖掘中数据块的学习方式导致样本数多的类别的分类精度高,样本数少的类别的分类精度低的问题,现有算法无法满足此类应用的需求.针对上述问题,对基于回忆机制的集成式数据流学习算法MAE(Memorizing based Adaptive Ensemble)进行改进,提出面向类别严重不均衡应用的在线数据流学习算法UMAE(Unbalanced data Learning based on MAE).UMAE算法为每个类别设置了一个样本滑动窗口,对于新到达的数据块,其样本依据自身的类别分别进入相应的滑动窗口,最后利用各类别滑动窗口内的样本构建用于在线学习的数据块.与5种典型的数据流挖掘算法的比较结果表明,UMAE算法在满足实时性的同时,不仅整体分类精度高,而且对于样本数很少的小类别的分类精度有大幅度提高;对于异常检测等类别分布严重不均衡的应用,UMAE算法的实用性明显优于其他算法.
  • 【期刊】 具有回忆和遗忘机制的数据流挖掘模型与算法

    刊名:软件学报 作者:蒋艳凰 ; 赵强利 ; 卢宇彤 关键词:数据流挖掘 ; 概念漂移 ; 回忆与遗忘 ; Ebbinghaus遗忘曲线 ; 选择性集成 机构:湖南商学院计算机与信息工程学院 ; 湖南商学院计算机与信息工程学院 ; 国防科学技术大学 年份:2015
    摘要:集成式数据流挖掘是对存在概念漂移的数据流进行学习的重要方法.针对传统集成式数据流挖掘存在的缺陷,将人类的回忆和遗忘机制引入到数据流挖掘中,提出基于记忆的数据流挖掘模型MDSM(memorizing based data stream mining).该模型将基分类器看作是系统获得的知识,通过"回忆与遗忘"机制,不仅使历史上有用的基分类器因记忆强度高而保存在"记忆库"中,提高预测的稳定性,而且从"记忆库"中选取当前分类效果好的基分类器参与集成预测,以提高对概念变化的适应能力.基于MDSM模型,提出了一种集成式数据流挖掘算法MAE(memorizing based adaptive ensemble),该算法利用Ebbinghaus遗忘曲线对系统的遗忘机制进行设计,并利用选择性集成来模拟人类的"回忆"机制.与4种典型的数据流挖掘算法进行比较,结果表明:MAE算法分类精度高,对概念漂移的整体适应能力强,尤其对重复出现的概念漂移以及实际应用中存在的复杂概念漂移具有很好的适应能力.不仅能够快速适应新的概念变化,并且能够有效抵御随机的概念波动对系统性能的影响.
  • 【专利】 一种基于对象存储系统的功耗控制方法

    作者:蒋艳凰 ; 董勇 ; 陈娟 ; 卢宇彤 ; 周恩强 ; 谢旻 ; 曹宏嘉 ; 陈海涛 年份:2010
    摘要:本发明公开了一种基于对象存储系统的功耗控制方法,目的是解决目前功耗控制方法不能根据应用特点进行有效的功耗控制或缺乏对复杂服务请求情况处理的问题。技术方案是固定时间间隔统计服务器利用率,根据每个对象存储服务器的实际利用率调整它的功耗级别;固定时间间隔查看每个对象存储服务器的服务队列长度,根据队列长度及当前功耗级别调整相应服务器的功耗级别;由元数据服务器判断是否出现特定服务请求来实施功耗控制。采用本发明可根据对象存储服务器的实际利用率和服务队列情况对每个对象存储服务器调整功耗级别,满足对象存储服务器对功耗控制的需求,并利用元数据服务器对服务请求的处理,对特定服务请求,提高功耗控制效率。
  • 【专利】 多网络环境下基于强化学习的MPI消息调度方法

    作者:蒋艳凰 ; 卢宇彤 ; 赵强利 ; 谢旻 ; 周恩强 ; 曹宏嘉 ; 陈海涛 ; 董勇 ; 所光 年份:2010
    摘要:本发明公开了一种多网络环境下基于强化学习的MPI消息调度方法,目的是解决现有的循环调度方法导致高性能并行计算机实际应用性能低的缺陷。技术方案是在MPI系统启动过程中,对参数进行初始化,对于配有m套网络的计算环境,根据多Q表组合法创建Cm2个Q表;在MPI系统运行过程中,不断接收应用发出的MPI消息发送请求,确定当前消息段,然后获取当前环境状态,根据状态信息与各Q表中保存的历史经验值,将当前消息段调度至最佳网络,最后计算本次调度获得的瞬时奖赏值,并更新各Q表中的Q值。采用本发明可解决通信负载分配不均衡、无法适应网络状态动态变化、对计算环境的适应性差的问题,提高了高性能并行计算机的实际应用性能。
  • 【专利】 一种基于异构对象存储系统的功耗控制方法

    作者:蒋艳凰 ; 董勇 ; 卢宇彤 ; 周恩强 ; 陈娟 ; 谢旻 ; 曹宏嘉 ; 陈海涛 年份:2010
    摘要:本发明公开了一种基于异构对象存储系统的功耗控制方法,要解决的技术问题是对异构对象存储系统架构下对象存储服务器进行功耗控制,以降低存储系统运行时的功耗。技术方案是根据异构对象存储系统中异构对象存储服务器中使用存储设备的不同,将对象存储服务器划分为两类。针对每类对象存储服务器定义不同的功耗级别,每隔固定时间获取每类存储服务器的使用情况以及功耗级别的设定情况,根据服务请求的变化对每类存储服务器实施功耗级别调整。采用本发明可以动态调整存储服务器的功耗级别,达到既控制对象存储服务器功耗,又避免对其产生过多性能影响的目的。
  • 【专利】 基于操作系统网络驱动的无盘计算机启动方法

    作者:蒋艳凰 ; 卢凯 ; 廖湘科 ; 迟万庆 ; 冯华 ; 刘勇鹏 ; 唐宏伟 ; 高颖慧 ; 蒋杰 年份:2010
    摘要:本发明公开了一种基于操作系统网络驱动的无盘计算机启动方法,目的是解决现有无盘计算机启动方法需要依赖底层BIOS网络驱动和通信协议导致的问题。技术方案是先生成嵌入式操作系统内核,接着生成支持目标操作系统下载、存储和启动的文件系统映像,然后将嵌入式操作系统映像放入USB设备或固化到计算机主板的Flash中,再配置服务器,最后利用操作系统层的网络驱动和通信协议启动无盘计算机。在无盘计算机的启动过程中,先启动嵌入式操作系统,然后由嵌入式操作系统负责目标操作系统的下载、存储和启动。采用本发明解决了BIOS不能及时有效支持NIC驱动和通信协议的技术限制,避免了在BIOS中开发NIC驱动和通信协议的开销,启动开销小。
  • 【期刊】 E级超级计算机故障预测的数据采集方法

    刊名:国防科技大学学报 作者:蒋艳凰 ; 胡维 ; 刘光明 ; 董文睿 ; 崔新武 关键词:超级计算机 ; 故障预测 ; 数据采集方法 ; 数据汇集 机构:国防科技大学计算机学院 ; 国防科技大学计算机学院 ; 国家超级计算天津中心 ; 中国人民解放军95942部队 年份:2016
    摘要:面向未来E级超级计算机,提出用于故障预测的数据采集框架,能够全面采集与计算结点故障相关的状态数据。采用自适应多层分组数据汇集方法,有效解决随着系统规模增长数据汇集过程开销过大的问题。在TH-1A超级计算机上的实现和测试表明,该数据采集框架具有开销小、扩展性好的优点,能够满足未来大规模系统故障预测数据采集的需求。
  • 【期刊】 面向磁盘故障预测的机器学习方法比较

    刊名:计算机工程与科学 作者:蒋艳凰 ; 董勇 ; 卢宇彤 ; 周恩强 关键词:磁盘 ; 故障预测 ; 机器学习 机构:国防科学技术大学计算机学院 ; 国防科学技术大学计算机学院 ; 高性能计算国家重点实验室 年份:2015
    摘要:磁盘是保存数据的重要载体,提高磁盘的可靠性和数据可用性具有重要意义。现代磁盘普遍支持SMART协议,用来监控磁盘的内部工作状态。采用机器学习方法,分析磁盘的SMART信息,实现对磁盘故障的预测。所采用的机器学习方法包括反向神经网络、决策树、支持向量机以及简单贝叶斯,并采用实际磁盘SMART数据进行验证与分析。基于上述数据,对不同机器学习方法的有效性及其效果进行了对比。结果表明,决策树方法的预测率最好,支持向量机方法的误报率最低。
  • 【期刊】 无线传感器网络路由协议的分析与比较

    刊名:计算机科学 作者:蒋艳凰 ; 赵强利 ; 徐明 关键词:无线传感器网络 ; adhoc网络 ; 传感结点 ; 汇聚结点 ; 路由协议 ; 能源有效性 机构:国防科技大学计算机学院 ; 国防科技大学计算机学院 年份:2009
    摘要:无线传感器网络的路由协议设计与传统的无线ad-hoc网络有很多不同,资源高度受限和结点失效频繁是其面临的两大挑战,相关技术研究已经成为无线传感器网络研究中的热点。对近年来无线传感器网络路由协议的研究成果进行归纳、分析和比较,介绍了无线传感器网络的特点以及影响其路由协议设计的关键因素。根据协议的实现特点将无线传感器网络路由协议分为5类,对每一类涉及的重要协议进行详细阐述与分析,最后对这些协议的特点进行归纳和比较,并展望了未来这一研究方向的发展趋势。
  • 【期刊】 流域变换算法中过度分割的平滑解决方法

    刊名:计算机工程与科学 作者:蒋艳凰 ; 常志明 ; 周海芳 ; 杨学军 关键词:流域变换 ; 图像分割 ; 过度分割 ; 平滑算子 机构:国防科技大学计算机学院 ; 国防科技大学计算机学院 ; 国防科技大学计算机学院 ; 国防科技大学计算机学院 ; 国防科技大学计算机学院 年份:2005
    摘要:流域变换是数学形态学中用于图像分割的经典方法,应用十分广泛,但其过度分割问题一直未得到很好的解决。本文首先介绍了流域变换算法的思想,以及引起过渡分割的原因;然后,提出一种解决过度分割问题的快速方法———平滑算子,并通过理论手段证明了该方法的有效性。实验结果表明,该方法是解决流域分割中过渡分割问题的有效方法。
  • 【期刊】 具有高可理解性的二分决策树生成算法研究

    刊名:软件学报 作者:蒋艳凰 ; 杨学军 ; 赵强利 关键词:机器学习 ; 二分决策树 ; 信息熵增益 ; 剪枝 ; RCAT算法 机构:国防科学技术大学 ; 国防科学技术大学 ; 计算机学院 ; 清华得实科技股份有限公司 年份:2004
    摘要:二分离散化是决策树生成中处理连续属性最常用的方法,对于连续属性较多的问题,生成的决策树庞大,知识表示难以理解.针对两类分类问题,提出一种基于属性变换的多区间离散化方法--RCAT,该方法首先将连续属性转化为某类别的概率属性,此概率属性的二分法结果对应于原连续属性的多区间划分,然后对这些区间的边缘进行优化,获得原连续属性的信息熵增益,最后采用悲观剪枝与无损合并剪枝技术对RCAT决策树进行简化.对多个领域的数据集进行实验,结果表明:对比二分离散化,RCAT算法的执行效率高,生成的决策树在保持分类精度的同时,树的规模小,可理解性强.
  • 【论文】 遥感图像高精度并行监督分类技术研究

    作者:蒋艳凰 关键词:遥感图像监督分类 ; 机器学习 ; 图像扭曲 ; 并行算法 ; 纠错输出编码 ; 结构化神经网络 ; 动态离散化 ; 二分决策树 ; YH-PRIPS 机构:国防科学技术大学 ; 国防科学技术大学 年份:2004
    摘要:遥感作为近几十年迅速发展起来的一门综合性技术学科,因其具有观测范围广、采集信息量大、获取信息速度快等特点,已经在民用和军用的众多领域发挥了重大作用。遥感图像处理是遥感科学与具体应用相结合的重要技术途径。遥感图像分类是遥感图像处理的一个重要内容,其中监督分类作为一种先学习后分类的机器学习策略,是对遥感图像进行定量分析的主要手段,应用领域十分广阔。 随着传感器、遥感平台、数据通信等相关技术的发展,通过遥感手段获取的数据量急剧膨胀,迫切需要快速遥感图像处理技术的支持。同时,各应用领域对遥感图像的处理速度和分析结果的量化程度要求越来越高。高精度、快速的遥感图像监督分类技术是遥感科学走向实用化、产业化的一个重要突破口。 遥感图像监督分类处理包括分类预处理、分类判别和分类后处理三个阶段。分类判别阶段的学习算法是影响监督分类精度的关键因素。分类预处理阶段的几何校正和分类判别阶段的学习与分类计算复杂度高,是导致遥感图像监督分类处理速度慢的主要原因。本文针对上述应用需求展开深入研究,首先提出几种学习算法用于提高监督分类的预测精度;然后采用并行处理技术,提高遥感图像监督分类的处理速度;最后设计并实现了一个遥感图像并行处理系统。本文的主要创新如下: 1、提出一种通用性好的纠错输出编码方法——搜索编码法。 有效地将多类分类问题转化为多个两类问题,可以拓展众多机器学习算法在遥感领域中的应用。纠错输出编码不仅可将多类问题两类化,而且能够提高监督分类的精度。但是目前没有一种编码算法适用于含任意类别数的监督分类任务。为解决这个问题,本文提出了一种搜索编码法SCM,该算法将二进制位串与非负整数对应起来,通过对整数空间的顺序搜索,获得满足任意类别数和最小汉明距离要求的输出码。将SCM用到多种监督学习算法后,实验结果表明该编码方法不仅适用范围广,而且能够有效地提高预测精度。 2、提出基于搜索编码的结构化神经网络。 Serpico和Roli根据遥感领域中多传感器图像的分类问题,提出了具有特殊结构的神经网络。本文将这两种神经网络结构分别扩展为结构化神经网络SNN和组合式结构化神经网络k-SNN。SNN的网络结构容易确定、网络行为易于理解,但是预测精度较低。k-SNN虽然可以提高SNN的预测精度,但是学习时间过长。为此,本文进一步提出基于搜索编码的结构化神经网络CSNN,并提出一种解释结构化神经网络分类行为的方法。CSNN在保持可理解性的同时,大大提高了结构化神经网络的预测精度。 3、提出基于属性变换的动态离散化方法RCAT,设计并实现了二分决策树系统Btrees。 不同光谱波段的像元灰度值是遥感图像监督分类的基本数据源,属于连续属性。由于 国防科学技术大学研究生院学位论文 一些重要的监督学习算法只能处理离散属性,对于连续属性的处理需要将连续属性离散 化,因此离散化方法的优劣直接关系到监督分类的预测精度。为此,本文提出基于属性变 换的动态多区间离散化方法RCAT。RCAI,将待处理的连续属性转化为一个概率属性,通 过对概率属性的二分离散化处理,获得原连续属性的一个多区间划分。在RCAT算法的基 础上,设计并实现了二分决策树系统BtreeS。与其它离散化方法相比,采用RCAT算法的 BtreeS系统生成的决策树不仅预测精度高,而且可理解性强。 4、针对分布存储的并行环境,提出两种基于不规则区域计算的并行图像扭曲算法。 分类预处理阶段的几何校正属于数字图像处理领域中的大图像扭曲问题,计算复杂度 高、处理时间长,是影响遥感图像监督分类性能的一个关键因素。通过分析现有研究中相 关算法的缺陷,本文提出两种基于不规则区域计算的并行图像扭曲算法PIWA一LOC和 PI认叭一LIC。PIWA一LOC算法对输入图像进行规则划分,各计算结点通过局部输出区域计算 确定本地负载,从而获得很好的数据局部性。PI场rA一LIC算法对目标图像的计算负载进行 均衡分配,并通过局部输入区域计算,确定各计算结点所需的输入数据,算法不仅数据局 部性好,而且能够实现负载均衡。实验结果表明,对于遥感图像的几何校正问题,这两种 并行图像扭曲算法均能获得很好的并行性能,显著提高了分类预处理的速度。其中, PIWA一LIC算法具有更好的通用性。 5、针对分布存储的并行环境,对几种监督学习算法进行并行化处理。 对于遥感图像的监督分类问题,一般训练样本和待分类样本的数目庞大,导致学习与 分类速度缓慢;另一方面,人们在追求高精度的分类结果的同时,不可避免地增加了学习 和分类的复杂度。为此,本文针对分布存储的并行环境,对最近邻法的分类过程、以及论 文中所研究的四种神经网络算法的学习过程进行并行化处理。实验结果表明,监督学习算 法的并行化能够有效地提高分类判别阶段的处理速度。 基于上述研究成果,结合我国遥感应用领域对高性能遥感图像处理软件的迫切需求, 设计并实现了一个遥感图像并行处理系统YH一PRIPS。YH一P租PS采用基于B/S结构的三层 应用模型,并运用高性能并行手段实现遥感图像处理。由于系统采用层次结构与模块?