·
搜索结果:找到“OCR”相关结果2270条
排序: 按相关 按相关 按时间降序
  • 【期刊】 基于深度学习的浏览器OCR插件设计与实现

    刊名:信息与电脑(理论版) 作者:廖晓彬 关键词:OCR ; 深度学习 ; 浏览器插件 机构:北京林业大学计算机科学与技术系 ; 北京林业大学计算机科学与技术系 年份:2018
    摘要:浏览器是用户日常接触网络的信息重要入口,用户对于网页上的文字识别也有广泛需求,因此,开发一款OCR文字识别的浏览器插件,将极大提高用户的工作效率。笔者介绍了基于深度学习OCR文字识别的技术原理,设计了并实现了一款基于深度学习的浏览器OCR插件。
  • 【论文】 基于OCR的文档图片检测与信息提取系统的研究

    作者:邹亚劼 关键词:文档图片 ; 图片预处理 ; 图片分类 ; 版式分析 ; 信息提取 机构:哈尔滨工业大学 ; 哈尔滨工业大学 年份:2015
    摘要:科技的发展使信息处理方式突飞猛进,“信息资料电子化”的潮流吸引着各行各业的加入。基于Optical Character Recognition(OCR)的文档图片识别因速度块、识别从而准确越来越备受各大企业、党政机关的青睐。与传统的手工录入模式相比较,OCR的智能信息录入具备强大的优势,速度方面OCR识别也远快于手工录入模式,不仅使大批人力资源得到节省,资源配置得到优化,还使人员从繁琐的机械式工作中解脱出来,而去专注愈加有需要的工作上。OCR技术由于在数据收集计划方面可以为用户提供低成本、高效率,所以可以有力的支持业务快速发展。因此,大量的图片自动识别系统及APP软件应运而生。例如身份证的识别、票据的自动识别、车牌的自动识别。在此类产品中,都是固定了某种识别对象用特定的识别程序去识别。显然,当用户识别多个文档图像对象时,这种单处理对象模式将显得很棘手,因此,有必要开发一种能针对一般的文档图片,由程序自动判别文档类型,以及对信息进行提取的系统。基于上述的需求,本文提出一种基于OCR的多种文档图片识别系统。其中包括论文首页的图片、公文图片、名片图片等文档图片。该系统可以自动对输入的图片进行判别识别,并提取图片信息。本文主要从图片预处理、文档图片检测、版式分析及信息提取三个模块来描述提出的系统。图片预处理中的椒盐去噪是本系统的重要创新点之一,通过比较近几年各大期刊发表的相关论文,本文提出的椒盐去噪无论在高噪声还是低噪声,都有较好的效果。其次在图片的倾斜矫正方面,本文基于投影的改进算法在确保精度的条件下,加快了寻找倾斜角度的速度。在文档检测方面,利用Adaboost算法来组合弱分类器进而对图片分类,检测出文档图片。版式分析技术是基于改进的聚类算法来分析。图片的内容提取主要利用先验的规则库,以及通过贝叶斯概率来获得。
  • 【论文】 基于OCR技术的涉密文档监控系统设计与实现

    作者:徐建文 关键词:OCR ; 监控系统 ; 机器学习 ; 安全性 ; SVM ; 文档 机构:电子科技大学 ; 电子科技大学 年份:2014
    摘要:网络高度发达的信息化时代,机密文件的安全保护与监控是一项非常值得重视的任务,尤其对政府、军队和其他重要单位。数字信息高速发展的今天,绝大部分文件都以电子文档的形式存在,但目前关于电子文档的安全监控系统大部分是针对计算机可以直接识别的计算机文字而设计,而对图像形式的电子文档的监控暂时还没有很好的系统对其处理,因此开发一个能对图形电子文档进行监控的系统以防止信息以图形化形式泄露,具有重要意义。通过阅读大量相关文献和参考其他相关系统的基础上,重点针对图形文档的安全监控,利用开源的OCR(Optical Character Recognition)技术,提出基于OCR技术的文件监控系统的设计与实现。大数据时代如何在大量的数据中发现价值,是目前研究的热点与重点。在大量的文件中查找机密文件也是一种价值的发现,目前对大数据处理最常用办法即采用机器学习的办法。机器学习是当前实现人工智能的最有效方法之一,为了使系统具有监控全面性、准确性、先进性、高效性甚至智能性,本项目将OCR应用技术与机器学习相结合来共同完成对机密文档的监控。项目的实现按软件工程的步骤逐步进行,首先进行需求分析,其次根据需求分析中的功能模块进行详细设计,到最后的编码实现与测试。通过测试证明基于OCR技术的涉密文档监控系统具有一定的先进性和适用性。该系统的应用能弥补对局域网中图形化形式存储的机密文档监控不到位的问题,能较全面的对文件系统进行监控,提高文档的安全性,降低信息泄露的风险。
  • 【期刊】 一种基于OCR识别技术的通用计票系统设计

    刊名:企业科技与发展 作者:罗维 关键词:计票 ; 投票 ; 扫描 ; 识别 机构:广西科技情报研究所 ; 广西科技情报研究所 年份:2018
    摘要:利用计算机技术提高传统纸质投票的计票效率,避免计算机图像识别产生的拒识和误识对整个计票过程的干扰,开发出一套高效可视可控的通用计票系统。文章利用高速扫描仪进行纸质选票的图像数据采集,结合准确度较高的印刷体数字和手写体符号OCR识别技术,配合能适应各种投票规则过程的通用性数据库数据结构设计一种通用计票系统。该系统既能保存纸质投票的优点,又能高效地完成数据采集及结果输出,对实际投票特别是会议投票具有一定的实用价值。
  • 【期刊】 一种利用OCR技术进行互联网涉密检查的方法

    刊名:中国科技纵横 作者:陆春祥 ; 王伟 关键词:OCR ; 互联网 ; 海量信息 机构:蓝盾信息安全技术有限公司 ; 蓝盾信息安全技术有限公司 年份:2014
    摘要:近年来,互联网泄密事件逐渐增多,传统人工检查方法难以应对海量信息的合规审查,本文通过一种基于图文识别OCR的方法,通过分布式部署互联网检查设备,可以快速发现互联网违规发布的涉密文件,大幅提升互联网涉密信息检查能力。
  • 【会议】 基于OCR技术的智能化免填单业务应用研究

    作者:彭奕;余虹; 关键词:供电营业;;OCR技术;;免填单 机构:国网上海市电力公司市南供电公司; ; 国网上海市电力公司市南供电公司; 年份:2017
    摘要:结合供电营业窗口业务,探讨利用OCR光学字符识别技术,取消用户填写单据环节,实现智能化信息录入。研究一套面向供电窗口服务的标准可行的免填单业务办理模式来提高业务办理效率和服务质量,同时提升用户服务体验。
  • 【论文】 OCR文字识别技术在不动产数据整合中的应用

    作者:马泽 关键词:数字识别 ; Tesseract ; 百度OCR ; Arc Engine ; 不动产数据整合 机构:东华理工大学 ; 东华理工大学 年份:2018
    摘要:数字识别作为文字识别的重要组成部分,在前人近百年的摸索中,已经拥有了成熟的技术和蓬勃的发展。虽然各行业广泛应用这门技术,并且在数字识别发展的近百年时间里,涌现了大量优秀的算法和研究成果。但是对于测绘行业,文字识别技术的应用还尚在起步阶段,因此针对测绘行业的一些特定工作文字识别技术仍然有巨大的研究价值与空间。数字识别主要指通过使用硬件设施结合计算机软件编程手段实现自动识别阿拉伯数字的过程。在针对不动产数据整合这个项目中,通过数字识别可以大幅度减轻工作量与工作强度,具有非常重要的推广应用价值。本文主要研究如何解决在测区中纸质档案中含有界址点的扫描件如何直接生成数字化图的问题。本文的目的就是要解决识别纸质档案中的界址点,以及利用Arc Engine进行二次开发批量生成宗地图这两个技术难点。并最终形成一个能够自动识别界址点信息并且能自动生成数字化图的系统。全文主要工作包括如下:(1)数字识别图像预处理算法研究,包含图像的灰度化、图像的二值化、图像的降噪三个部分,研究三个部分的算法并将其实现应用在设计的系统中。(2)文字识别的算法选取,选择成熟的第三方库Tesseract文字识别引擎和百度OCR文字识别服务,对其进行对比分析,分析标准为识别后的正确率、错误率、拒识率以及识别所花费的时间,综上标准进行综合分析。最终做出最适合实验设计的选择。在应用选择好的识别方法时利用第一步掌握的图像预处理方法,尽可能的提高图像质量,提升识别正确率。(3)利用Arc Engine开发能够直接批量生成宗地图的软件。(4)结合前三步的工作,设计出一款能够通过计算机识别扫描件中界址点信息并最终能生成数字化宗地图的系统。(5)将该系统实际应用于清新区不动产数据整合项目中,验证是否满足实验精度需求。通过最终选定的文字识别方法,结合对扫描件图像的预处理工作,并将识别结果输出后提供给批量转换软件这一整套系统流程,最终满足实验设想,实现了高识别率的系统建设。
  • 【期刊】 基于正则筛选的OCR手机号码自动识别的研究

    刊名:吉林师范大学学报(自然科学版) 作者:董延华 ; 刘靓葳 ; 宋和烨 ; 董旭 关键词:OCR ; 正则筛选法 ; 手机号码自动识别 机构:吉林师范大学计算机学院 ; 吉林师范大学计算机学院 年份:2019
    摘要:在图像识别领域内,识别各种不同模式的目标和对象已经成为研究的热点.本文针对图像中手机号码自动识别问题,阐述了基于OCR的数字识别具体实现过程,并结合移动应用开发平台Android Studio,实现了基于移动平台的手机号自动识别.系统实现过程中,有效运用正则筛选算法,将手机号码从一般文本信息加以提取,提高了手机号码的识别率.实验表明:基于正则筛选法的OCR手机号码自动识别充分发挥了移动平台的图像识别灵活性的特点,具有稳定性、可靠性以及可行性的优点,既可实现单个手机号码识别,又可同时实现多个手机号码的识别.
  • 【期刊】 基于OCR技术的高校数字化档案资源的开发与利用

    刊名:福建电脑 作者:张鹏 关键词:OCR ; 数字档案馆 ; 档案资源 机构:南京审计学院教育技术与网管中心 ; 南京审计学院教育技术与网管中心 年份:2013
    摘要:本文在分析了高校档案资源的建设现状的基础上,阐述了OCR技术的原理和特点,并论述了利用OCR技术在对高校档案资源利用和开发中所起的作用。
  • 【专利】 一种带有OCR文字识别功能的自动盖章设备

    作者:魏伟 ; 谢爱文 ; 张小平 ; 魏小兰 ; 陈德杯 ; 倪波涛 ; 胡远远 ; 冯国平 年份:2017
    摘要:本实用新型公开了一种带有OCR文字识别功能的自动盖章设备,包括底座,所述底座的顶部固定安装有固定柱,固定柱的一侧固定安装有位于底座上方的横梁,横梁内滑动安装有顶杆,且顶杆的两端均延伸至横梁外,横梁的上方设有固定安装在固定柱上的电机,电机的输出轴上固定安装有凸轮,且凸轮与顶杆的顶端相接触,顶杆的底端固定安装有固定座,固定座的底部固定安装有工作印章,且工作印章与底座相接触,顶杆的两侧对称固定安装有横杆,且横杆位于固定座与横梁之间。本实用新型能够通过OCR文字识别技术自动识别文字或图案,从而控制电机进行自动盖章,为人们使用提供极大便利。
  • 【期刊】 基于图元识别的OCR文本图像矫正算法分析

    刊名:中国新技术新产品 作者:姜毅 ; 彭清畅 ; 徐娟 关键词:图元识别 ; 投影图 ; OCR文本图像 ; 倾斜矫正 机构:中车青岛四方机车车辆股份有限公司 ; 中车青岛四方机车车辆股份有限公司 年份:2019
    摘要:受数字化变革的影响,无纸化逐渐成为办公自动化的显著标志,但在纸质文件通过扫描或者拍照转换为OCR文本图像的过程中,文本图片经常不可避免地会产生一定的倾斜,基于此,该文简要分析了OCR文本图像的倾斜矫正方法,并详细论述了基于投影图改进的OCR文本图像倾斜矫正快速算法,希望论述内容能够为相关业内人士带来一定启发。
  • 【期刊】 基于反馈合并的中英文混排版面OCR技术研究

    刊名:计算机技术与发展 作者:任荣梓 ; 高航 关键词:文字识别 ; 中英混排 ; 版面分析 ; 分离 机构:南京航空航天大学 ; 南京航空航天大学 ; 计算机科学与技术学院 年份:2017
    摘要:迄今,光学字符识别(OCR)技术已普遍应用于社会生活的方方面面,单一字符集OCR技术领域已经取得重大突破.但由于中文和英文版面分析之间存在的明显差异,现有中英文混排OCR技术的表现均不尽如人意.针对传统OCR方法实现方式的缺点和不足,在研究中英文混合版面分析切分技术难点的基础上,提出了一种改进的基于反馈合并的中英文混合版面分析切分方法.该方法在综合应用Canny算子的图像二值化方法和中值滤波法进行滤波预处理的基础上,采用投影法两次分割字符区域,并对具体切分技巧进行了较为深入的研究.对比验证实验结果表明,所提出的版面分析切分方法可成功分离中英文混合文档中的中文、英文和数字字符,正确率比传统方法高出约8个百分点,可达到97%,较好地解决了传统方法对粘连字符处理效果不佳的问题.
上一页 1 2 3 4 5 6 7 8 9 10 下一页 跳转