张力飞

  • 主页
  • 教育背景
  • 研究经历
  • 实践经历
  • 社会活动
友链 关于我

张力飞

  • 主页
  • 教育背景
  • 研究经历
  • 实践经历
  • 社会活动

基于深度学习的扫描文档智能化整理及OCR软件

2019-08-23

1. 开发环境简介

1)基于MxNet框架的深度学习模型构建及优化
2)基于QT的GUI开发

2.软件简介

2.1 软件功能介绍

软件可以实现扫描文档图片按主题自动进行正确的归类整理,从而实现自动化的扫描文档归类工作。软件不仅可以在CPU上进行运行处理,同时支持在GPU上进行加速处理。使用GPU加速时,至少需要一块显存为2G的显卡,同时必须安装CUDA软件。一般情况下GPU加速会比CPU快5-10倍。

2.2 软件界面介绍

界面主菜单栏包含文件的打开功能,以及软件计算使用的设备CPU或GPU选择栏,默认使用CPU。包含四个文本框,分别显示输入文件夹路径、台账文件路径、输出文件夹路径,最下面一个文本框显示处理过程中输出的一些提示信息。当选好处理的文件夹、台账文件和使用的计算设备后,点击处理按钮即可进行自动化处理。界面展示如图1所示:

图1 软件界面图

2.3 处理效果展示

以地籍调查扫描文档作为示例,处理效果如图2所示:

图2 软件处理示意图

3. 核心技术

1)基于深度学习的图像分类技术
2)光学字符识别技术

扫一扫,分享到微信

微信分享二维码
© 2020 张力飞
Hexo Theme Yilia by Litten
  • 友链
  • 关于我
  • 武汉大学
  • 武汉大学测绘遥感信息工程国家重点实验室
  • 武汉大学CVEO小组
革命还未成功<br><br>同志仍需努力啊!<br>