基于深度学习的扫描文档智能化整理及OCR软件

2019-08-23

1. 开发环境简介

1）基于MxNet框架的深度学习模型构建及优化
2）基于QT的GUI开发

2.软件简介

2.1 软件功能介绍

软件可以实现扫描文档图片按主题自动进行正确的归类整理，从而实现自动化的扫描文档归类工作。软件不仅可以在CPU上进行运行处理，同时支持在GPU上进行加速处理。使用GPU加速时，至少需要一块显存为2G的显卡，同时必须安装CUDA软件。一般情况下GPU加速会比CPU快5-10倍。

2.2 软件界面介绍

界面主菜单栏包含文件的打开功能，以及软件计算使用的设备CPU或GPU选择栏，默认使用CPU。包含四个文本框，分别显示输入文件夹路径、台账文件路径、输出文件夹路径，最下面一个文本框显示处理过程中输出的一些提示信息。当选好处理的文件夹、台账文件和使用的计算设备后，点击处理按钮即可进行自动化处理。界面展示如图1所示：

图１软件界面图

2.3 处理效果展示

以地籍调查扫描文档作为示例，处理效果如图2所示：

图2 软件处理示意图

3. 核心技术

1）基于深度学习的图像分类技术
2）光学字符识别技术