广州市德数机械设备有限公司 ── 专业研发、设计、生产贴标机/不干胶贴标机/包装机/包装生产线/定制非标设备

德云社区

 找回密码
 立即注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

数字 IDE Python ── 支持编写 Python、Django、HTML5、XML、C/C++、Java、Perl、PHP、Ruby、C#、VB .Net 等程序源代码。。。集成了很多常用编程智能辅助工具。。。
数字翻译 ── 能批量翻译文档 GUI 用户界面。。。网页浏览 批处理 全文搜索 全文替换 全文删除 全文插入 数据比较 。。。集成中英自动 TTS 文本诵读功能。。。
数字浏览器专业版 ── 集成了工业 4.0 理念的数字化浏览器,譬如:集成中英自动 TTS 文本诵读功能。。。全文搜索、数据整理分析工具。。。可浏览文件夹、文件、图片、音频、视频等文件格式。。。所见即所得编写 HTML4、HTML5 网站及强大文本编辑器功能。。。
数字 IDE 网页 ── 所见即所得编写 HTML4、HTML5 静态-动态网站,生成 Robots、站点地图,死链检测,强大文本编辑器功能。。。集成中英自动 TTS 文本诵读功能。。。
查看: 1864|回复: 0

图片验证码,图像识别软件 OCR 功能也会鞭长莫及而无法工作

[复制链接]

204

主题

249

帖子

1187

积分

工程师

Rank: 5Rank: 5

金钱
716
金币
8
威望
0
贡献
0
发表于 2015-3-18 12:20:28 | 显示全部楼层 |阅读模式
|          
图片验证码,图像识别软件 OCR 功能也会鞭长莫及而无法工作

图像识别软件或视觉传感器,识别文字使用的主要原理是 OCR 技术。若将文字改成图片,采用 OCR 技术的所有图像识别软件就会失效。但使用这种技术,图片验证码图像一定不能使用重复有规律图片,不然,一样可轻松破解识别。


OCR 是英文 Optical Character Recognition 的简写,中文译为 “光学字符识别”。OCR 是指电子设备(譬如:扫描仪)或传感器 (譬如:视觉传感器) 先通过检测印刷字符明、暗确定字符形状,然后再用字符识别方法将字符形状翻译成计算机文字的过程。即:针对印刷字符,采用光学方式将纸质文档文字转换成黑白点阵图像文件,再通过自动识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑、处理的技术。


OCR 识别文本时,图片质量一般建议 150dpi 以上。OCR 对彩色图片识别较差,黑白图片识别较好;因此,建议采用黑白图片。OCR 技术对印刷字体识别较好,手写识别较差。


OCR 技术从影像到结果输出,工作须经过:影像输入、影像预处理、文字特征抽取、比对识别、最后经人工校正将认错的文字更正、输出结果。


004.jpg

从原理上来说,采用类似 OCR 的这种技术识别图像也是可行的;实际上,却为什么又不行呢?有以下几条原因:

01、原理雷同,但计算量太大。每个文字占用电脑内存空间都很小,且可单独计算;而图片是一个整体,要一次计算一张图片,图片多大,就要占用多少电脑内存空间。


02、文字是几千年来人类文化的结晶,经过漫长历史检验,规律性很强;而图片没规律,且还可以是任意的。就算你有云服务器,不怕图片计算量,若想搞定这种技术,除非你有类似人脑的人工智能 (目前已知有信息可查的人工智能技术,并未达到这种成熟程度);再进一步假定,就算人工智能技术成熟,但这种大计算量的服务器费用会很高,也不是一般人能用得起的。


03、不管是那种世界文字,用计算机技术处理成黑白或灰度图片再进行识别会很容易。而图片的没规律性及自然界光线的多变性,同一个规则物体在同一视角不同时间,拍摄成多张图片后也会有些许不同;用计算机技术处理成黑白或灰度图片再进行识别,难度会增加不少。


04、除非出现新技术或新科技或新突破,至少目前的 OCR 技术是解决不了这个问题的。



"长按二维码" 或 "扫一扫" 关注 "德云社区" 微信公众号

版权声明:
本文为独家原创稿件,版权归 德云社区,未经许可不得转载;否则,将追究其法律责任。
广州市德数机械设备有限公司 ── 专业研发、设计、生产贴标机/不干胶贴标机/包装机/包装生产线/定制非标设备
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|Sitemap|手机版|小黑屋|德云社区    

GMT+8, 2017-11-24 00:24 , Processed in 0.060860 second(s), 17 queries , Apc On.

版权所有 © Guangzhou Digits Cloud Technology Co., Ltd.

工业和信息化部:粤ICP备14079481号-2

快速回复 返回顶部 返回列表