图像识别疫情之下消费电子产业竟逆向增长?重庆市产学研创新联合体2021年年会举行
第07版:科技创新·项目
上一版 下一版  
图像识别
疫情之下消费电子产业竟逆向增长?
重庆市产学研创新联合体2021年年会举行
     
 
重庆日报 | 重庆科技报
重庆日报报业集团主办 
3上一篇  下一篇4  
2022 年 01 月 18 日 星期 放大 缩小 默认  
科技热词、新词知多少

图像识别

李晓航

    插图 苏盼盼

  图像识别是一种电子信息处理功能,可称为“机器视觉”,就是用软件去看。图像识别软件通常包括采集图像、分析图像和数据库等部分。利用图像识别可以完成很多任务,如读取车牌号码、录入文字、识别指纹和人脸等。

  首先,要识别图像必须先采集图像,这就像人用眼睛看世界一样。机器的“看”可以是摄像头拍照、录像,扫描仪扫描或从手写板等设备人工输入,得到的图像又转成数据传给后续的分析软件。在拍摄时常会有角度、距离、光线等影响,为方便识别,必须根据拍摄条件和识别要求,对结果进行标准化和规范化处理。例如,车号识别软件会根据车牌底色、字色、边框等规定,选取照片或视频中符合要求的部分,并还原拍摄过程中的变形,得到标准的长方形车牌图像,再把它发给分析软件。如果无法得到合格的图像,软件会提示“图像不符合要求,无法识别”。有些软件不要求严格的标准化图像,这个步骤将被简化,如数码相机的人脸识别只需要对着看起来像人脸的方块或圆形图案调整焦距就可以了。

  图像识别最重要的部分是分析软件,它就像人脑的“视觉中枢”。我们同样拿车号识别举例,分析的过程和人们看图认字相似,把标准化图片切割成一个个文字,放大或缩小到与字库中的文字大小一样,再一个个进行对比,判断是否符合并输出结果。因为车牌是规范化的,在字库中只需存储标准字体。同时,车牌上会出现的也不是全部字母和数字,这就大大减少了运算负担。这种分析方法被称为“模板对比法”。在这里,字库就是软件的文字模板,为每个文字提供标准图像。另一方面,就像人们能根据眼睛、鼻子、身形轮廓或动作习惯等部分特征就认出熟人一样,软件对比也不一定要和数据库中的模板完全相同才算符合,有时只要最关键的部分特征相同就可以了。前者被称为精确识别,后者被称为模糊识别。在人脸和指纹识别这种图像内容较复杂的应用中,模糊识别占主流地位。抽取图像的关键点并快速查找有相同特征的图片,是分析软件的重要功能,也是开发难点。水平高的识别软件很“聪明”,辨认快且准确。根据应用的不同,一个软件可以包含多套模板,比如手写输入法就不仅要有尽量全面的字库,还要根据笔画走向、变形等设计笔尖运动模板库。

  上述模板和对比方法都存储在数据库中,它是软件的记忆中枢。有些软件还会搜集使用过程中用户和网络的反馈,作为资料存入数据库,这就是“学习”能力。通过学习,软件会越来越“聪明”,或根据需要改变和增加功能。

3上一篇  下一篇  
 
《重庆科技报》版权所有 未经书面授权 不得复制或建立镜像
地址:重庆市渝中区双钢路3号科协大厦 邮编:400013
技术支持:北京北大方正电子有限公司