【关键词】版面分析;模式识别;应用
1模式类区分方法[1]
对于图文混排的复杂度高的文档图像一般采用自底向上的版面分析策略,在通过连通区搜索算法(包括二次分析)获得版面全部连通区信息后即面临文本区域和图像区域的连通区信息区分问题。为方便讨论,依模式识别理论我们称文本区域和图像区域的连通区为不同的模式类对象。由于文本区域和图像区域不能出现交叠(这种交叠情况我们结合后续相同模式类对象合并过程称为合并或聚类风险),但试验表明即使在刚刚获得版面全部连通区信息,即在尚未展开后续合并等处理过程就已经存在文本区域和图像区域交叠的情况,或者说存在合并风险问题。所以有理由说合并风险将是伴随相同模式类对象合并过程始终的。由于问题的复杂性,受二分法思想启发,我们把问题逐步分解,即确立图文分解的方法。
对于一个待分析图像文档,我们将图像中的图像模式类对象:边框线和标题在原图像中滤除,同时将所提取的文字图像部分就其在文档中区域信息(该信息由对原图像的连通区搜索得到)规范化为图像文档,即作为原始文档的伴随图像。由于生成伴随图像,初步排除图像模式类对象的干扰,从而就其文字图像的版面分析的复杂度大为降低[2-3]。
需要说明的是这仅是初步做到图文分解,就是说在伴随图像中仍可能存在图像模式类信息,为此我们采取“渐进合并,特征凸现”的策略在后续处理中解决(对此将作另文详述);另一方面的关键问题是仍无法保证对不同图像模式类对象(如文字、图像甚至表格)分析的互不干扰性,而这一点正是我们要求系统所能体现出的智能性,它是由聚类稳定性算法保证实现的。
2辅助功能模块的运用
承前所述,随着并行合并过程进行,由于对模式类对象是采用“渐进合并,特征凸现”的策略,模式类对象的确定要建立在一定前提条件上,即要待其模式类特征从不明显到明显之后,但在此过程完成时会有相互冲突情况产生。尽管上述算法的采用极大提高了系统的版面分析质量,但必须佐以其他功能模块的运用来处理这种更复杂的情形。该模块的功能将分别不同情况实现:1)择取强势特征模块,该情况下将保留取强势特征对象同时舍弃异类对象;2)折中退让,该情况下将根据冲突的情形做单方面的退让,如可以是文本类对象退让图像类对象(简称“文退图”)等,由于该情况较复杂,鉴于篇幅作者只做一般情形解释。
3结论
对于模式类区分方法可以做策略层面的理解,这对于整个版面分析系统的质量是举足轻重的,但没有其他方法的辅助则很多具体问题仍不可得以完善和解决,因为版面分析要面临很多复杂的模式识别问题。本文正是探讨通过两者的融合从而是系统最终能体现出智能性的特点,进而获得实际应用的价值。
【参考文献】
[1]周长岭.中文OCR中的版面分析算法初探[C]//第六届全国汉字识别学术会议论文集,重庆,1996:137-142.
关键词:图像的处理;发展趋势;计算机应用;分析
中图分类号:TP391.41
前言:智能图像处理是计算机图形图像处理是为基本内容之后发展的,着重介绍这两者之间的发展和应用,尤其在计算机应用的各种技术,以便了解智能图形图像技术的发展趋势和应用领域。
1图像处理与分析技术
由于计算机硬件计算速度的不断提高和成本的下降,图像处理和分析技术在农业方面尤其是作物领域已变得越来越重要。大量研究表明,利用计算机图像技术可很大的提高测量分析的精度和效率,更改以往作物研究中难于定量化的问题,实现信息采集的智能化和自动化。图像处理主要就在图像之间进行的变换。假如说图像处理是一个从图像到图像的过程,则图像分析是一个从图像到数据的能力。主要是对其中的图像所需要分析的目标进行检测和量定,而我们所获取的客观信息进行对图像的重新描述。然而图像的处理与技术分析将会随着计算机成熟和发展工程中而迅速发展起来的一个重要应用技术领域。
2图形图像数字处理技术
数字图像处理是30年来迅速发展起来的一门技术,由于对图像处理的要求还在不断增加,图像的应用领域还在继续的扩大,因而对图像处理的课题的理论在世界的变化中也处于变化,我们需要对其进行补充和完善。而本文章主要是对图像处理的中所产生的数学问题,学习并研究图像的基本处理中涉及到的数学问题,让大家可以更好的学习掌握图像的微处理技术。
2.1数字图像处理的优点
(1)再现性好。数字图像处理与模拟图像处理的根本不同在于,它不会因图像的存储、传输或复制等一系列变换操作而导致图像质量的退化。只要图像在数字化时准确地表现了原稿,则数字图像处理过程始终能保持图像的再现。(2)处理精度高。按目前的技术,几乎可将一幅模拟图像数字化为任意大小的二维数组,这主要取决于图像数字化设备的能力。现代扫描仪可以把每个像素的灰度等级量化为16位甚至更高,这意味着图像的数字化精度可以达到满足任一应用需求。对计算机而言,不论数组大小,也不论每个像素的位数多少,其处理程序几乎是一样的。换言之,从原理上讲不论图像的精度有多高,处理总是能实现的,只要在处理时改变程序中的数组参数就可以了。回想一下图像的模拟处理,为了要把处理精度提高一个数量级,就要大幅度地改进处理装置,这在经济上是极不合算的。(3)适用面宽。图像可以来自多种信息源,它们可以是可见光图像,也可以是不可见的波谱图像(例如X射线图像、射线图像、超声波图像或红外图像等)。从图像反映的客观实体尺度看,可以小到电子显微镜图像,大到航空照片、遥感图像甚至天文望远镜图像。这些来自不同信息源的图像只要被变换为数字编码形式后,均是用二维数组表示的灰度图像(彩色图像也是由灰度图像组合成的,例如RGB图像由红、绿、蓝三个灰度图像组合而成)组合而成,因而均可用计算机来处理。即只要针对不同的图像信息源,采取相应的图像信息采集措施,图像的数字处理方法适用于任何一种图像。小波重构的数据传递示意图如图所示:
(1)图像的编码压缩图像文件是编码压缩技术可减少描述图像的数据量等,用来节省了图像的传输、处理的时间所占用的存储器容量。压缩可以在不失真的前提下来获得,其也可以在允许失真的条件下进行。编码是压缩技术当中最最重要的方法,它在图像处理技术中是发展最早且比较成熟的技术。(2)首先,对于图像的分割技术将会给图像带来某种特殊的意义所表现出来的具有甄别能力。从而对图像的线条、颜色所进行处理,并需要进一步对图像的分割技术进行了解,图像的分割技术目前也是大众中非常流行的解决图像问题的方法。因此,对于图像的研究我们还要不断地进行深入的了解。图像的描述是对于图像所进行的甄别和理解作为前提。作为最简单的二值方法,我们利用它来描述物品的特性。(3)图像在生成和传输过程中常受到各种噪声的干扰和影响,使图像质量下降。为了抑制噪声改善图像质量,必须对图像进行平滑处理,可以在空域或频域中进行。
数字图像的平滑技术分为两大类:1)全局处理,即对噪声图像地整体域大的块进行校正以得到平滑的图像。缺点:计算量大。2)局部算子,仅对某一像素的局部小邻域的一些像素加以运算。优点计算率高。
2.2图像数字化
人类感知外界信息80%以上是通过视觉观察到的,而图像就是人们所获取的一个重要的方面,人们眼睛所获取的图像在大脑中的中枢神经系统中发挥重要的作用,准确的图像也是人们获取彼此信息的来源。其伴随着人们所生活的各个领域。图像处理虽然也可以用模拟技术或者光学方法来实现,但目前主要在我国还是大多数还是通过利用计算机的一些功能来实现,通过对图像的处理,我们能晓得其背后的重要意思,图像也在日常的生活中越来了越广泛。对数字图像的处理目前来说还是一个开始,其主要是在对形态数学、立体学、集合论等方面。因此,图像处理一般是指数字图像处理。
计算机图像处理之前的图像数字化的基本步骤,是把真实的图像转变成计算机使用的存储格式。数字化过程分为量化和采样处理两个步骤。量化的结果是图像能够容纳的颜色总数。采样的结果就是通常所说的图像分辨率。量化是指要使用多大范围的数值来表示图像采样之后的每一个点,这个数值范围包括了图像上所能使用的颜色总数。
3图像测量技术
随着计算机技术的发展和电子成像器件的成熟,图像测量日益受到人们重视,应用范围不断扩展。图像测量技术是以近代光学为基础,融光电子学、计算机视觉原理、图像处理技术等科学技术为一体的现代测试技术,并在军事、医学、资源分析、测绘等领域得到广泛应用,取得了巨大成功。由于算法改进和计算机性能的提高,使开发基于图像处理的啤酒瓶快速检测技术成为可能。
4结束语
随着计算机应用技术的发展,图像与图像技术的应用越来越广泛,除了传统的广告、包装宣传,网站设计等方面的应用。也在航空事业、机电事业、国家的安全部门、政司法科、国家的武器研发,新型导弹的定位,还伴有新型科学药物的研发、在工业上企业是非常重要的一门学科、伴随着计算机的技术与人工智能电子的研发智能图像的作用将会占据很大的部分其今后的发展趋势越来好,越来越广。
参考文献:
关键词:视频监控;行为分析;Hu不变矩
中图分类号:TP391.41文献标识码:A文章编号:1007—9599(2012)14—0000—02
一、引言
运动人体的行为分析作为视频监控领域的一个研究热点和难点,是计算机领域的高层处理环节,它建立在视频图像序列中,人体运动区域检测追踪的基础上。首先通过运动目标检索,提取监控视频中的运动目标,然后进行运动目标行为分析研究,使视频监控人员有效的发现和处理紧急事件。
二、运动人体行为分析方法
运动人体行为分析涉及图像处理的行为分析识别技术,学习样本及对运动行为分类的难度较大。目前,对运动人体行为分析技术的研究仍然处于一个起步阶段,主要的研究技术集中在模板匹配方法和状态转移方法上。
(一)模板匹配算法
模板匹配算法是一种比较识别算法。模版匹配算法通过计算,比较静态图像中提取的模版特征相似度,并进行识别。目前,较为常用的是一种二维网络模板匹配算法,它通过对连续帧间的光流场沿着X和Y轴方向进行分解,对每个单元格的幅度累加计算,得到用于进行识别的向量。它的优点是计算量小,实现简单,能较为满意的实现对人体行为特征的分析研究。
(二)状态空间法
状态空间法是一种对常见人体行为特征的遍历过程,通过某种概率值来定义每种静态姿势的直接转换,将人体行为特征遍历过程的联合概率密度的最大值作为行为特征的分类。最前最为常用的状态空间法是隐马尔可夫模型,是一种对离散时间序列进行研究分析的概率方法。它的优点是对运动时间的间隔不敏感,缺点是迭代运算复杂,计算量较大。
三、基于Hu不变矩的行为分析
(一)Hu不变矩
不变矩理论是由Hu于1962年提出的一种基于区域的不变理论,广泛的应用于计算机处理和模式识别之中。不变矩理论具有较好的旋转、平移和拉伸不变性,广泛的应用于图像处理和计算机视觉领域之中。
Hu不变矩是图像的一种形状特征,较多用于运动物体的描述,由于它具有较好的不变性,能很好的应用于模板匹配算法进行运动行为的分析研究。中心距的定义为:
式中,,是图像区域的质心坐标,为数字图像。Hu不变矩具有代数不变量,对于图像的旋转、平移都不敏感。通过计算代表人体的行为特征Hu不变矩,与定义的标准行为向量的欧式距离比较研究判断人体行为特征的种类。
(二)行为分析过程
本文主要是采用基于Hu不变矩的模板匹配算法分析监控视频中的运动人体行为特征。首先,获取了监控视频中人体的运动区域后,然后对人体的运动行为作出分析。本文的人体行为分析主要分为三个步骤,具体实现过程如下:
1.定义标准人体运动行为。首先,将人体正常行走和跑步定位为标准动作,将一段包含正常行走和奔跑的人体运动图像作为特征库数据,提取它的Hu不变矩作为标准特征库。
2.提取另外获取的一段人体运动区域图像的Hu不变矩向量,将它与标准特征库向量进行相似性比较,计算它们的欧式距离。
3.对比欧式距离与预先设定的阈值。如果结果大于阈值,则认为这是一种人体的异常运动行为,对其进行报警;如果结果小于阈值则认为是一种正常运动行为,进而指导监控人员进行判断和处理。
四、实验结果及分析
分别选取了一段包含人体行走、跑步、蹲的图像序列进行算法的验证实验,分别提取上述三种行为的三帧图像进行Hu不变矩向量的描述,其结果记录于下表中。
人体行为第一帧图像第十帧图像第十五帧图像
通过对表1中Hu不变矩特征量分析,可以看出对于某一人体行为特征其Hu不变矩特征量分布较为集中,这样我们便可以通过设定某一阈值来判断两幅图像中的人体行为是否属于同一类行为,然后再通过与标准特征图像的对比进而判断该行为是否为异常行为。
五、结论
本文介绍了运动中人体行为分析技术的主要实现方法和算法,详细阐述了基于Hu不变矩的行为分析方法,通过实验提取图像的Hu不变矩实现了对运动人体行为特征的分析研究,实验证明该方法的可以有效的进行人体行为识别。
参考文献:
[1]张家广.计算机图形学[M].北京:清华大学出版社,1998.510—520
[2]WilliamKPratt.DigitalImageProcessing[M].北京:机械工业出版社,2005.360—373