您好,欢迎来到百家汽车网。
搜索
您的当前位置:首页基于双目立体视觉的距离测量

基于双目立体视觉的距离测量

来源:百家汽车网
分类号:——UDC:密级:编号:基于双目立体视觉的距离测量RANGEMEASUREMENTBASEDoNBINoCULARSTEREoⅥSIoN学位授予单位用代码:筮壹堡王太堂(!Q!璺盟学科专业名称用代码:堂堂王猩(Q璺Q3QQ2申请学位级别:亟±研究方向:堂皇测蕉筮苤丞堡墨答辩委员会:旦地指导教师:扬堂坐论文评阅人:垒查蝗研究生:崔蚩一论文起止时间:星QQ5:璺二呈QQ鱼:!!强苤£摘要立体视觉技术是机器人技术研究中最为活跃的一个分支,是智能机器人的重要标志。双目立体视觉是通过对同一目标的两幅图像提取、识别、匹配和解释,重建三维环境信息的过程。主要包括:视频捕获、摄像机定标、图像预处理和特征提取、立体匹配以及三维重建。通过对双目立体视觉技术的进一步研究,对多目视觉具有重要的启发,为解决智能移动机器人、工业装配机器人、家用机器人、公共服务机器人的视觉问题奠定良好的技术基础。计算机立体视觉的主要研究内容是由多幅二维的平面图像恢复出被摄物体的三维坐标,而其中基于两幅图像的双目视觉技术则是一个研究热点。双目立体视觉的基本原理是模仿人眼与人类视觉的立体感知过程,从两个视点观察同一景物,以获取不同视角下的感知图像,通过三角测量原理计算图像像素间的位置偏差,以获取景物的三维信息。一个完整的双目视觉系统通常可分为图像获取、摄像机标定、特征提取、立体匹配、目标定位和深度图生成等六大部分。本论文主要是图像特征提取、立体匹配这两方面的内容展开研究。首先根据选择的立体视觉成像系统模型阐述了立体视觉测距的基本原理。其次,对图像特征提取等预处理方法进行详尽地分析,通过实例对算法进行实验。同时,对图像匹配问题涉及的内容包括图像匹配方式、质量控制策略等进行了总结。最后,以特征提取与图像匹配研究为基础,针对不同类型的立体图像提出了基于图像边缘特征和图像兴趣点的匹配方法。关键词:立体视觉摄像机定标特征提取立体匹配深度图ABSTRACTStereovision.anactivebrunchofrobotictechnology,isoneimportantattributeofintelligentrobot.Binocularstereovisioncanbedefinedastheprocessoftri.dimensionalreconstructionthroughtheabstraction,identification.matchingandinterpretationoftwainimagesgatheredfromidenticalobjective,mostlyinclude:videofrequencytrapping,camelAcalibration,imagepreprocessing,featureextraction,stereomatchingandtri.dimensionalreconstructionaswell.Itisthroughfurtherresearchofbinocularstereovisionthatwecanbringimportantenlightenmenttomulti—eyevisionsystemandpresentsupportingtechnologyforvisualproblemofintelligentlocomotiverobot,industryassemblingrobot,domesticrobotandcommunityservicingrobot.StereovisioniStoreconstructthethree.dimensionalCOOrdinateofanobiectfromsomeofitstwo.dimensionalimages.Generally,onewouldliketoreconstructtheobiectinthree.dimensionalsic}acewithonlytwodifferentviewpoints.Thefundamentalprincipleofcomputervisionwithdual.camerashaveastrongresemblancetothevisnalperceptionprocedureofmankind.WeCallgetdifierentimageswithtwodifferentviewpointsandthencalculatethepositiondeviationofimagespixelsbasedontriangularmeasure.FinallyweCallreconstructthethree.dimensionalCOOrdinateoftheobject.Theintegratedbinocularstereovisionsystemgenerallyineludesimageacquisition.cameracalibration、featuresextraction、stereomatching、0bjectlocationanddeDthmapconstruction,ete.TbefeatnresextractionandthestereomatchingiSmainlydiscussedintllisfundamentalPaDer.First,weelaboratetheprincipleofmeasuredistanceinstereovisionbasedoncameramodeling.Second,thepapergivestheelaborateanalysisonpreprocessingmethodssuchasfeamresextraction,andvrifiesthealgorithmsbyexample.Furthermore,itsummarizesthecontentofstereomatchingsuchasmatchmethod,thestrategYofmatchqualitycontr01.Finally,wesubmitthematchalgorithmbasedonimageedgefeaturesandmatchalgorithmbasedontheimageinterestingdotbyfeataresextractionandimagematching.Ke,,words:StereovisionCameraea]JbralionFeatureExtractionStereomatchingDepthmap长春理工大学硕士学位论文原创性声明本人郑重声明:所呈交的硕士学位论文,《基于双目立体视觉的距离测量》是本人在指导教师的指导下,进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。作者签名:整垄三!显年—王月—丝日长春理工大学学位论文版权使用授权书本学位论文作者及指导教师完全了解“长春理工大学硕士、博士学位论文版权使用规定”,同意长春理工大学保留并向国家有关部门或机构送交学位论文的复印件和电子版,允许论文被查阅和借阅。本人授权长春理工大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,也可采用影印、缩印或扫描等复制手段保存和汇编学位论文。作者签名:垒垄指导导一:埠烨年』鱼日丝2旺月鱼日第一章§1.1引言绪论视觉是人类观察世界、认知世界的重要功能手段,人类感知外部世界主要通过视觉、触觉、听觉和嗅觉等感觉器官,其中80%的信息是由视觉获取的,机器视觉是人类利用计算机实现人的视觉功能一对客观世界三维场景的感知、识别和理解,机器视觉是一个相当新而且发展迅速的研究领域,机器视觉技术正广泛地应用于各个方面,许多人类无法感知的场合,如危险场景感知等,机器视觉更突显其优越性。机器视觉属于影像的重构技术,具有非接触性测量、实施简易的特点,具有广阔的应用前景,是有待于进一步开发的领域。计算机视觉被认为是计算机科学和人工智能的一个分支,计算机视觉就是用机器代替人的眼睛和大脑,对客观世界进行感知和解释的技术。该系统的首要目标是使计算机具有通过一幅或者多幅二维图像认知周围的三维环境信息的能力。这种能力不仅可以使计算机能够感知三维环境中物体的几何信息,并且能够对它们进行描述、存储并使用图像来创建和恢复现实世界模型,从而达到认知现实世界的目的。因此,自从计算机视觉这门科学出现以来就成为计算机科学的重要研究领域之一并且发展十分迅速。现实世界中的物体都是三维的,人眼所获得的景物图像却是二维的,但是人类的视觉系统能够很容易地从二维图像中感知三维世界,获得三维世界的信息。机器人视觉的研究目标就是使机器人具有通过一幅或多幅图像认知周围环境信息的能力。这种能力不仅使机器人能感知环境中物体的几何信息,如其形状、位置、姿态、运动等,而且能对它们进行描述、存储、识别与理解。机器人视觉系统的基本结构如图1.1所隋。图像低层处理位置与形状物体描述图1.1机器人视觉系统基本结构§1.2国内外研究现状、发展趋势§1.2.1国内外研究现状立体视觉的开创性工作是从60年代中期开始的。70年代末,Marr创立的视觉计算理论对立体视觉的发展产生了巨大影响,现已形成了从图像获取到最终的景物可视表面重建的完整体系,在整个计算机视觉中已占有越来越重要的地位。现在,国际上以计算机视觉为主题,或主要以计算机视觉为主题的国际会议有国际计算机视觉会议(ICCV),国际模式识别会议(ICPR),国际计算机视觉与模式识别会议(CVPR),欧洲计算机视觉会议(ECCV)与亚洲计算机视觉会议(ACCV)。以计算机视觉为主要内容之一的国际刊物也很多,有InternationalJournalofComputerVision,IEEETrans.OnPAMI,CVGIP(ComputerArtificialVision,GraphicsandImageProcessing),VisualImagePaUemRecognitionComputing,UPRAI(IntemationalJoumalofandIntelligence),PatternRecognition等,每年的研究论文不下数千篇,发表的论文也数以百计。在Marr理论的框架下,取得了一大批科研成果,也包括数据结构、算法层次上的各种算法和在硬件实施方面的一些实验系统。但这些理论、方法、算法在实际应用中并没有产生能完全取代人的视觉系统。双目体视目Iii『主要应用于四个领域:机器人导航、微操作系统的参数检测、三维测量和虚拟现实。在国外,日本大阪大学自适应机械学院研制了一种自适应双目视觉伺服系统,实现了对运动方式未知的目标的自适应跟踪。日本东京大学将实时双目立体视觉和机器人整体姿态信息集成,开发了仿真机器人动态行走导航系统。日本冈山大学使用立体显微镜、两个CCD摄像头、微操作器等研制了使用立体显微镜控制微操作器的视觉反馈系统,用于对细胞进行操作,对钟子进行基因注射和微装配等。麻省理工学院计算机系提出了一种新的用于智能交通工具的传感器融合方式,由雷达系统提供目标深度的大致范围,利用双目立体视觉提供粗略的目标深度信息,结合改进的图像分割算法,能够在高速环境下对视频图像中的目标位置进行分割。在国内,浙江大学机械系完全利用透视成像原理,采用双目体视方法实现了对多自由度机械装置的动态、精确位姿检测:东南大学电子工程系基于双目立体视觉,提出了一种灰度相关多峰值视差绝对值极小化立体匹配新方法,可对三维不规则物体(偏转线圈)的三维空间坐标进行非接触精密测量。哈工大采用异构双目活动视觉系统实现了全自主足球机器人导航。火星863计划课题“人体三维尺寸的非接触测量”,采2用“双视点投影光栅三维测量”原理,由双摄像机获取图像对,通过计算机进行图像数据处理,不仅可以获取服装设计所需的特征尺寸,还可根据需要获取人体图像上任意一点的三维坐标。§1.2.2发展趋势20世纪70年代中期以Matt、Barrow和Tenenbaum等人为代表的一些研究者提出了一整套视觉计算的理论来描述视觉过程,其核心是从图像恢复物体的三维形状。在视觉研究的理论下,以Marr的理论影响最为深远,并成为这一领域的主导思想IlJ。马尔教授认为:视觉可分为三个阶段。第一阶段是早期视觉(earlyvision),其目的是拍取观察者周围景物表面的物理特性,如距离、表面方向、材料特性(反射、颜色、。纹理)等,具体来说包括边缘检测、双目立体匹配、由阴影确定形状、由纹理确定形状等。第二阶段是二维半简图(2.5Dsketch)或本征图像(IntrinsicImage)。它是在以观察者为中心的坐标系中描述表面的各种特性。根据这些描述,可以重建物体边界,按表面和体积分割景物。但在以观察者为中心的坐标系中只能得到可见表面的描述,得不到遮挡表面的描述,故称二维半简图。第三阶段是三维模型一视觉信息处理的最后一个层次,是用二维半简图中得到的表面信息建立适用于视觉识别的三维形状描述。这个描述应该与观察者的视角无关,也就是在以物体为中心的坐标系中,以各种符号关系和几何结构描述物体的三维结构和空问关系。经过近三十年的发展,在马尔的理论框架下,机器人立体视觉取得了一大批成果。但随着机器人立体视觉研究的不断深入,大们发现了马尔视觉理论的局限性,即从景物图像或系列图像求出景物精确的三维几何场景并定量的确定景物中物体的性质时遇到了困难121。在Marr的理论中,输入是被动的,给什么图像系统就处理什么图像,整个处理过程基本上是“自底向上”的,没有反馈。处理的目的是不变的,总是要求出场景中物体的形状和它们的空I’日J位置和关系。其理论强调表示的重要性以及从不同层次上去研究信息处理问题,在计算理论和算法实现上又特别强调计算理论的重要性。这些理论多数是建立在对人类感知三维信息分析的基础上。尽管这些方法在数学上是可行的,但由于各种干扰的存在以及逆成像的问题,使得问题本身是病态的。进入80年代中后期,随着移动式机器人立体视觉研究的发展,大量运用空间几何的方法以及物理知识来研究双目立体视觉,其主要是完成对道路和障碍的识别处理。这一时期引入主动视觉的研究方法,并采3用了距离传感器以及视觉融合技术等,由于这种研究方法可直接取得深度图或通过移动获取深度图,因而使很多病态问题变成良态的。此外在视觉的研究中重视了对定性视觉、有目的的视觉等的研究。上述这些理论和方法的研究有力地促进了相关应用的发展,这些应用领域包括对照片特别是航空照片和卫星照片的解释、精确制导、移动机器人立体视觉导航、医学辅助诊断、工业机器人的手眼系统、地图绘制、物体三维形状分析与识别以及智能人机接口等【3】【4】。在立体视觉的应用方面不乏成功的例子。如1996年闩本成功研制出利用双目视觉来指导机械手动作的樱桃番茄收获机器人等151。立体视觉经过二三十年的研究,已经有了很大的发展。从当前的发展来看,计算机视觉的发展动向可以归纳如下:(1)以全面的观点将立体视觉系统的各个模块联系起来,充分挖掘内在信息。(2)由传统的两视点立体视觉向多视点立体视觉并从完全静态的立体视觉向动态立体视觉发展,通过增加信息输入降低视觉计算的难度。(3)立体视觉系统逐渐向智能化方向发展,研究基于知识的、模型的和规则的立体视觉方法。(4)算法从以前的串行处理向并行处理发展,采用并行流水线机制和专用的信号处理器件,增强立体视觉系统的实用性。(5)由专用的视觉系统向通用的系统发展。强调场景与任务的约束,针对不同的应用目的,建立有目的的和面向任务的立体视觉系统。随着计算机科学的飞速发展,VLSI技术的提高,并行处理机的深入研究,立体视觉研究的前景逐渐显现出来。可以预见,计算机视觉、生物物理等多学科专家通力合作,必将在立体视觉的研究中取得丰硕成果。与人类自身的视觉器官相比,目|;{『的立体视觉系统还很不健全,还处在一个十分不成熟的阶段,计算机立体视觉系统的研究面临着一系列技术难点州:(1)立体视觉系统在分析和理解图像时都需要立体匹配,而这一技术还很不完善。在具有灰度失真、几何失真(透视、旋转、缩放等失真)和噪声的情况下匹配图像是十分困难的。目前还没有一个可靠的通用的匹配方法。尤其在失真和噪声比较严重的情况下,匹配更为困难。而现实世界中物体问的相互遮挡,物体本身各部分问的遮挡更增加了图像匹配的难度。4(2)人类视觉系统具有惊人的分析理解力,人是如何精确获取视觉知识的,至今还末研究清楚。由于视觉信息具有很高的冗余度,选取哪些特征可以解决立体视觉问题,目前尚无一种通用的方法以尽量减少视觉信息的冗余度,提高算法效率。(3)立体视觉系统所需的计算量是非常庞大的,对于一幅标准的航空摄影照片(3000X3000),只用一个3×3的算子对其进行一次卷积运算就相当于108次乘法运算。然而实用的系统对时间的要求是有一定的。在现阶段集成电路和特殊功能部件的发展还不能满足实时性的要求,这为立体视觉系统完全变为实用的通用系统设置了一大障碍。§1.3双目立体视觉系统概述生物功能的模拟是现代机器人视觉的最大挑战17J。从二维灰度图像中获得三维深度信息、是机器人视觉中发展最迅速的领域。基于深度识别目的具有代表性的方法有:立体对计算深度、运动中计算深度、光流中恢复深度等。立体对深度计算就是利用双目立体视觉来完成深度识别的。双目立体视觉(也称双目视觉)是用两台性能相同、位置固定的CCD摄像机,获取同一景物的两幅图像,计算空|'日J点在两幅图像中的“视差(disparity)”,以此确定场景的深度信息,进而构建场景的三维结构。一套完整的双目立体视觉算法可分为六个主要部分:图像获取、摄像机定标、特征提取、立体匹配、深度计算及深度信息内插I“。在一个典型的双目立体视觉系统中,两摄像机沿基线放置,其光轴相互平行,空间点的像分别在左右两个像平面上的投影位置的『日J距称为视差。由视差计算深度是非常容易的,但视差本身的计算是立体视觉中最困难的部分,它涉及到模型分析、摄像机定标、图像预处理、特征选取及特征匹配。在机器人双目立体视觉系统的硬件结构中,目前通常采用两个CCD摄像机作为视频信号的采集设备,通过专用图像采集卡与计算机连接,把摄像机采集到的模拟信号经过采样、滤波、量化,最终提供给计算机图像数据。而当置于移动机器人上的摄像机光心平行放于~条直线上时,构成平行双目立体视觉系统,这是最简单最典型的一种情况,通过对它各个部分的几何关系的分析,我们可以获取目标场景的深度信息。机器人双目立体视觉系统的软件结构包括计算机操作系统及其应用软件、视觉处理算法、机器人控制软件。其中视觉处理算法的范围十分广阔,根据应用目的的不同,可包括图像输入处理、摄像机定标算法、图像预处理(滤波、边缘提取等)、特征选取、图像匹配、深度识别、深度图生成等。目前,在机器人立体视觉中摄像机定标、立体匹配是最为活跃的研究分支。这两部分关系到移动机器人定位的准确性和目标跟踪的精度。另外,深度图生成技术的快速发展,为三维场景的生成及深度可视化提供了技术支持。§1.4数字图像处理及关键技术图像处理是一个发展比较成熟的领域,图像处理通常是把一幅图像变换成另一幅图像,也就是说,图像处理系统的输入是图像,输出仍然是图像,信息恢复任务则留给人来完成。图像处理包括图像增强、图像压缩和模糊校正与非聚焦图像等内容。机器视觉系统把图像作为输入,产生的输出为另一种形式。比如图像中物体轮廓的表示。因此机器视觉的重点是在人的最小干预下,由计算机自动恢复和识别场景信息。图像处理算法在机器视觉早期阶段起着很大的作用,它们通常被用来增强图像特定信息并抑制噪声。人工智能(artificialintelligent,AI)涉及到智能系统的设计和智能计算的研究。在经过图像处理和图像特征提取过程后,接下来要用人工智能方法对场景特征进行表示,并分析和理解场景。人工智能有三个过程:感知、认知和行动。感知是把反映现实世界的信息转换成信号,并表示成符号,人只是对符号进行各种操作,行动则把符号转换成影响周围环境的信号。人工智能的许多技术在机器视觉的各个方面起着重要的作用。事实上机器视觉常被视为人工智能的一个分支。人工神经网络(artificialneuralnetworks,ANNs)是一种信息处理系统,它是由大量简单的处理单元(称为神经元)通过具有强度的连接相互联系起来,实现并行分布式处理。人工神经网络的最大特点是可以通过改变连接强度来调整系统,使之适应复杂的环境,实现类似人的学习、归纳和分类等功能。人工神经网络己经在许多工程技术领域得到了广泛的应用。神经网络作为一种方法和机制将用于解决机器视觉中的许多问题。现实世界是三维的空间,经摄像机成象后,成为丢失了距离信息的二维图象。然而,在计算机技术高速发展的今天,许多智能系统需要感知周围环境的三维信息。至今,研究人员提出多种从二维图象中恢复三维信息的方法p1。以Marr[”1的计算视觉理论为基础的双目体视方法就是其中的一种重要的方法。双目立体视觉系统有多个部分组成。立体匹配是最为关键的技术,匹配结果的优劣直接影响系统的最后输出。6§1.4.1双目体视的几何关系[Ill双目体视系统的成象几何关系如图1所示。系统采用双相机平行光轴成象,图ZR体视基线b图1.2双目体视几何关系图中,L、厶分别表示左右象平面,,代表焦距,b是左右图象坐标系的原点仉、D。间的距离,称为体视基线。设世界坐标系∥(J,Y,z)的3个坐标轴分别与左图象所在坐标系c。(以,圪,z。)的3个坐标轴重合。兄(z,,乃,z』),最(x,,Y,,z,)分别表示三维空间中的一点P(x,Y,Z)在左右象平面上的投影象点,投影线P0,和PD。所确定的平面被称为核心平面。该平面与左右象平面的交线为核心线。所以,左图中核心线上的一点,其右图中的对应点也在核心线上。利用核心线的这种几何关系,可以使得匹配过程极大的简化。§1.4.2立体匹配立体匹配是寻求同一空间景物在不同视点下投影图像的像间的一一对应关系。与普通的图像模板匹配不同,立体匹配是在两幅存在视点差异,几何、灰度畸变和噪声干扰的图像|'日J进行,不存在任何的标准模板。立体图像匹配的主要困难在于图像之间不可避免地存在着差异。造成图像之问存在差异的原因有很多,概括起来包括以下几种:灰度差异:由于成像角度的不同及照明条件的变动,使景物表面上7某点在不同成像平面上的投影点的灰度值产生较大的差别。遮挡效应引起的差异:现实景物之间,不可避免地存在着视线的遮挡效应,景物被遮挡的部位和遮挡的程度会随着视角的不同而改变。特征抽取结果的差异:发生在立体像对特征之间的匹配是以图像特征提取为基础的,所以当两幅图的不同部位的反差存在差异时则会在反差弱的区域产生特征丢失的现象。丢失特征部位和丢失特征程度的差异给图像匹配带来了很大的困难。噪声引起的差异:由于成像系统和图像预处理技术远非理想,在每个环节都会引进虚假噪声,并且对两幅图像的损害程度可能不同,所以噪声也是引起图像匹配出错的重要原因。由于这些难点,至今并无通用的匹配算法,各种算法都只是针对匹配技术的特定问题进行探讨,并且都有自己的限定条件。但是,在图像匹配过程中,各种算法都采用了各种匹配约束条件和匹配质量控制策略,以提高匹配质量,确保获得好的匹配结果。§1.4.3基本约束为了帮助建立像素间的对应,已提出了许多约束,来减少搜索的范围和确定正确的对应。下面是一些最重要的约束。(1)外极线约束如图1.2所示,投影线PD。和P0。所确定的核心平面与右象平面的交线称为左图像平面上那点最的外极线。容易看出,无论与最对应的点P是远是近,它总在那条外极线上,所以,对任一点最,只要在它的外极线上去找它的对应点斥,这就是外极线约束。它大大了搜索对应点的范围,是立体视觉中最基本的约束。特别,如图1.2所示的成像系统模型,左右摄像机的光轴平行,x轴一致,并且摄像机的水平扫描线位于同一平面时的简单情形时,左图像上一点只(x,,Y,,z,)外极线就是Y,=Yt。(2)相容性约束对应的特征,应有相同的属性,这一约束的具体含义随选用的特征及其属性不同而有所不同。(3)唯一性约束除了极个别的情况,一幅图像(左或右)上的每个特征只能与另一幅图像上的唯一的一个特征对应。(4)连续性约束由于物体表面一般是平滑的,因而它们的偏差一般也是平滑的,在物体边界处的深度不连续的地方除外。(5)灰度匹配约束同名像点灰度应相同或相近。(6)顺序约束景物在左右影像点的投影顺序应一致。§1.4.4匹配的实现从立体匹配实现的技术上考虑,立体匹配可以分为基于区域的匹配和基于特征的匹配,由于基于特征的匹配不直接利用灰度值进行匹配,而是利用由灰度信息抽象得到的图像特征进行匹配。因此这种匹配技术具有对外界的变化不敏感、稳定性好、精度高、匹配速度快的优点,所以获得了较广泛的应用。基于图像特征的匹配方法的匹配基元为从灰度图像中获取的景物的抽象特征,通过强调空间景物的结构信息来解决匹配歧义性问题。该类匹配方法的匹配基元一般是经过处理后的图像边界点、直线、曲线或线段的组合、轮廓、区域等。这些特征都对应着图像灰度变化剧烈的像素位置,通常与三维景物的几何结构相对应,因而它们具有较强的抗干扰能力和较精确的空间几何关系。零交叉匹配基元以及多通道协同处理方式对立体视觉的发展起了巨大的推动作用。1976年Marr基于其理论建立了模拟人类立视机制的匹配算法[121,该算法的核心是首次采用多分辨率V2G零交叉点作为匹配基元,利用零交叉分布特性和由粗到细引导的多通道协同匹配技术来解决匹配的歧义性和搜索空间大的问题。Bakert”1和Arnoldt“I等提出以边缘点为匹配特征的匹配算法,并在匹配时首次采用了动态规划技术,将左右图像同一扫描线上的匹配特征,分别等效为动态规划的阶段与状态,通过在二维规划平面上搜索最佳路径得到最优的匹配。已知立体成象模型和匹配视差后,三维距离的恢复是很容易的。影响距离测量精度的因素主要有摄象机标定误差、数字量化效应、特征检测与匹配定位精度等。一般来讲,距离的测量精度与匹配定位精度成正比,与摄象机基线长度成反比。增大基线长度可改善距离测量精度,但同时会增大图像问的差异,增加匹配的困难。因此,要设计一个精确的立视系统,必须综合考虑各方面的因素,保证各个环节都具有较高9的精度。§1.5课题主要研究内容立体视觉的基本原理是从两个(或多个)视点观察同一景物,以获取在不同视角下的感知图像,通过三角测量原理计算图像象素间的位置偏差(即视差)来获取景物的三维信息。这一过程与人类视觉的立体感知过程是类似的。一个完整的立体视觉系统通常可分为图像获取、摄象机定标、特征提取、立体匹配、深度确定及内插等6个大部分。本课题的研究涉及到计算机视觉与图像理解,属于模式识别与人工智能领域。利用低层图像处理技术对双目图像进行分析,选择图像对中的目标特征井求解特征间的对应关系,通过图像匹配技术得到目标视差,从而转化为主体所需的深度信息。本课题沿着“图像获取一图像分割—特征提取一图像匹配一距离确定”这一主线,分层次地总结、分析了各个子阶段的相应问题和处理方法,并将本课题的重点集中于特征提取与图像匹配这两部分。(1)图像预处理立体视觉研究的对象为二维图像。由于各类图像系统中图像的传送和转换常造成图像的某些降质,如图像不清晰或发生畸变,不利于图像的特征提取,从而影响目标的定位和分析。应通过合适的图像预处理方法对图像进行滤波处理,以便于特征提取。(2)图像特征提取图像特征是景物的物理与几何特性在影像中的反映,理论上是灰度曲面的不连续点。图像特征可分为点状特征、线特征、边缘特征和面特征,为自动量测感兴趣的目标特征,必须借助于相应的图像特征提取方法,即利于一定算法提取构成明显目标的图像特征。图像特征的提取是图像分析和图像匹配的基础,也是单目图像处理的最重要的任务之一。(3)双目视觉图像分析①双目视觉中的成像系统模型的选择双目视觉分析中的成像系统模型大致可分为两种:双目横模型结构和双目轴模型结构。模仿人眼的双目线索感知距离的方法,本课题确定了双目横模型结构,并分析了双目横模型结构的基本几何及其固有的问题。②图像匹配在图像特征提取与描述的基础上,即可进行图像的配准工作,即根据选取的匹配特征,在左、右视图中匹配这些特征。图像配准的主要研究内容包括特征类型的选择、匹配准则、选取有效的匹配控制策略等关键问题。选取合适的特征并准确匹配这些特征,才能得到比较准确的目10标视差图,从而恢复目标的三维信息,实现信息重建。③求取目标点的距离通过特征选取、图像匹配,利用视点几何即可求取目标点的距离。第二章图像获取三维计算机视觉系统应能从摄像机获取的图像信息出发,计算三维环境物体的位置、形状等几何信息,并由此识别环境中的物体。图像上每一点的亮度反映了空间物体表面某点反射光的强度,而该点在图像上的位置则与空间物体表面相应点的几何位置有关。这些位置的相互关系,由摄像机成像几何模型决定tlsl。该几何模型的参数称为摄像机参数,这些参数必须由实验与计算来确定,实验与计算的过程称为摄像机标定。本章主要介绍摄像机工作原理、摄像机模型、立体视觉的测量原理。§2.1摄象机工作原理摄像机是最常用的图像输入装置,它面向对象广泛,有输入速度快、灵敏度高、使用方便等特点。摄像机通常由摄像镜头、摄像器件、同步信号发生电路、偏转电路、放大电路、电源等部分组成。按照摄像器件的组成,可将摄像机分为很多种。目前计算机视觉系统中常用的是电荷耦合器件(ChargeCoupleDevice)摄像机,简称CCD摄像机,其工作原理是:在硅单晶片上,生成很薄的一层二氧化硅,再于其上蒸发一层间距很小的铝电极条。加电压于电极上后,电场穿透二氧化硅薄层,并排斥硅中多数载流子,从而在电极下的硅单晶片上形成电荷耗尽层,又称势阱。当硅改变电极电压,使势阱内的电荷从一个电极传送到另一个电极,取出这移动的电荷就形成输出信号。扫描系统顺序扫描各像素,在一个扫描周期内,用较长的时间感光、积累电荷,用极短的时间读取图像信号。由于图像各处的光亮不同,耗尽层内“捕捉”的电荷量形成差异,这就完成了图像的光电转换。§2.2摄象机模型在计算机视觉的处理中,常用到一些坐标系,下面先对坐标系进行介绍。(1)图像坐标系这是固定在图像上的二维坐标系,一般采用直角坐标系。通常将原点置于图像的左上角,其x轴向右,Y轴向下,此时的x坐标变为列数j.Y坐标变为行数i。如图2.1所示12O图2.1图像坐标系(2)观察者中心、坐标系又简称摄像机坐标系,是固定在摄像机土的三维直角坐标系。(3)图像平面坐标系在图像平面上的二维坐标系,一般采用直角坐标系。它与上面的图像坐标系之间存在一个线性变换的关系。(4)物体中心坐标系固定于场景中某物体上的坐标系,一般采用三维直角坐标系。而且通常将该物体的三个主轴选为坐标轴,将该物体的中心(或某个顶点)选为坐标系原点。这些坐标系之间的关系,特别是观察者中心坐标系与图像坐标系之间的关系的确定就是摄像机的标定问题。下面讨论摄像机的模型。我们要通过多个摄像机从不同方向拍摄两幅或两幅以上的二维图像,通常假定多个摄像机的参数一致,而且每个摄像机都被假设为一个理想的小机,也就是采用透视投影成像模型。图2.2小机模型小孔成像模型如图2.2所示,图中位于图像平面前距离为f的点被称为投影中心,由于图像平面位于投影中心的后面,这种小机模型又称为后投影模型。d,:fL摄像机模型不考虑透镜的畸变,在大多数应用场合,这种模型可以满足精度要求。§2.3立体视觉测距原理§2.3.1视差原理立体视觉是通过多幅图像获取物体三维几何信息的方法,对生物视觉系统,人们早就注意到,几乎所有具有视觉的生物都有两个眼睛,用两个眼睛同时观察一个物体时,会有深度或远近的感觉。双目立体视觉就是仿照这个原理,利用两台摄像机从不同角度同时获取同一景物的两幅图像,通过计算空间点在两幅图像中的视差来获取景物的三维坐标值。其视差测距原理116J,如图2.3所示,设C,、C,分别为左、右两个相机的光学中心位置(透镜中心),cf与C,之|’日J的距离为b,相机焦距为f。设物体上的点P在左、右相机图像平面上的投影点分别为毋、e,P与cfc,连线间的距离为d,*CI、C,分别向图像面(即视平面)作垂线,垂足分别为At,4,过P向图像面作垂线,垂足为B。令I爿一I=z。,阻只Flb,IP,.Bl=a。图2.3视差测距原理图14由相似三角形得生』:—Lda+tb(2.1)生』。垒二生±生±!d(2.2)b+厶+a由式(2.1)、(2.2)可得们等一厶代入式(2.1)得(2.3)拈fa+广l一盖由此可见距离d与b、f和L(2.4)厶有关,L一‘称为点P在左右两个图像面上的视差,两个图像相应的对应点只在水平方向存在视差,而Y方向的坐标值是相等的。对于固定的成像系统模型而言,参数b、f取值己经确定,仅需要对立体图像对求取对应像素视差即可获得景物的深度信息。§2.3.2双目视觉相机几何分析在双目视觉中的成像系统模型分析中,常见的有两种:双目横模型结构和双目轴模型结构。在双目视觉分析中,两相机不同的几何配置方法,将直接影响双目的共同视野、搜索的范围以及定位的精度等。双目横模型结构是指两个相机平行放置,而在双目轴模型结构中,两个相机与目标在同一条直线上。常用的成像系统模型为仿照人眼的双目横模型结构。用G和c。两个相机同时观察P点,并且如果我们能确定在G相机图像上的毋点与在q相机图像上的P是空间同一点P的图像点(称日、e为对应点),则空间点P既位于D』异上,又位于D,P上,由此P点是q毋和DrP两条直线的交点,即它的三维位置是唯一确定的。其关系如图2.4所示。cI。?图2.4用摄像机观察空间点关系式为llrl:制历R屹叱●lI—mⅢrm2imm:2埘:2硝:研k埘:3m羔m己肌223r所mm,¨●M●r叫81y(2.5)Z●rmr所坍2¨2M2并(2.6)m2玎2¨碗咳《m”2Z●其中:(%,v。,1)与(“:,V2,1)为另、只点在各自图像中的图像齐次坐标;埘:(七=1,2;i=l,2,3;j=1…234)分别为投影矩阵的第i行第j列的元16素。(x,Y,z,1)为P点在世界坐标系下的齐次坐标。可在上面两个公式中消去Zc。、ZcR,得到关于X,Y,Z的四个线性方程咿1,如下所示:@I研;l一肌∞z+@l肌312一所:2)l,+@lm,13一埘113)z=m141一“lmL(vl肌31l—所lli)x+(vIml2一刀吼i2)y+(vl聊33I—mli3)z=刀2k—vlm三(2.7)(“lm32l一历j)x+(%m322一所之)l,+(“l小玎2-m213)Z=所二一%聊“2(vl聊32I—mj)x+(vl所刍一肌之)y+(vlm332一mi3)Z=埘矗一v1聊324(2.8)式(2.7)的几何意义为过DfC的直线,式(2.8)为过D,只的直线。联立解得到的(X,Y,Z)即为点P的空间坐标。在相机的双目横模型结构设置中,由于两相机在水平方向相隔一定距离,所以存在以下问题:(1)利用横模型系统的一个固有问题是无法匹配点所引起的不IF确对应性。产生无法匹配点的原因有两种:一是目标元素不处于共同视野,只有一个像机的成像平面中有其投影;二是即使目标元素处于共同视野,一个像机平面中有其投影,而另一个像机的成像平面中,因为由别的目标元素所遮挡,不存在投影。在这两种情况下,对一幅图像选择这些投影点,而在另一幅图像中则找不到它的对应性。显然,减小像机之间的位移,可使其共同视野增加,出现上述情况的概率也随之减小。(2)在相机的双目横模型结构设置的另一个突出的问题是提高深度测量的精度与降低不正确对应性,对像机间的间隔AX有不同的要求。为了扩大共同视野,就要减少像机问的距离,这样距离测量的准确度就变差。当像机问隔At"=0时,问题不存在了,但是双目视觉也就随之消失了。反之,若增加像机之问的距离,则将增加深度测量的精度,而共同视野及不含糊匹配的概率也随之降低。§2.4小结本章介绍了计算机视觉系统中常用的CCD摄像机的工作原理,介绍了一些常用的坐标系并建立了摄像机的透视投影成像模氆,以立体视觉中的平行轴立体成像模型为例,分析了立体视觉测距原理,引出了立体匹配问题。7第三章基于机器视觉的图像处理技术的研究图像处理技术涉及到数学、计算机科学、模式识别、人工智能、信息论、生物医学等学科,是一门多学科交叉应用技术。本章主要研究Windows环境下图像显示、像素灰度提取、图像滤波和图像增强等技术。§3.1Windows位图图像在计算机中是用文件的形式存放的,常用的图像文件格式有BMP(WindowsBitmap)格式、PCX格式、GIF格式、TIFF格式、JPEG格式等【l”。VisualC++主要针对位图BMP进行处理,位图也是本文的主要研究图像,对于其它格式的图像,我们可以用图像处理软件如ACDSee把它转换成BMP格式。BMP格式的文件内容包括文件爻(~个BITMAPFILEHEADER数据结构)、位图信息数据块(位图信息头BITMAPINFOHEADER和一个调色板Palette)和图像数据ll”。对于用到调色板的位图,图像数据就是该像素颜在调色板中的索引值,对于真彩色图,图像数据就是实际的R,G,B值。§3.2像素灰度提取图像数字化时,物理图像被划分为称作图像元素的小区域,图像元素简称像素,最常见的划分是采用方形采样网格。在每个像素位置,图像的亮度被采样和量化,从而得到图像对应点上表示其亮暗程度的一个整数值。对所有的像素都完成上述转化后,图像就被表示成一个整数矩阵。每个像素具有两个属性:位置和灰度。位置由采样点的两个坐标决定,又称为行和列:表示该像素位置上亮暗程度的整数称为灰度。此数字矩阵就作为计算机处理的对象。图像处理的过程中可对像素灰度进行修改,处理后的结果由一个与数字化相反的逆过程显示出来,即用每个像素的灰度决定对应点在显示屏上的亮度。这样就转化成可视的、供人们解释的图像。在计算机中,常用一个字节(Byte)存储灰度信息,即灰度级为256级。如果图像的灰度级只有黑白两种,用一位(bit)存储,则称为二值图像。一般常用三原色(红色、绿色、蓝色)来产生彩色图像,即用(r,g,b)表示,其中r,g,b为颜色分量。还有一种用亮度、饱和度和色度来表示18颜色的方法,这里不介绍了。灰度图像的RGB三个分量的值相同,处理很方便。在256级灰度图中,图像数据一个字节就代表一个像素,如果灰度级是2级或16级,还要拼凑字节,比较麻烦.所以本文主要讨论256级灰度图。对于灰度图像,因为其RGB值相同,所以只要定义一个二维数组p[x][Y]即可,数组元素的值,也就是图像中每一点的灰度值,这个二维数组就是我们用计算机处理的对象,它和图像是一一对应的。一幅图像所有像素的灰度信息可以用灰度直方图来描述,灰度直方图是灰度级的函数,描述的是图像中具有该灰度级的像素的个数:其横坐标是灰度级,纵坐标是该灰度出现的频率(像素的个数)。计算灰度直方图的算法如下:for(i=O:i<height:i++)for(j=o:j<height:j++){k=p[i][j]:gray[k]++:)下图是实验中的一幅图像及其灰度直方图:19直方图给出了一个简单的指示,用来判断一幅图像是否合理的利用了全部被允许的灰度级范围,这对分析数字化的效果很有用。通过直方图还可以选择合适的灰度阈值,进行图像分割和边界提取。§3.3图像预处理由于各种噪声的干扰和影响,在对图像进行特征提取前需先进行图像的平滑滤波等操作,以消除噪声的影响。为了抑制数字图像中的噪声,需采用空间低通滤波器。低通滤波器不影响低频分量,但由于图像边缘轮廓包含多种高频信息,所以在抑制噪声的同时会使图像边缘变得模糊。若采用高频滤波器提取图像特征又会增强图像噪声。图像处理中解决该矛盾的手段多采用中值滤波法或复合型中值滤波法。图像预处理过程通常包括噪声消除、图像增强、边缘提取等过程。图像增强是指对图像的某些特征,如边缘、轮廓、对比度等进行强调或锐化,以便于显示、观察或进一步分析与处理[20l。图像增强不增加图像数据中的相关信息,但它增加所选择特征的动态范围,从而使这些特征检测或识别更加容易。图像增强的主要方法有:基于点运算的方法、基于空间运算的方法、基于频域运算的方法和彩色增强方法。基于点运算的图像增强方法属于时域处理方法,实际上是对图像的灰度级进行变换,使图像对比度得到调整,是一种点对点的变换。主要有以下几种:(1)灰度线性变换(2)灰度非线性变换(3)灰度切片变换(4)直方图修整基于空问运算的图像增强方法属于时域处理方法,是一种利用各像素及其邻近各点的像素值来判断该点是否含有噪声,并用适当的方法消除所发现的噪声的图像增强方法。主要有以下几种:(1)图像平滑(2)图像锐化(3)反对比度映射和统计比例尺度变换§3.3.1灰度变换(1)灰度线性变换假定原图像的灰度范围为[a,b],希望变换后的图像g(X,Y)的灰度范围为[c,d],可用下述变换来实现:g(x,力:—(d—-—c)_[f—(x—,y一)-a]+cD一口(3.1)如果己知图像的大部分像素的灰度级分布在区间[a,b],小部分像素的灰度级不在此区I’丑J内,下列变换也可改善图像的效果。下面是实验中的一幅图像及对其进行灰度线性变换后的图像:贴棚={警竹a≤f(x,y≤bf(x,y1<af(x,_y)>b(3.2)图3.2原图像及灰度线性变化图像2l(2)灰度非线性变换当用某些非线性函数,如对数、指数函数等作为映射函数时,可实现灰度的非线性变换。对数变换一般为:g(z,),)=a-t.—ln[—f_(x,_y)—+一1]/bⅡlC(3.3)这里a,b,c是可调参数。当希望对图像的低灰度区有较大的扩展而对高灰度区压缩时,可采用此变换。它能使图像灰度分布均匀,与人的视觉特性相匹配。指数变换的形式为:g(x,J,)=6。忡,’’一…一1这种变换能对图像的高灰度区给予较大的扩展。(3)灰度分层切片(3.4)此变换把输入图像中的某一段灰度范围值抽取出来,转换成最大灰度值。g(工'y)=ifMAXoa<f(x,y)<b其它(3.5)§3.3.2直方图修整直方图修整是指通过构造灰度级变换,改造原图像的直方图,使变换后的图像的直方图达到一定的要求。采用直方图修整可使原图像灰度级集中的区域拉开或使灰度分布均匀,从而增大反差,使图像的细节清晰,达到增强的目的Ⅲ】。设变量r代表要增强图像中像素的灰度级,假定r己经归一化,即0≤,≤l,,=0代表黑,r=l代表白。设新图像的灰度级为S,S与r的关系为s=T(r)。假定T(r)满足①0≤,≤l,T(r)单调增加;②0≤,≤1,0≤r(r)≤1。一幅图像中,每一像素点的灰度级r可看作是[0,1]区间上的随机变量。假定r是连续变量,则可用概率密度函数只(,)表示图像的灰度级分布,即c(r)=【PAw)dw表示的是图像中灰度级小于r的像素点的数目。设只(s)表示变换后的图像的灰度级概念密度函数。根据概率论的知识,只(,)与PAs)间应有下列关系:聃)=【只(,)为。1时(3·6)通过改变T(r)就可控制只(s)的形状。由于PAr)与PAs)刻划了图像的灰度级相对分布,因而选择适当的T(r)就可改变图像的外貌,这就是直方图修整法的基础。取T(r)为T(r)=【只(w)砒0≤,≤1(3.7)则易知只(s)=1。这说明,在变换后的变量S的定义域上,PAs)是一均匀分布的概率密度函数。在增强的意义下,这意味着像素灰度级的动态范围增加,对比或反差增大。在数字图像的情况下,灰度级r取离散值(丘;k=O,1…,L一1},L是灰度级的数目,则连续函数Pr(r)成为{PAr,);k=O,1…,L—1)。其中P(屹)=”。/n;n。是图像中出现%灰度级的像素的数目,11是图像中像素总数。变换s=T(r)成为:k"kSk=丁(唯)=∑詈=∑PAr);k=O,l…,L_1iII|(3.8)在上述变换下,数字图像的直方图将成为均匀分布形状,这一过程称为直方图的均衡化。其实质是减小图像的灰度等级以换取对比度的扩大,但由于在均衡化的过程中,原直方图上频次较小的灰度级被并入少数几个或一个灰度级,对应的图像部分将得不到增强。下面是实验中的一幅图像及对其进行直方图均衡化后的图像:图3.3原图像及其且刀闰均衡化图像§3.3.3图像平滑图像在生成和传输过程中常受到各种噪声源的干扰和影响而使图像质量变差,抑制或消除这类噪声而改善图像质量的过程称为对图像的平滑过程。图像平滑的方法主要有:(1)邻域平均法在领域平均法中,假定图像是由许多灰度恒定的小块组成,相邻像素间有很高的空间相关性,而噪声是统计的叠加在图像上的。因此,可用像素领域内的各像素灰度值的平均代替该像素原来的灰度值,实现24图像的平滑。根据求平均方式的不同,邻域平均法有如下几种主要形式:①简单平均法设图中某像素的灰度值为f(x,Y),它的邻域S为MxN的矩形窗口,则平滑后该点的灰度值为:7两j2去。磊。m,v)。高爱。窜(H咖埘一T”一T分布的,经过上述平滑后,信噪比可提高√^拼倍。(3’9)如果图像中的噪声是随机不相关的加性噪声,窗口内各点的噪声是②阈值平均法设原像素点的灰度值为f(x,Y),取以它为中心点M×N的大小的窗口,则平滑后的狄度置为:gc‘y,={;{耋;;若I,‘ty丢髫墨y’l>rcs·,。,T为给定的阈值,f(x,Y)的计算方法同简单平均法。这种算法对抑制椒盐(salt&pepper)噪声比较有效,同时也能较好的保护仅有微小灰度差的图像细节。③K一近邻平均法在一个M×N的窗口中,属于同一个物体的像素,它们的灰度值将高度相关。因此,窗口中心像素的灰度值可用窗口内与中心点灰度最接近的K个邻点的平均灰度来代替。一般而言,K值越小,噪声方差降低越小,但保持细节较好。较大的K值平滑噪声效果好,但也使图像模糊。④梯度倒数加权平均法通常图像在一个区域内的灰度变化要比区域之间的变化小,在边沿处的梯度绝对值要比区域内部的绝对值高。基于这样的假设,在一个M×N的窗口内,若把中心像素点与其它各邻点之间梯度绝对值的倒数定义为各邻点灰度平均时的加权值,则在区域内部的点,加权值大:而在一条边沿近旁的和位于区域外的那些邻点,加权值小。这种加权平均既可以使图像得到平滑,又不致使边沿和细节有明显模糊。具体算法如下:设点(x,Y)的灰度值为f(X,Y),在它的一个N×N邻域内,定义梯度倒数为[221:如彤叫丽专厕擞:嬲絮弘Ⅲ上式中f,J=一生≠,...,TN-1。k为一个大于1的数。定义一个归一化的权重矩阵w如下:一——i一,一。二二…咖;o'一争…“研1,一竿)…W=川∽"一V-,o)似五y;o,o)…晌t等'o)…w(x,y;N2-1·,N2-1.)毗炉掣,争…“‘y;0,—N=-一1)规定以工,y;o,0)=÷<1;对i,j不同时为0时,有:w∽y囊舻㈦]≤裟‰jJ桶为D∽吻平滑后的灰度值为:7翮=∑∑以,y;i,j)f(x+i,y+j)(3.13)(2)低通滤波法从频谱上看,噪声特别是随机噪声是一种具有较高频谱分量的信号。平滑的目的就是要通过一定的手段滤去这类信号。一个很自然的想法就是使图像经过一个二维的低通数字滤波器,让高频信息得到较大的衰减。在空间域上进行的这种滤波实际上就是对图像和滤波器的冲击响应函数进行卷积。设图像为f(x,Y),滤波器的冲击响应函数为H(x,Y),则卷积表达式为:g(u,v)=∑∑f(x,y归0一x+l,V—y-+1)在进行卷积之前,f(x,Y)和H(X,Y)都要进行延拓。常用的冲击响应函数有:(3.14)瞄[|}i]耻州]喊㈥采用日.作为滤波器,其效果和3×3窗口下的简单邻域平均法得到的结果类似。(3)中值滤波法中值滤波的思想是对一个窗口内的所有像素的灰度值进行排序,取排序结果的中|’日J值作为原窗口中心点处的像素灰度值。这种方法对脉冲干扰的抑制效果较好。中值滤波的关键在于选择合适的窗口大小和窗口形状。一般很难事先确定窗口的尺寸,通常的做法是从小到大进行多次尝试。窗口的形状可选为正方形,也可选为十字形。另一个重要的因素是算法的执行速度,由于每次都需要对窗口内的像素进行排序,因而必须有有效的快速算法。中值滤波器是一种非线性的空间滤波器。为了对一幅图像上的某个像素点作中值滤波处理,必须先将掩模内欲求的像素及其邻域的像素值排序,确定出中值,并将中值赋予该像素点。掩模的大小可根据情况而定,一般情况下可选用5×5的方形窗口,有时为了更好地保留图像的边角特征也采用交叉的十字型窗口。中值滤波器的主要功能是使拥有不同灰度的点看起来更接近于它的邻近值。事实上,是用聆×n的中值滤波器去除那些相对于其邻域像素更亮或更暗,并且,其区域小于"2/2(滤波器区域的一半)的孤立像素集。在这种情况下,将其像素值强制为邻域的中问亮度。下面是实验中的一幅图像及对其采用3×3矩阵窗口进行中值滤波后的图像。(图像含有椒盐(salt&pepper)噪声。)图3.3原图像及其中值滤波法平滑后的图像如上图所示,噪声被明显得消除了,图像质量得到了改善。§3.3.4图像锐化图像锐化的目的是增强图像中景物的边缘和轮廓。常用的方法有微分法、高通滤波法等【23l。(1)微分法在图像中,边缘是由灰度级和邻域点不同的像素点构成的。因而,若想增强边缘,就应该突出相邻点的灰度级的变化。微分运算可用来求信号的变化率,因而具有加强高频分量的作用。如果将其应用在图像上,可使图像的轮廓清晰。由于无法事先确定轮廓的取向,因而挑选用于轮廓增强的微分算子时,必须选择那些不具备空|’丑J方向性的和具有旋转不变性的线性微分算子。图像处理中最常用的微分方法是求梯度。对于图像f(x,y),它在点(X,y)处的梯度是一个矢量,定义为:矿苏可砂梯度的两个重要性质是:(1)矢量G(X,Y)指向函数f(x,Y)最大增加率的方向。(2)G(x,Y)的幅度表示在G的方向上每单位距离f(x,Y)的最大增加率。G(x,Y)的幅度定义为:GG,y)=(3.15)GM(x,y)=赙礤(3.16)对数字图像而言,微分运算一般用差分来代替。常用的差分形式有两种:(1)GM(x,y)“J/G,y)-f(x+l,y)I+lf(x,y)-f(x,y+l】(2)GMG,y)“l厂G,y)一f(x+1,y+l】+I,G+l,y)一.厂G,y+ll(3.17)(3.18)利用差分运算时,图像的最后一行和最后一列的像素的梯度无法求得,一般用前一行和前一列的梯度值近似代替。梯度算出后,有多种方法可产生不同的梯度增强图像。①让梯度图像的灰度值g(x,y)就等于该点的梯度幅度,g(x,Y)=Grd(x,y),这种方法的特点是增强的图像仅显示变化较陡的边缘轮廓,灰度变化较小的区域则呈黑色。②脚∽-{%’若喘净r,式中T是刊鼬阈值,适当选取T,有可能既不破坏平滑背景的特征,又强调了有效边缘。③是上一种的变化,它使gG,y)={厂GZo,y)若GM其(x它,ykr,式中厶是根据需要指定的一个灰度级,在这种图像中,有效边缘是用一个④螂∽《唑∥’若絮kr谢碾对背景规定的灰度值。⑤使g仁y)={乏若GM其(x它,y净r,得到二值图像,容易观察边f0—101%2l-l二,刮耻雕习凰=[÷!÷]用的冲击响应函数为日:=Ei三:1]。30图3.4原图像及其高通滤波法锐化后的图像§3.4小结对灰度图像进行特征提取等预处理过程是进行图像配准的前提条件。像素灰度提取和灰度直方图计算,可以得到图像中每个像素点的灰度值和所有点的灰度统计,以便进行灰度运算和为图像分割、边界提取选择合适的灰度阂值。图像增强的目的是使图像特征检测或识别更加容易,本章研究了灰度变换、直方图修整、图像平滑、图像锐化等图像增强方法,用Visualc++编程实现了其中一些算法,并给出了处理后的效果图。第四章图像特征点的提取图像的特征是指图像中可用作标志的属性。它有多种形式,可大致分为图像的统计特征和图像的视觉特征两类。图像的统计特征是一些人为特征,需通过变换才能得到,如图像的直方图、矩、频谱等。图像的视觉特征是指人的视觉可直接感受到的自然特征,如区域的亮度、纹理或轮廓等。利用这两类特征将图像分解成一系列有意义的目标或区域的过程称为图像分割。本章主要讨论图像的边缘检测技术和图像特征点的提取。§4.1边缘检测边缘是图像最基本的特征之一,包含了丰富的信息。边缘检测也是一种图像分割方法,在计算机视觉、图像分析等应用中起着非常重要的作用,是图像分析与识别的重要环节,同时,也是图像分析和模式识别的主要特征提取手段。所谓的边缘检测是指通过检测图像不同特性区域的边界来解决图像分割问题。与其它图像分割方法相比,边缘检测可以说是被研究的最多的一种分割方法。一般情况下图像边缘为图像灰度变化比较剧烈的地方,很自然地,我们可以联想到数学中的导数就反映了函数值的突变情况,在突变的地方求导数,可以得到绝对值较大的数值。很多传统的图像边缘检测算法都直接或间接的利用了这一思路…。经典的边缘提取方法是考察图像的每个像素的某个邻域内灰度的变化,利用边缘邻近一阶或二阶方向导数变化规律进行边缘检测。在一幅图像中,沿边缘走向的灰度变化平缓,而垂直于边缘走向的灰度变化剧烈。边缘点对应于一阶微分幅度最大的点,也对应于二阶微分的零交叉点。因此,利用一阶微分(梯度)最大值或一阶导数过零点提取边缘点就成为一种有力的手段,这种方法也称边缘检测局部算子法。最基本的边缘检测算子有Roberts算子、Sobel算子、Prewitt算子、Laplacian算子等。微分算子运算简单,但对噪声敏感、抗干扰性能差。§4.1.1传统的边缘检测算子边缘发生在灰度函数不连续的位置,可以适应灰度函数的一阶或二阶导数求得。直接使用导数运算判别边缘是不可取的,因为导数运算具有方向性。因此,我们经常需要的一种导数运算,能够保证各向同性。可以证明,偏导数的平方是各向同性的,即梯度幅度的平方。实际上,在图像处理中,梯度是经常被使用的一种微分运算。设图像为f(X,Y),则在点(x,y)的梯度矢量G[f(x,Y)]为‘2习:可GL厂G,y)】=缸彭砂(4.1)梯度具有两个重要的性质:(1)梯度的方向是函数f(x,y)最大变化率的方向。(2)梯度的幅度用G[f(x,Y)]表示,则G驴G,洲=肛蕊砑F瓯i函矿边缘检测算子。(1)一阶微分算子(i)Roberts算子图像函数f(x,Y)在点(x,Y)处梯度值的大小为(4.2)根据Ax厂G,y)、△,厂G,Y)的不同表示法,我们可以得到常用的几种gG,y)=赙礤(4.3)Roberts提出的算子是在2×2邻域上计算对角导数,图像点(X,Y)的梯度g(X,Y)的幅度是用方向差分的均方值来近似,即g(x,y)“RG,y)=√【厂G,y)一f(x+l,y+1)r+【厂G+l,y)一,G,y+1)】2(4.4)实际应用中,也可用gG,y)“RG,y)=『/(x,y)一f(x+l,y+ll+lf(x+l,y)一/(x,y+l】(4.5)来近似。Roberts算子的卷积核为l1.·o10②Sobel算子Sobel算子是在以点(x,Y)为中心的3×3邻域上计算X和Y方向的偏导数,即Sx=扩(膏+1,y+1)+2f(x+l,y)+厂G+1,J,+1弗一驴(x一1,Y—1)+2f(x一1,J,)+厂G一1,y+1))S,={f(x-l,y+1)+2f(x,J,+1)+厂G+1,y+1)}一扩(z一1,Y一1)+2f(x,Y—1)+厂G+l,Y一1)1其梯度大小为(4.7)(4.6)gG,y)*S=嗣或gG,y)zS=Is.I+Is,I一10l(4.8)Sobel算子的卷积核为—2O—1Ol一1一2—100Ol2l2这两种算子简单易用,边缘检测的效果较好[261。但要注意的是,由于Sobel算子先做加权平均,然后再微分,具有一定的噪声抑制能力,但检测到的边缘宽度至少为两个像素,所以在实际应用中还需涉及到边缘细化技术。③Kirsch算子对数字图像f(x,Y)的每一像素(x,Y),考察它的八个邻点的灰度变化,以其中三个相邻邻点的加权和减去剩下五个邻点的加权和,取其中差值的最大值作为Kirsch算子值。Kb,Y)=max(5S,-aT,)(i=0,1,2…,7)式中墨=三邻点之和,Z=五邻点之和。Kirsch算子的卷积核为(4.9)一3—3—3—3O555—3—3—3—305—355—3—3—3—3—30—3—35—355—3O5—3一3—3—3555—3O—3一3—35550—3—3—3—3—3—35505—3—3—35O55—3—3—3—3—3—3—3用这8个卷积核对图像中的每一个点进行卷积,每个卷积核对某个特定的边缘方向做出最大响应,所有8个方向中的最大值作为边缘幅度图像的输出。用一阶微分算子估计出梯度值后,将梯度值与给定的闽值比较,如果点(x,y)处的梯度值大于阈值,ⅢJl(x,y)为边缘点。显然,阂值的选择是很重要的,在含有噪声的图像中,闽值选择必须在丢失有效边缘和噪声造成的错误边缘之间折中考虑。(2)二阶微分算子Laplacian算子它是一种不依赖于边缘方向的二阶微分算子,它是一个标量而不是一个向量,具有旋转不变性即各向同性,在图像处理中常用来提取边缘。其表达式为:V2删=掣+掣其离散形式定义为也可写成f4.10)V2I(x,),)=L(x,y)=秒G+1,y)一i(x,y)】一【厂G,y)一I(x一1,J,Ⅻ+{【厂G,y+O—I(x,y)】一【厂G,y)一I(x,Y一1)B(4.11)L(x,y)=厂G+l,y)+,G一1,y)+厂仁y+1)+,G,Y—1)一4f(x,Y)(4.12)Laplacian算子的卷积核为0l0l-41O1O也可用11l11l1—81与前两种一阶微分算子相比较,二阶微分Laplacian算子对噪声更敏感,它使噪声成分加强,因此在实际使用中,常常先对图像进行平滑,再进行二阶微分。对blood图像进行实验,几种简单边缘提取算法提取效果对比如图4.1所示,其中,(a)为blood原图,(b)为Sobel算子边缘检测结果图,(c)为Robert算子边缘检测结果图,(d)为Kirsch算子边缘检测结果图,(e)为Laplacian算子边缘检测结果图。(a)原图像(b)Sobel算子(c)Robert算子(d)Kirsch算子(e)Laplacian算子图4.1原图像及其边缘检测效果图§4.1.2Marr的边缘检测算法图像的边缘是像素灰度值突变点,面图像的噪声常常也是这样的~类点。所以在使用上节的边缘检测算子时,图像的噪声点与边缘点同样被提取出来,这是我们不希望看到的。克服这~缺陷的一种可行的方法是首先对图像进行滤波,过滤掉那些孤立的噪声点,然后再进行边缘提取。Marr算法进行边缘检测的思路就是如此12'7]。设平滑滤波器的冲击响应函数为h(x),待处理的信号为f(x),则滤波后的信号为gG)=厂G)·^G)。然后,再对g(x)求一阶或二阶导数,就可以检测边缘点。注意到,卷积运算有以下性质:97(Ddi(之h(D=丢£/om—s№=j"sts;k’G—s拯=厂O)·h’G)(4.13)这样,就可以将卷积运算与微分运算合并,用平滑滤波器的一阶或二阶导数直接与图像卷积。检测厂b)+厅7G)的局部最大值或,G)t^’G)的过零点即可检测出图像的边缘点。这样,问题就转换到设计平滑滤波器上。平滑滤波器h(x)应满足以下条件:(1)当H斗。o时,矗G)_o为偶函数。(2)厂^Gk=1。(3)^b)一阶及二阶可微。常用的平滑滤波器为Gauss函数,即^G)=—击e吨己曩G‘2”,求解它的一阶和二阶导数都很方便,分别为:矗’G)2意e》噼击e刍睁)(4.14)他嘲38其中,盯为Gauss函数的方差,称为Gauss分布的空间尺度因子。口越小,则函数越“集中”仅在一个很小的范围内进行平滑滤波;反之,盯越大,则函数的滤波范围越大。但是随之又带来耨的问题:滤波范围太大,很多我们感兴趣的信号突变点也被平滑掉了。因此,选择合适的Er,对边缘提取的质量有着很大的作用。对于二维图像信号,Marr采用的平滑函数为二维Gauss函数,如下式所示:G(x,y):—l_exp|一三半l一2zw‘‘L2盯‘/厂一2..2、(4.16)它的一阶和二阶偏导数都是很容易求得的。但是,在进行图像边缘检测时,不能直接使用一阶和二阶的偏导数与图像进行卷积运算。这是因为,偏导数都带有方向性,只能处理某特定方向的边缘,而对其它情况为力。回顾我们在前面使用的方法,可能的一种处理手段是求沿着梯度方向的二维导数,但其为非线性,计算较为复杂。Marr提出用Laplacian算子来代替,这样得到边缘检测算子如下:Vg(x,y)=V2(GG,Y,盯)+/G,y))=Ⅳ2GG,y,盯))+/G,Y)(4.17)求V29(x,Y1的零交叉点就可得到图像边缘点。在上式中V2G(x,Y,盯)称为LOG(LaplacianofGaussion)滤波器㈣。由下式给出:VG㈨∽=詈+矿OG=专(瓮笋H一等](4.㈣Mart算法检测图像边缘的步骤即是用LOG滤波器与图像卷积,然后根据零交叉点位置来确定图像中边缘的位置。在具体实现图像f(x,Y)与v2G之间的卷积时应取一个Ⅳ×Ⅳ的窗口,由于V2G有无限尾长,因此所用的窗口不能太小,以免过分截尾。利用Marr算法对blood图像检测边缘的效果如图4.2所示:图4.2llarr算法边缘检测效果图§4.2边缘细化边缘细化的目的是将有一定宽度的边缘变窄,并保持其形状的拓扑结构不变,可以大大减少边缘的数据量。这里主要介绍Hilditch细化算法和Sobel细化算法。Hilditch细化算法适用于输入图像为0和1的二值图像。像素值为1的区域是需要细化的部分,像素值为0的区域是背景。Hilditch细化算法可描述如下:设P为被检测的像素,f(P)为像素P的灰度值,仃。(扛1,2,...,8)为P的8邻域像素,一。的位置如图所示。玎^鸭p疗2体确‰,厶飞图4.3像素P的8邻域设集合I={1)表示需要细化的像素子集,集合N={gIg一所≤o)表示背景像素子集,集合R=卜m)表示在第m次减薄时,I中被减掉的像素。图像细化的减薄条件为:(1),(p)∈,(2)u(p)≥1,其中u(p)=al+口3+a,+a7,这里口f为q,fI2tO/0。)∈N其它(3)矿扫)≥2,其中矿幻)=。∑ⅢO—d、J(4)矿(p)≥1,其中矿(p)=∑c,,这里q为铲器,姿窖7(5)x0)=1,其中工0)=∑包,这里匆为屯器确2¨k肼脚2。妊∽蜘2m沁~R(6),O。)薯矗或一0)=1,(f=3,5)'其中It0)表示对p的第i个邻域像素的x(p)。Sobel细化算法适用于边缘检测后的边缘图像,Sobel细化算法可描述如下:对边缘图作Sobel边缘检测可得到两侧的边界,边缘图像与对其进行Sobel处理后的图像相减可使波形更加尖锐,使边缘得到增强。这样即提高了定位的精度,又得到用其他方法难以得到的模糊边缘和微弱边缘。有些图像边缘比较模糊,边界区域的过渡极为平坦,用一次Sobel细化还不能达到要求,这时可重复2~3次。由于细化处理会使信号强度减弱,已达到细化要求的部分在后面的细化过程中使其保留原来结果,不需要再做处理。下面是blood边缘图及对其进行边缘细化后的结果。4l(a)原边缘图(b)Hilditch算法细化后边缘圈(c)Sobel算法细化后边缘图图4.3边缘细化效果图§4.3特征点的提取两眼立体视觉中左右眼图象的对应特征计算是立体视觉中很重要的问题。为图像上的每个象素找出对应点通常是不实际的。例如一幅图像上灰度相同的一个区域中的点可能与另一个图像上相应区域中的许多点对应。提取特征点就是为了解决这一问题从而实现唯一的匹配。如果对左右立体图象对的所有点都进行相关计算,其计算量将会同基于面积的匹配一样很大。为了提高处理速度,人们进行了大量研究。其中,Ohta陋1和LlogdE”I提出利用边界方向的对应特征性质减少对应候补的数目,然后通过加局部约束和重复使用概率松弛法提高对应计算的可信度。但这种方法在选择递推计算次数的评价函数时遇到困难。与此同时奥富和三浦分别提出利用不同观察点的两眼立体视数据的融合消除3D视觉信号中的模糊性。特征点的提取与它周围区域灰度变化有关。如果一个点的周围区域灰度级有显著变化,则有可能将此点作为特征点。找特征点实际上是对图像进行微分运算,对数字图像而言,微分运算可用差分来近似,设原图像为f【巧),特征图像为gO,J),则可选择下列三个定义式之一来确定微分值g(ij)。g㈨=√甭虿g(i,j)=IA,l+M’(4.19)(4.20)(4.20g(f,_,)=max{△Jl,M}黼△f-吾%,△,=蒡碣伪功第(4.19)式为原定义,由于要计算开方比较费时,(4.20),(4.21)式是其简化形式,一般考虑计算量的原因常采用(4.20)或(4.21)。通常方法是用一个对灰度变化敏感的算子作用到图像上,来提取特征点。常用的三种微分算子:Prewitt算子,Sobel算子,Roberts算子。特征图像g(iJ),可通过求算子g,来求,即:比护{厂%力蹀g(4.22)其中G为固定的阈值。通过改变G的大小,可以决定提取特征点的多少。提取特征点的另一方法是:先求得&,g,,按(4.20)或(4.21)式得到g(巧)的特征图像(梯度大小图像),而从矗(f,,)=gI/g,得到另一特征图像(梯度方向图像),将左图像与右图像相匹配,把满足(4.23)、(4.24)条件的点作为候选匹配点。Igl(f,j)-g,(j,州≤互(4.23)(4.24)阮(f,_,)一以(f,jI<T2其中瓦,L为固定的阈值。通过改变环L的大小,可以决定提取特征点的多少。在进行特征点提取时,一般方法是对二维图像中的每个象素作水平、垂直及对角4个方向的相关运算来确定特征点,计算量大1311。为此,文献[31]提出了只需对二维图像中的象素点作水平(或垂直)方向上的灰度差值运算的二维图像特征点快速提取算法。采用文献[31]对图像进行特征点提取,存在合理选择阈值问题,但在文献[31]中,对阈值的选取没有作详细的讨论。在机器视觉系统中,由于视觉系统的自主性能要求,因此必须进行自动阈值选择。图像中的特征点是某区域中具有较大灰度变化的点,特征点所有方向上的灰度方差通常比较大。典型的特征点检测算法有Bamard特征点选择算法和Harris角点检测算法。算法首先将大小为M×N的图像分为p×g个mx筇的窗口纾,厨。.,从每个小窗口中按要求选取一个特征点,最后对pxq个特征点进行选择,剔除特征不明显的点,或从中留下指定的K个特征点m1.在每个mx厅窗口中,求出每个像素四个不同方向上与相临像素灰度差的平方和。例如水平方向:sXi,.,)=k(f,-,)一g(f,J一1汗+k(i,,)一g(f,_,+1)r(4.25)其他还有:垂直方向s,(f,_,),左对角方向&(f,J),右对角方向墨。(f,J)。该点处方向平方和最小值为:oO,办=min{sXi,As,O,As。(i,As。(f,办(4。26)在片乙”小窗口内查找D(f,,)最大值点:0(I,,)2(1嚣甓.{∞,,)},得到的特征点(I,J)在四个方向上的灰度方差最小值是窗口内最大的,即该点的各个方向上的灰度变化最显著。移动玎0。的位置,不重复地对未覆盖区域继续处理,直到把整幅图像全部覆盖处理完毕,全部得到p×g个特征点.将所有的特征点按大小顺序排列,保留前K个特征点,得到特征点图。该特征点检测算法的优点是可根据原始图像的特点通过改变窗口既。的大小控制特征点的选择。下面是blood边缘细化图进行特征点提取后的结果。图4.3特征点提取效果圈§4.4小结对灰度图像进行特征提取等预处理过程是进行图像配准的前提条件。图像的特征是多种多样的,这就决定了特征提取方式的多样性。对于各种特定条件下的应用而言,没有普遍适用的特征提取方法。特征从小到人主要有点状特征、线状特征、区域特征等,根据特征的不同,对不同类型的特征特性和提取方法进行了全面的研究和比较。特征提取是为了得到匹配所需的图像特征。本章研究了基于微分算子的边缘特征检测方法,用VisualC++编程实现了多种微分算子检测算法,并给出了边缘检测结果,可根据实际情况选用不同的微分算子。第五章立体匹配机器人立体视觉是指通过分析和综合从不同视点捕获的两幅或多幅图像推得三维景物的几何形体结构。从信息处理的角度看,一个机器人双目立体视觉系统必须顺序解决如下两个问题:立体匹配和三维重建。三维重建的先决条件是建立两幅图像中图元的对应关系,即立体匹配。对于实际的立体图像对,求解其对应问题极具挑战性,可以说是立体视觉中最困难的一步。§5.1立体匹配立体匹配是寻找同一空间景物在不同视点下投影图像中像素间的一一对应关系。与普通的图像模板匹配不同,立体匹配是在两幅或多幅存在视点差异、几何和灰度畸变以及噪声干扰的图像对之间进行的,不存在任何标准模板。当空间三维场景被投影为二维图像时,受场景中诸多因素,如光照条件、景物几何形状和物理特牲、噪声干扰和畸变以及摄像机特性等的影响,同一景物在不同视点下的图像会有很大不同,要准确地对包含了如此多不利因素的图像进行无歧义的匹配。是颇为困难的。目前,对立体匹配的研究可归纳为两个方向:一个方向是从理解人类视觉的立体融合机制出发,试图建立通用的人类双目视觉计算模型。尽管已取得一些研究成果,但是就目前的研究而言,要构造出与人类视觉一样灵活的机器人视觉系统还有待于进一步的研究。另一个方向是从实际应用和要求出发,致力于建立适用于专门领域的和面向对象的实用立体视觉系统,通过强调场景和任务的约束等手段来降低视觉处理问题的难度,从而增加系统的实用性。立体匹配方法的有效性有赖于三个问题的解决,即选择正确的匹配特征、寻找相应的匹配准则以及建立能够正确匹配所选特征的稳定算法。立体匹配的研究基本上都是围绕这三个方面的工作进行的,并已出现了大量各具特色的匹配方法。但是由于立体匹配涉及的问题太多,至今仍未得到很好的解决,特别是在复杂场景中,如何提高算法的去歧义匹配和抗干扰能力,如何降低计算的运算量,仍需要进行更深入的探索和研究。§5.2立体匹配的内容对于任何一种立体匹配方法的设计,都必须解决以下三个方面问题:(1)基元选择:选择适当的图像特征作为匹配基元,如点、直线、区域、相位等;(2)匹配准则:将关于物理世界的某些固有特性表示为匹配所必须遵循的若干规则,使匹配结果能真实反映景物的本来面目;(3)算法结构:利用适当的数学方法设计能正确匹配所选基元的稳定算法。§5.2.I选择匹配基元匹配基元是指用以进行匹配的图像特征。由于立体成像的视点差异以及噪声干扰等因素的影响,要对图像中所有的像素都进行无歧义的匹配是很困难的,为此,应该选择能表征景物属性的特征作为匹配基元。目前,常用的匹配基元主要有:点状特征、线状特征和区域特征等。其中,点状特征是最基本、最简单的特征基元,区域基元具有最好的全局属性,线状基元(包括直线和曲线)介于二者之间。一般来讲,点状特征具有定位准确、检测和描述容易以及重建精度高的优点,但它所含图像信息较少,在图像中的数目较多,因而在匹配时需要较强的约束准则和匹配策略,以克服歧义匹配和提高运算效率。线状基元和区域基元则含有更丰富的图像信息,在图像中的数目较少,易于实现快速匹配。但它们在特征提取和描述时比较困难,需要进行复杂的预处理,而且定位精度较差。匹配基元类型的选择取决于匹配图像对本身的属性特点和应用要求。一般地,对于包含有大量非规则形状和高度突变的场景,如形状不规则、高度起伏变化大的山区、材料端口等,应选用点状特征作为匹配基元,因为在这样的场景中,要精确提取和描述诸如线段、区域等特征是非常困难的。由于景物结构的不规则性,其特征点的分布十分离散,此时若提取线状特征,用离散分布的特征点去近似连续线段,会引入大量的形状误差,而且不正确的连接还会造成重建表面的结构错误。对于具有规则结构的场景,如果直线或区域的特征提取和描述比较容易,且误差较小时,应该选用直线或区域特征,以便实现快速匹配。因此,在选择匹配特征时,应综合考虑各种因素,根据不同的景物特点和应用要求选择最合理的匹配特征。除这些直观的匹配基元外,在不同的匹配算法中,还有其它的匹配基元,如Marr提出的零交叉匹配基元以及在此基础上MaynewI”1提出的卷积峰匹配基元,图像的相位基元等。无论从视觉生理的角度还是在实际应用中,立体视觉匹配问题的解决很大程度上都取决于合理地选择匹配基元。良好的匹配基元应具有性能稳定、抗噪声能力强、易于检测和描述的能力1341。§5.2.2匹配准则匹配准则是根据所选匹配基元将现实物理世界的某些固有属性表示成匹配所必须遵循的若干规则,用以提高系统的去歧义匹配能力和计算效率。Marr提出的唯一性约束、相容性约束和连续性约束被认为是匹配控制中最一般、最基本的物理约束1”l。在这三个基本约束的基础上,针对处理景物的特点和应用要求,通过附加某些先验知识能够引伸出一些特定的匹配控制准则。下面简单描述一些常用的匹配准则。唯一性约束:一般情况下,一幅图像上的每一个特征点最多只能与另一幅图像上的一个特征点对应。连续性约束:物体表面一般都是光滑的,因此物体表面上各点在图像上的投影是连续的,其视差也是连续的。但是,在物体边界处,比如边界两侧的两个点,连续性约束并不成立。相容性约束:物体表面上一点在两幅或多幅图像上的投影在某些物体度量上(如灰度、灰度梯度变化等)或几何形状上具有相似性。比如空间某一个多面体的顶点,它在图像中的投影应是某一多边形的顶点。极线约束:一幅图像上的任一点,在另一幅图像的对应点只可能位于一条特定的被称为极线的直线上。这个约束极大地降低了待验证的可能匹配点对的数量,把一个点在另一幅图像上可能匹配点的分布从二维降到了一维。顺序一致性约束:一幅图像的一条极线对应着另一幅图像中的一条极线,而且它们上面的对应点的排列顺序是不变的。但是,如果视点的方位变化很大,这个约束条件可能不被满足。§5.2.3算法结构实现匹配的算法结构是和匹配基元的选择以及匹配准则紧密相关的,一般应该兼顾有效性和计算量t”】13”。立体匹配实质上是在匹配准则下的最佳搜索问题,许多数学中的最优化技术都可应用于立体匹配,如动态规划方法、松弛法以及遗传算法等13|l。§5.3立体匹配方法根据匹配基元和方式的不同,目前的立体匹配算法基本上可分为两类:即基于区域相关(Area-based)的匹配和基于特征(Feature--based)的匹配‘”1.§5.3.1基于区域相关的匹配自四十年代相关技术被应用于航空立体测量以来,相关匹配方法一直在立体视觉的研究和应用中起着非常重要的作用,这是目前最简单、最易于用硬件实现的匹配方法。其基本思想是以统计的观点将图像看作二维信号,采用统计相关的方法,利用图像上局部区域的相关性来确定两个对应点间的匹配l州。相关法的优点是:直接对图像像素进行匹配,匹配结果不受特征检测精度和密度的影响,可得到较高的定位精度。但是,这种方法过分依赖图像灰度统计特性,使得匹配结果对景物表面结构、光照反射和成像几何十分敏感,而且区域灰度相关的假设意味着相关窗口内的像素都具有相同的视差,这对含有深度不连续的区域是不成立的。因此,当空间景物表面缺乏足够的纹理细节及成像失真较大(如视点间距离过大)时,相关匹配法难以应用。在基于区域相关的算法中,要匹配的元素是固定尺寸的图像窗口,相似准则是两幅图像中窗口间的相关性度量。当搜索区域中的元素使相似性准则最大化时,则认为元素是匹配的。具体描述如下:输入两幅立体图像对‘和‘,设毋和P分别为这两幅图像中的像素点,(2W十1)为相关窗口的宽度,足∽)是‘中与另相关的搜索区域,则y0,v)是两个像素值u,v的相关函数…1。对于Ii中的每一个像素,日=【f,儿则:(1)对于每个区域d=k,畋r,计算14"Wc(d)--∑Y少(d/+k,_,+,),,,(i+k-d。,j+l-d2))f;~∥li-W(5.1)(2)蜀的视差就是在震(0)中使c(d)为最大值的矢量d孑=arg骝{c0)}(5.2)输出结果是对应^中每一个像素点的视差的数组,即视差图。常用的相关函数y=矿0,0有两种形式:∥0,v)--埘和∥0,v)--0一v)2,前者称为交叉相关,后者称为块匹配。后者比前者的匹配效果要好,因为它不象交叉相关那样受区域内含有很大或者很小的灰度值的影响。Rosenholmt“l等提出在基于区域相关的匹配算法中,将函数∥的值做成LUT(Lookuptable),可大大加快算法的速度。基于区域相关的匹配中有两个主要问题:一是适当地选取w和R:一是恰当地寻找相关准则。窗口宽度(2W+I)的选择取决于从要处理图像中提取最重要的空间属性的能力。如果两个摄像机的几何位置未知,则搜索区域胄(只)的初始位置和大小的选择是很困难,但是根据极线约束,可以简化为在一条线段即极线上的搜索143]。§5.3.2基于特征的匹配与区域相关法不同,基于特征的匹配方法是有选择地匹配能表示景物自身特性的特征,通过更多地强调空间景物的结构信息来解决匹配歧义性问题。基于特征的匹配方法将匹配的搜索范围在一系列稀疏的特征上。利用特征问的距离作为度量手段,具有最小距离的特征对就是最相近的特征对,也就是匹配元素。特征间的距离度量有最大最小距离、欧氏距离等。大多数方法都通过增加约束来减少对每一个特征可能的对应特征数量。常用的有极线约束、唯一性约束及连续性约束等。关于特征的选取,首先应使选取的特征对应可视景物的一定特征,并且这种景物特征能够在两幅图像中产生相似的结果;其次,所选取的特征不能太稀疏,否则,会给三维内插重建造成困难:另外,对所处理的图像来说,所选取的特征的分布还应该能够尽可能地避免误匹配的产生。常用的匹配特征有图像中的边缘点、角点等灰度不连续点和边缘直线等【….在实际应用中,完成两幅立体图像对的匹配计算是相当耗时的。与人类能够瞬时完成双眼看到的两幅图像的对应匹配相比,机器人双目立体视觉仍显得相当笨拙,不仅速度太慢,而且匹配精度也不太高,这些都需要进一步研究。一种思路是通过减小匹配的搜索空问来减少计算量:另一种是减少匹配中存在的歧义。已出现一些改进的方法,如基于带有全局性质的基元匹配和利用三个摄像机减少匹配的二义性【451等。立体匹配作为机器人立体视觉的核心,在理论上和技术上仍存在很多问题。例如,如何选择合理的匹配特征,以克服匹配准确性与恢复视差全面性之间的矛盾;如何选择有效的匹配准则和算法结构,以解决存在严重灰度失真、几何畸变(透视、旋转、缩放等)、噪声干扰、特殊结构(平坦区域、重复相似结构等)及遮挡景物对匹配的影响;如何建立更有效的图像表达形式和立体视觉模型,以便更充分地反映景物的本质属性,为匹配提供更多的约束信息,降低立体匹配的难度等ml。§5.4基于边缘检测的分阶段立体匹配方法边缘特征是最常见也是最重要的特征。这里,我们提出一种以边缘点为匹配基元,采用双阈值判决的灰度相关的分阶段立体匹配方法。该方法适用于双目立体视觉系统或者视点位置相差不太大的立体视觉系统1471。在第一阶段,匹配的目的是选出最佳匹配点或候选匹配点,在这一阶段中,如满足最佳匹配条件,则不须进行第二阶段匹配:如不满足最佳匹配条件,则选出若干候选匹配点,再进行第二阶段匹配测试,以选出其中的最佳匹配点。采用米字条形窗口代替矩形窗口作为相关窗口,大大减少了计算量;采用双阂值判决,不仅提高了匹配的可信度,而且为第二阶段的匹配提供了候选匹配点。在第二阶段,基于视差相容性原则,通过检测其支持邻域的匹配相容以解决候选匹配的歧义性问题,输出唯一匹配,并且尽可能地消除误差。设同一场景的两幅图像对分别记为,.和,,,其中边缘特征点的集合分别为W}和t,;},相应的灰度值记为g?和g;,以特征点为中心的相关邻域窗口记为w,搜索范围记为%,图像,.和,:中的边缘特征点的坐标分别记为b。,Y。)和b:,Y:),对‘中坐标为G。,Y。)的边缘点I?,在I:中搜索其匹配点的算法如下:(1)第一阶段:通过双阈值相关匹配选择最佳匹配点和候选匹配点。①确定搜索范围%。彤是以匹配特征点坐标G。,J,。)为中心,宽度为(2日。+1),高度为(2‰+1)的矩形区域,其中,H一为最大水平视差,Pr瞰为最大垂直视差。则可能匹配点,2的坐标G:,Y:)应满足m1“屯,y2)ixl一日。。≤X2≤xl+日一,IYl—yo-<y2≤yl+y-眦}(5.3)②对于每组可能匹配,采用如下归一化的相关函数计算其灰度相关值R∽,正)。取灰度相关函数为:R(,j,‘,;)=生L————一oia2、∑戗一91胺一92)(5.4)其中,g:和g;为相关窗口中像素的灰度值,gl和92为相关窗口中的灰度平均值,q,cr2分别为局部灰度方差的平方根,91=Zg:/N,92=∑g;/N(5.5)砰:∑G:~Train,盯:2:∑G:一7)2/Ⅳ(5.6)相关函数的匹配性能和计算效率与相关窗口的大小有关。本文选取米字条形窗口代替常用的矩形窗口,作为相关窗口,如图5.1所示。在窗口内的像素坐标如下㈣:水平方向:(i-k,j)到(i+k,j):垂直方向:(i,j-k)到(i,j+k):正对角线方向:(i-k,j-k)到(i+k,j+k);对角线方向:(i—k,j+k)到(i+k,j-k)。.义眨彳蕊图5.1米字犁窗口可见,米字条形窗口比矩形窗口极大地减少了运算量,运算速度更快,有利于建立正确匹配。对于(2”+1)×(2"+1)的矩形窗口,需要计算的窗门内的像素个数为{2"+12},而对于相同大小的米字条形窗口,则只需计算(8n十1)个像素在具有相同计算点数的情况下,米字条形窗口将比矩形窗口覆盖更大的范围,包含更多的邻域信息,如当窗口大小为13×13时,米字条形窗口的像素点数为49,而具有相同点数的矩形窗口大小贝4为7×7。③对相关匹配值R(I,J)做阈值处理,得到最佳匹配点和候选匹配点集。在相关匹配中,一般取具有最大相关值的点作为最佳匹配点,但是往往存在因某些细微结构非常相似,并不存在明显峰值的情形,此时容易出现歧义匹配,两级阈值判断的方法能够很好地解决这个问题。R一(,?,,;)=max《Rp,f】)尺。∽,』;)为特征点与其可能匹配点集中相关值的次大值。(5.7)设最大值的阂值为正,次大值的阈值为疋,若R一∽,,:)>五,且R。∽,薯)<正,则,;为r的最佳匹配,不必再在第二阶段进行唯一匹配的操作;否则,若R。∽,e)>疋,则,;为17的候选匹配点,所有满足此条件的点e构成了,?的候选匹配点集厶∽),须在下一阶段进一步匹配。这种两种阈值处理的方法不仅提商了匹配的可信度,而且为第二阶段的处理提供了候选点。匹配性能与闽值互和毛的选择有直接关系。阈值五取值越低,意味着相关条件越弱,匹配的可信度就越低。如果Z取值太高,则会丢失一些本可以在第一阶段就能够匹配的点,从而加重第二阶段匹配的负担;但如果正取值太低,会降低匹配的可靠度。阈值疋的作用主要是为第二阶段的处理提供候选匹配点,其取值应适宜。若取值太高,就失去了设置该阅值的意义;但若取值太小,又会增加下一阶段匹配的搜索空间,降低计算效率。④按照上面的步骤,对图像,,中的特征点,;在图像‘中求得其最佳匹配和候选匹配点集£:∽)。若r和,;互为最佳匹配,则认为e为,Jl的最佳匹配。因此,第一阶段的输出结果为一些最佳匹配点和候选匹配点集厶p?)和三:孵)。(2)第二阶段:利用视差相容性准则对候选匹配点及其邻域进行最佳匹配。这罩,采用邻域视差支持的迭代算法。通过计算邻域内各对匹配间的相容程度,赋予候选匹配一个匹配的评价值,通过该值可得到在视差相容性约束下的最佳匹配。①计算候选匹配与其邻域匹配间的支持。设(,?,e)为一候选匹配,缈O?)为j?一个边缘邻域,称为视差支持邻域,设』:∈∥∽),砖在』:中的匹配点为e。则匹配∽,J;)与匹配∽,鬈)的相互支持为cQv,以n)2砥瓦CI雨(5.8)其中,吒和“分别为匹配∽,,;)与O:,e)的视差,DOF,d。,)=k-d。l为视差之差,q,岛为正常数,满足ct+c2=1。②计算侯选匹配的评价值。定义两对匹配的相容系数为印1,缸7,J;l(J:,e)】:{1f2当∽,e均最佳匹配当O:,,:如候选匹配当帷,鬈序匹配(5.9)10则每对候选匹配的匹配评价值为:s∽)-吐赢){蕊膨哪∽敝“))}+磊;){麟膨m岫批‰))}伍㈣若一对匹配满足条件:s(,?,,;)>s∽,e),s0『,e)>s也,e),则认为(F,』;J为最佳匹配。对于任意e∈厶∽);对于任意,二∈三:也);③对两幅图像的侯选匹配点都进行上述两步处理后,将含有被唯一匹配的点的所有可能匹配点去除,再进行上述两步的处理,直至最佳匹配点的数目不变或达到设定的最大迭代次数为止。§5.5小结立体匹配是机器入双目立体视觉系统必须解决的问题,是立体视觉的核心问题。立体匹配的有效性有赖于三个问题的解决,即:匹配基元的选取、匹配准则的制定、匹配算法实施。本章提出了基于区域相关和基于特征的两种匹配方法。最后又提出一种以边缘点为匹配基元,采用双阂值判决的分阶段立体匹配方法。第一阶段旨在寻找部分最佳匹配点以及候选匹配集。取米字条形窗口代替矩形窗El作为相关窗口,提高了相关运算的速度;采用双阈值判决,不仅解决了灰度相关峰不明显时匹配判决困难的问题,而且能够得到大量候选匹配点,大大缩小了下一阶段匹配的搜索空间。在第二阶段,利用视差相容性约束,基于邻域视差支持,对第一阶段中得到的候选匹配集进一步匹配,最后得到最佳匹配。第六章§6.1测距系统结构框图双目图像测距系统图6.1为系统硬件配置图,它是由CCD摄像机、图像采集卡、微机系统和监视器组成。其工作原理为:图6.1测距系统结构框图CCD摄像机对被测物体表面进行采集,图像卡用于接收摄像机送出的视频信号并将其转变为数字信号送入计算机,在计算机内完成图像处理过程荠得出测量结果,最后在监视器(显示器)中将结果显示出来。§6.2实验方案设计实验平台为一水平放置的玻璃板,在玻璃板上平铺一张坐标纸,两台摄像机水平放置在实验平台上,下面在坐标纸上选取一点O作为空间坐标系的参考原点,建立空间坐标系0XYZ,其中坐标纸平面被设定为XOZ面,摄像机在拍摄过程中始终保持与XOZ面平行。拍摄位置用与0的距离L表示。被测量的物体是形状规则的立方体方块。理想状态下两台摄像机应当完全平行放置,为了使实验更接近于实际工程测量,将两台摄像机呈一定角度放置,构成距离测量的传感器。如图6.2所示,两台摄像机的光心分别为0l,02。A和B分别为两个CCD相机光轴与其成像面的交点,其光轴与x轴的夹角均为o。P为被测点,其在两个CCD相机上的成像点分别为只和最。设DIA=02B=厂,4只=一(只位于A点左面为负,右面为正),嚣只=矗(只位于B点左面为负,右面为正),OOl=DG=L,则直线01只在XOZ坐标系下的方程为直线D2最在xoz坐标系下的方程为·--——-·———·---——一兰±墨=三一fcosg+Xlsing—fsinO--Xlcosg(6.1)(6.2)fcosg+工2sing—fsinO+x2cosg联立式(6,1)和(6.2)可以得到P点的Z坐标为扛瓦赢荔酽i习巧ii苘而硐,一2Using—x2cosO)(Jfsing+xleosO)L(6.3)Z即为所求距离。圈6.2测距系统实验方案图§6.3实验误差分析在实际测量中,为了保证两幅图像匹配的精度,要求两相机光轴与纵轴夹角u(u=90—01相等且值足够小,oo,与002相等,根据误差合成原理可以得到z的系统误差△z:AO丝+缸丝+Au丝00乱(6.4)Ou由以上的结果可以看出当tanu较小时,Z对u的导数值比对L和0的值大,因此较小的偏差就可以引起较大的误差,因此在光学系统校正中,必须58保证u能达到足够的精度。根据误差理论得到测量的总误差是系统误差和对空间物体进行准确的识别。焦距对测量结果的影响主要反应在同名点的匹配上,两个焦距相差较大将使同名点的匹配精度降低,当两个光学系统的焦距相差超出一定范围以后,由于左右摄象机的放大倍数相差很大,这样使像差过大无法进行同名点的识别,从而使整个测量系统无法工作,因此在测量系统中为了提高匹配精度同时降低匹配难度,必须保证两个相机焦距一致。§6.4小结本章首先从立体视觉的一般原理推导出了双目图像测距系统中空间点和空间直线的重建公式,接着设计了一种简易的双且图像测距系统的模型。第七章结论与展望计算机立体视觉是被动式测距方法中最重要的距离感知技术,它直接模拟了人类视觉处理景物的方式,可以在多种条件下灵活地测量景物的立体信息。其作用是其它计算机视觉方法所不能取代的,对立体视觉的研究,无论从视觉生理的角度还是在工程应用中都具有十分重要的意义。自计算机立体视觉技术诞生到现在,己经形成了从图像获取到最终的景物可视表面重建的比较完整的体系。本课题尝试从双目立体视觉的距离感知过程中的特征提取和图像匹配这两方面入手,重点对立体视觉中的若干问题如特征提取、立体匹配以及立体视觉测距原理进行了学习和研究。模仿人眼,采用双目横模型结构的成像系统模型。景物在左右视网膜上成像位置的差异(即视差)反映了客观景物的深度。人类有深度感知,根据获得的视差并进行加工,进而获得景物的深度信息。基于此详细介绍了成像变换原理、成像系统模型和双目立体视觉中的视差计算原理。由于实际条件的约束,未对摄像机标定进行深入的研究。目前尚没有一种普遍适用的理论可运用于匹配特征的提取,导致了立体视觉中匹配特征的多样性。良好的匹配特征应具有可区分性、不变性、稳定性、唯一性和有效解决歧义匹配的能力。由于特征和特征提取方式的多样性,所以在图像预处理与特征提取部分有重点地对特征提取技术(包括点特征、边缘特征等)进行了论述,并对比性的给出了相应实验结果。希望本阶段的研究和实验工作为下一步的立体图像匹配提供比较坚实的理论基础,对图像匹配起到指导作用。虽然立体匹配技术经过数十年的研究,已经有了很大的发展。但无论是从视觉生理的角度,还是从实际应用方面来看,现有的立体匹配技术还处在十分不成熟的阶段。这不仅仅涉及到技术上的原因,而是更多地在于人类对自身机理还不十分了解,因此,立体匹配问题的彻底解决还有待少对人类自身视觉机理的深入研究。尽管如此,科技工作者仍峰持不懈地努力对立体匹配技术进行研究,并针对各自的应用目的和要求提出了很多尝试解决该问题的方法。本论文针对图像匹配详细论述了特征基元选择、匹配策略、约束条件以及相似性测度等立体匹配的主要组成部分,并针对不同特点的立体图像对分别提出了基于图像边缘特征的分阶段立体匹配方法和基于区域相关的匹配方法。双目立体视觉测距系统需要用到摄像机标定所获取的摄像机内、外参数。由于课题研究各种条件的,没有涉及到图像匹配后的三维重建技术的研究和实验工作。由于条件、时间和能力有限,本课题仅对基于双目机器视觉的被动测距的若干问题进行了探讨。希望通过对本课题的研究和学习,能够为将来的学习和工作确立一个明确的研究方向,并为其打下坚实的基础。致谢本文是在杨进华教授的精心指导、热情帮助下完成的。在两年半的硕士研究生学习期间,杨老师严谨的治学态度、求实的工作作风和高尚的为人品质使我深受教育和启发,并将使我终身受益。在我毕业课题的设计中,导师富于创造性的想法给予我很大帮助,使我能顺利完成课题研究和论文写作,也顺利完成研究生阶段的学业。在本论文即将结稿时,我要向导师表示衷心的感谢。感谢父母和家人给予我的无私支持和帮助,使我能够专心于课题的研究。最后,感谢审阅本文并提出指工F意见的专家学者!参考文献l23456吴立得.计算机视觉.上海:复旦大学出版社.1993项海兵,计算机视觉发展中存在的问题.新浪潮.1996(4):29~30张福学.机器人学一一智能机器人传感技术.北京:电子出版牡,1996吴祥瑞.机器人技术及应用.北京:北京航空航大大学出版社,1994周国清,唐晓芳.计算机视觉及戍用.计算机用户,1996(8):3~6邓文怡,牵乃光,董明利,张靖渝,燕必希.数字摄影测量技术在三维测量中的应用,光电子激光,2001。12(7):697~700789程存学,朱晓昆著.计算机视觉一一低层处理技术.电子工业出版社.1993Baranrd,eta1.ComputatfanalBaslPstereo.ACMComputingServegs.1982,14:552~572surfacefitting。IEEEJ,JainRCSegmentationthrou曲varlable—orderTransPatternAnalMachineIntell.1988.10(2):167~192[10]Marr[11]DhondnalD.VisionSanFranciSCO:Freel刮r1.1982TransPatternA-gR,AggarwalJK,Structurefromstereo:Areview.IEEEMachineIntell,1989.11(12):113~120computationofstereo[12]Mart287D,eta1.Cooperativedisparity.Sci.1976.194:283~[13]BakerHH,eta1.Depthfromedgeandintensitybasedstereo.Proc.7thIJCAI.1981:63l~636[14]AronldCSRD-AutomatedStereoPerception,StandfordUniversityTech,Rep..STAN—83—951.1983[15]郑南宁,计算机视觉与模式识别,国防工业出版社,1998年3月[16]工润生,图像理解,国防科技人学出版社,1995:292~322[17]高文,陈熙霖,计算机视觉一算法与系统原理,渍华大学{川扳社。广西科学技术出版社,1999年2月[18]晶辰工作室,最流行图像格式使用参考手册,电子工业出版社,1998年10月[19]吕风军,数字图像处理编程入门,清华大学出版社,1999年9月[20]Kenneth.R.Castleman,数字图像处理,电子工业出版社,1998年9Jq[21]田捷等,实用圈像分析与处理技术,电子工业出版社,1995年1月[22]CatteF.LionsPL.MorelJM.CoilT.ImageSelectiveSmoothingandEdgeDetectionbyNonlinearDiffusionofNumericalII.SocietyforIndustrialandApplledMathematicsJournalAnalysis,1992,29(3):845~866[23]阮秋琦,数字图像处理学.北京:电子工业出版社。2001[24]张凯丽,刘辉,边缘检测技术的发展研究,昆明理工大学学报,2000.25(5):36~39[25]LungP.wangYF.LocalScaleControlledImageSmoothingAnisotropieDiffusionwithLocalofthe6thNoiseEstimateforandEdgeDetection.In:ProcInternationalConferenceonComputerVision,Bombay,India,1998,193~200[26]马艳。张治辉,几种边缘榆测算子的比较,工矿自动化,2004年2月,第一期[27]MartU.Vision:^computationalofvisualinvestigationintothehuronrepresentationandprocessinginformation。_.H,FreemanandaCompany.SanFrancisco.1982[28】EricEGrimsonL.ComputationalExperimentswithonFeatureBasedStereoAlgorithIEEETransactionsPatternAnalysisAndManchineInteligence1998。PAMI一7(1):17~24C29]OhtaIEEEY,eta1.Stereobyintra-andinter—scanlinesearchusingdynamicprogramming.Trnns.onPAgI,1985,7:139~154.[30]LloydingSA.eta1.AParalletBinocularStereoAlgorithaUtilizedDynamicPrograⅢn-RelaxationLabelling.c1,GIP.1987.39:202~225.and[31]管业鹏,童林夙.二维图像特征点快速提取算法[J].中国图像图形学报,2002,7A(12):1296~13011321潘晓露,李一民,刘辉,平行视双目测量体系中特征检测方法,云南工业大学学报,1999.15(4):19~21[33]MayfewJhumanEW,eta1.Psychophysicalandcomputationalstudytowardsatheoryofstereopsis.AI,1981,17:349~385.[34]李作新,胡广宁,立体视觉与立体匹配小型微型计算机系统.1990,11(2):43~50[35]garrD.著.姚国正,等译.视觉计算理论.北京:科学出版社.1988【36]马颂德,张正友,计算机视觉一计算理论与算法基础,科学出版社,1998年1月[37]0.H.巴控德c.M.布朗,计算蓼L视觉,科学出舨社。1987.9#9月[38]吴立德,计算机视觉,复巨人学出版社,1993年12月[393游素亚,徐光佑.立体视觉研究的现状与进展.中国图像图形学报,1997,2(I):15--24[40]TakeoKaandeandetal,AStereoMatchingAlgorithmwithPatternAnalysisandanAdaptiveWindow:TheoryIntelligence,1994,Experiment,I吸Trans.OnMachine16(9):920~932[41]SureshB.garapaneeta1.Multi—PrimitivePatternAnalysisHierarchical(删)StereotheAnalysis,IEEETrans.On[42]OandMachineIntelligence,1994。16(3):227~240least~squarestechniqueforEngineeringRosenholmMultipointmatchingusinganeva—Inationofthree—dimensionalmodels[J].PhotogrammaticandremoteSe-Nsing.1987.53(6):1214~1218[43]丁震,胡钟山,唐振民,杨静宇,从二维图像中恢复距离信息的体视匹配方法,南京理工大学学报,1996,20(5):449~452[44]任重,{fIf军力,双目立体说觉的匹配方法研究,军事通信技术,2001.22(2):45--48[45]吕宏静,贾云德.用多基线立体视觉系统恢复稠密深度信息,北京:北京理工大学学报,2000,20(1):70~72[46]周东翔,蔡宣平,孙茂印,一种基于特征约束的立体匹配方法,中国图像图形学报。2001,6(7):653~656[47]丁震,庸振民等,种渐近的立体匹配方=;_左,计算机研究与发展,1997.34(10):42~47[48]J-+t骥,石教英,赵友兵,图像特征点匹配的强壮算法,2002,14(8):754~757[49]朱晓瑾,候文永,识别库函数的特征点匹配法,上海交通大学学报,1994.28(9):34~38[50]边肇棋,张学工等.模式识别.清华大学出版社,2002.10基于双目立体视觉的距离测量

作者:

学位授予单位:

崔岩

长春理工大学

1.学位论文 王宁玲 立体视觉在非接触三维测量中的应用与研究 2004

计算机立体视觉三维测量是一门新兴技术,在现代工业领域尤其是三维轮廓和体积测量等方面有广阔应用前景.本文系统研究了立体视觉三维测量中摄像机定标、特征点的提取与匹配、图像处理和三维计算等关键技术.提出了三维测量实验系统硬件及软件解决方案,在MATLAB环境下编制、调试了实验系统软件,建成了基于双目立体视觉技术的三维测量实验研究平台.在该平台上开展了摄像机定标及回转体、类回转体的三维测量实验,成功实现了空间立体三维信息重建和体积等关键参数的测取.

2.学位论文 张家林 基于立体视觉的皮肤表面检测技术的研究 2002

如今,评价皮肤表面的光滑度越来越受到人们的重视,尤其是在化妆品研究领域.科学家们已经建立了几种检测皮肤皱纹、评价皮肤表面光滑度的方法.该文比较详细地介绍了各种皮肤皱纹检测的技术,并且对它们各自的优缺点以及适用范围进行了比较.另外,该文提出了基于立体视觉的皮肤表面检测技术,然后,分别对摄像机定标和立体匹配技术进行了研究.在摄像机定标部分,该文介绍了摄像机定标的基本原理以及定标的具体步骤.在立体分析部分,我们着重介绍了区域匹配技术以及用于全局控制的极线约束方法.并且在实验的基础上,提出了一种基于标准点约束的全局控制策略.与极线约束的控制策略相比,它不受定标精度的影响,而且处理简便.最后,总结全文.对自摄的图象进行了实验,并且分析了实验结果和系统的性能.指出今后需进一步研究和探索的方向.

3.学位论文 王军 双目立体视觉匹配改进算法及三维重建技术 2005

本论文主要就摄像机定标和立体匹配这两方面的内容展开研究。首先根据选择的立体视觉成像系统模型阐述了摄像机定标的基本原理。

  其次,对图像匹配问题涉及的内容进行了详细的叙述,其中匹配特征的选取、匹配准则的确定、匹配算法的实现是立体匹配的三个重要步骤。立体视觉中,对于视差不连续场景,例如遮挡区域、物体边缘等,如何获得高性能的图像匹配是一个重要的研究课题。本文提出了一种移植性能很好的改进匹配算法,在对左右图像进行LOG算子预处理后,用传统的SAD窗口匹配结合改进的子窗口技术,在保持实时性的同时能够有效地提高匹配的质量。它的突出优点是可以作为任何现有匹配算法的补充以增加匹配的精度,并且简单高效。

  最后通过双目视觉模型分析,利用空间几何关系,提出了目标点的三维坐标计算表达式。

4.期刊论文 何春燕.周付根 双目立体视觉系统定标误差分析 -中国体视学与图像分析2003,8(4)

摄像机定标是提高双目立体视觉系统三维测量精度的关键之一,如何提高定标的精度对于提高整个系统的测量精度至关重要.本文在深入研究单目摄像机定标的基础上,利用一种基于双目立体视觉的三维测量系统定标模型,对摄像机定标给系统带来的误差进行了评价与分析.实验结果表明,在同一定标模型下,定标方式的选取对定标精度有较大影响.合理的进行定标可以有效地消除摄像机球面误差对测量精度的影响.

5.学位论文 石继雨 机器人双目立体视觉技术研究 2003

该论文基于CCD摄像机和个人计算机组成的视觉系统,重点讨论了摄像机参数定标、立体匹配、目标定位、深度图生成等.在摄像机参数定标中,根据坐标关系,分别讨论了不同的摄像机模型,并对传统的定标方法和摄像机自定标做了详细阐述.双视觉立体匹配是寻找同一目标点在两幅图像中的成像位置,匹配特征的选取、匹配准则的确定、匹配算法的实现是立体匹配的三个重要步骤.目标定位是通过双目视觉模型分析,利用空间几何关系,最后提出了目标点的三维坐标计算表达式.深度图生成是深度信息的可视化过程,该文讨论了不同深度图表达形式和深度插值方法.至此构建一个完整的机器人双目立体视觉系统结构.

6.学位论文 雍超 基于避障的移动机器人立体视觉算法研究 2004

自主移动机器人可以被广泛地应用到军事、生产、生活等许多领域,因此受到了全世界各国的普遍关注.然而,作为机器人技术中的一个关键部分,现有机器人视觉技术还存在很多问题需要改进.作者所在实验室的多个移动机器人研究项目都涉及机器人双目立体视觉的研究.依托这些项目提供的软硬件支持,该文对摄像机定标、图像匹配和障碍探测等方面进行了深入细致的基础性研究,主要包括如下几个方面的工作:1)开发了一种新的简单而有效的摄像机定标技术.它的精度高,容易操作,速度快,并具有很好的通用性,可以用到任意的计算机视觉系统中.2)实现了一种新的基于多重假定视差的匹配算法,很大程度解决了其他匹配算法中匹配某些象素精度不高的问题.它的另外一个重要特点是可以被移植到许多现有的匹配算法中去,有效提高这些现有算法的匹配性能.3)基于我们开发的摄像机定标技术,利用外极线约束条件对图像进行校正,一方面消除径向失真,另一方面使得立体图像对中的所有对应点都位于同一扫描行上,为图像匹配提供了良好基础.4)该系统不进行精确的三维场景重建,而是提出一种在较为粗糙的水平上恢复场景的策略,把摄像机定标、图像匹配等若干环节带来的累积误差的影响降到最低.同时它又可以节约三维重建的时间,提高系统效率.实验证明这样的策略对于越障机器人来说尤为合适.实验表明,该文介绍的基于立体视觉的障碍探测系统具有良好的表现.该文描述的双目立体视觉算法是一个相对通用的算法,其中的摄像机定标,匹配算法等技术可以移植到任何其他一种移动机器人双目视觉系统中去,这为后续研究提供了良好的基础.

7.学位论文 肖高逾 计算机立体视觉中三维重建技术的研究 2000

计算机立体视觉的主要研究内容是由多幅二维的平面图像恢复出被摄物体的三维坐标,而其中基于两幅图像的双目立体视觉技术则是一个研究热点.该论文即是对计算机双目立体视觉中的三维重建技术进行了探讨,着重研究了在图像匹配结果已知的情况下如何由像对重建物体三维坐标的问题.主要的研究内容包括摄像机定标、被摄物体三维坐标的获取、物体表面插值以及表面数据的表示.该论文的研究受国家\"九五\"项目的资助.

8.学位论文 陈华华 视觉导航关键技术研究:立体视觉和路径规划 2005

陆地自主车(Autonomous Land Vehicle,简称ALV)是一种能够在道路和野外连续地、实时地自主运动的智能移动机器人,其研究涉及多个学科的理论与技术,体现了信息科学与人工智能技术的最新成果,具有重大的研究价值和应用价值,受到了世界各国的重视.在移动机器人的各项关键技术中,视觉导航的主要功能是对各种道路场景进行快速识别和理解,从而确定移动机器人的可行驶道路区域,而视觉导航技术的关键是障碍物的快速检测与识别.路径规划则根据视觉处理获得的信息,在可行区域内规划出一条安全、高效的路径.陆地自主车的行驶过程即立体视觉获取前方的路面环境信息,然后通过智能控制技术使自主车沿规划的路径行走.因此本论文旨在研究陆地自主车的立体视觉系统设计和实现,以及在视觉处理获得的信息基础上进行路径规划.摄像机的精确定标是立体视觉研究的基础,本文第二章围绕摄像机定标对各种定标模板及其控制点、摄像机模型的优缺点进行了比较和分析,结合应用环境确定了适合于自主车的定标模板和控制点以及摄像机模型,并讨论了相应的摄像机定标方法,该方法只需要用多个任意角度的平面模板进行定标,操作过程简单,而且定标精度较高,能够较好的适合自主车导航现场环境的要求.此外,立体图像对的外极线校正是降低匹配算法复杂度必不可少的工作,在这一章中首先研究了双目立体视觉校正算法,但是其有一定的局限性,不适用于多基线立体视觉系统,由此局限性出发对此算法进行修改,将其扩展到平行三目立体视觉系统,实验结果表明,该算法正确有效并且可以推广到摄像机数目超过三个的平行多基线立体视觉系统.第三章对立体匹配算法作了深入的研究,研究中突出了算法实时性和鲁棒性要求.对于局域匹配法,重点研究了区域法,对其各种相似性测度的准确性以及匹配窗口的大小进行了定性和定量的评估,对影响匹配结果的各种预处理和后处理作了深入的研究,并提出了多分辨率、盒滤波、并行指令、超线程、OpenMP等多种提高匹配实时性的加速方法.对全局匹配方法,研究了比较流行的动态规划方法和Graph cuts方法.对这两种全局匹配方法的准确性作了定量和定性的评估,并对这两种方法存在实时性较差的不足,提出了基于多分辨率的匹配方法,大大减少了匹配时间.立体匹配的结果最终通过三维重建来表现,在本文第四章提出了具有实时性较高的三维重建算法,对该算法结合摄像机定标过程中的模型误差和图像噪声误差、匹配过程中的透视投影变形误差、非校准误差、系统误差、量化误差以及双目视觉系统的误差模型对重建的误差进行了分析,并提出了误差修正算法,通过实例验证了该修正算法可以减少重建误差.在重建算法的基础上,结合自主车GPS/INS提供的车体位置和姿态,对越野环境的地貌进行了全局地图构建,通过实例验证表明构建的全局地图基本符合了真实三维场景.

9.学位论文 李华明 计算机视觉在城市建筑物测量中的应用 2003

该文针对利用数码像机对城市建筑物进行测量这一崭新课题,运用计算机视觉、数字图像处理、图形图像学及射影几何学的知识,提出了一套可行性方案,并给出了初步的实验结果. 首先,简要介绍了项目背景,指出了该文的主要工作,并根据项目及所使用的测量工具——数码相机的特点给出了测量工具的选择方案. 其次,针对项目中的摄像机定标的需要,介绍了摄像机定标中的坐标系统,线性摄像机模型以及摄像机定标的特点及分类,并给出了一种基于二围棋盘状定标参照物的定标方法和试验结果. 再次,对计算机视觉中对获取场景深度信息的方法进行了分类和比较,讨论了双目立体视觉的方案及立体视觉中的极线约束. 最后,推导了利用消隐点和消隐线隐含的三维信息对建筑物进行三维信息恢复的方法,并利用Canny变换和Hough变换的方法给出了建筑物边缘提取的结果,同时介绍了高斯球面法提取消隐点的方法和对全文进行了小结.

10.期刊论文 周波.聂楠楠.李东辉.ZHOU Bo.NIE Nan-nan.LI Dong-hui 双目摄像机定标的神经网络方法 -自动化与

仪器仪表2009(1)

研究基于反向传播神经网络的摄像机双目立体视觉定标新方法.传统方法基于三角测量原理技术,会带入成像畸变非线性误差,而这种新方法可以消除非线性因素的影响.该方法利用了BP网络良好的非线性映射能力以及学习、泛化能力,通过采用高精度样本数据训练BP网络,最终建立起立体视觉定标的网络模型.由于不需要考虑视觉模型误差、光学调整误差、广角畸变等因素对视觉检测系统测量精度的影响,因而能够有效地克服常规建模方法的不足,保证了检测系统具有较高的精度.

本文链接:http://d.g.wanfangdata.com.cn/Thesis_Y1041553.aspx

下载时间:2010年5月9日

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- baijiahaobaidu.com 版权所有 湘ICP备2023023988号-9

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务