基于贝叶斯算法的图像分类系统设计_席伟

第8卷第Knowledge 28期(2012年10月) 电脑知识与技术Computer and Technology Vol.8, No.28, October 2012. ISSN 1009-3044Computer Knowledge and Technology 电脑知识与技术http://www.dnzs.net.cnE-mail:[email protected]

Tel:+86-551-[1**********]964

基于贝叶斯算法的图像分类系统设计

席伟

(沈阳化工大学计算机学院,辽宁沈阳110142)

摘要:图像分类是信息处理的重要研究方向,其中涉及了包括有图像特征提取、建立图像数据决策表,选取适当模式识别算法实现图像的分类。该文选取了模式识别常用的基于最小错误概率的贝叶斯算法,实现了对两类图像的分类问题。利用MATLAB 图形用户界面(GUI )方法,设计了良好的人机交互系统的主界面,最后给出了实际例子的程序运行结果,对推动模式识别理论在图像分类问题实践中的应用和普及,具有实际意义。

关键词:图像数据决策表;贝叶斯算法;MATLAB GUI ;图像分类

中图分类号:TP391文献标识码:A 文章编号:1009-3044(2012)28-6779-03

The Image Classification System Based on the Bayesian Algorithm

XI Wei

(ShenyangInstitute of Chemical Technology,Shenyang 110142,China) Abstract:Image classification is an important research direction of information processing, which involves a include image fea⁃ture extraction, to establish the image data decision table, select the appropriate pattern recognition algorithm for image classifica⁃tion. This paper selects the commonly used pattern recognition based on the minimum probability of error of the Bias algorithm, based on two kinds of image classification problems. Using the MATLAB graphical user interface (GUI ) design method, a good human-computer interaction system main interface, finally gives the practical examples of the program running results, to pro⁃mote the theory of pattern recognition in image classification application and popularization, has practical significance.

Key words:Image data decision table; Bayesian algorithm; MATLAB GUI; image classification

图像分类是一个具有重要应用价值的研究课题。目前,关于图像分类的研究主要集中在图像特征的提取和图像分类器的研究。在准确提取图像特征的基础上,如何有效的对图像进行分类,关键在于分类系统的设计。分类系统设计的主要问题在于分类器的设计和特征量的选择。贝叶斯分类是一种典型的分类器,本文在贝叶斯算法的基础上实现了对两类图像的分类器设计。MATLAB 是高效的数值计算的可视化科技应用软件和编程语言之一。图形用户界面(GraphicalUser Interfaces,GUI) 是提供人机交互的工具和方法。MALAB 图形用户界面开发环境(GraphicalUser Interfaces Developmen Envronment ,简称GUIDE) 提供了一系列创建用户图形界面(GUI)的工具。这些工具极大的简化了GUI 设计和生成的过程。

1贝叶斯算法简介

模式识别分类问题是对待识别的对象提取观测值,然后根据观测值进行分类。首先建立识别对象的训练集,其中每点的类别已知,根据这些条件,建立判别函数,通过现有的样品估计判别函数中的参数,然后用此判别函数去对类别未知的样品进行判定。

1.1贝叶斯法则

贝叶斯法则是对主观判断的一种修正方法,是指当样本足够多时,样本概率与总体概率近似。一般情况下,事件A 在事件B 的条件下的概率,与事件B 在事件A 条件下的概率不相等,然而,这两者是有确定关系的,贝叶斯法则就是这种关系的描述。

1.2贝叶斯决策

贝叶斯法则只是一种方法,是从大的方向上讲,要将它细化又可以分为许多的具体实施的决策。如果统计知识完整,贝叶斯决策理论是一种最优分类器。贝叶斯分类器是分类错误概率最小或者是平均风险最小的分类器。其设计方法属于一种基本的统计分类方法。

1.3基于最小错误概率的贝叶斯决策

一X ,判断X 的类别。由贝叶斯公式可知若每个样品属于ω1, ω2类中的一类,已知两类的先验概率分别为P (ω1), P (ω2) ,两类的类别密度函数为P (X |ω1), P (X |ω2) 。则任给

收稿日期:2012-08-25

本栏目责任编辑:唐一东人工智能及识别技术6779

Computer Knowledge and Technology 电脑知识与技术第8卷第28期(2012年10月)

P (ωj |Χ)=P (X ωj ) P (ωj )/P (X ) ,|

由全概率公式可知

P (X ) =∑P (X |ωj ) P (ωj ) ,M

j =1

2图像分类识别系统实现

2.1HSV 颜色空间P (X ) =P (X |ω1) P (ω1) +P (X |ω2) P (ω2) ,其中M 为类别数。对于两类问题,所以用后验概率来判别P (ω1|X ) >P (ω2|X ) ⇒X ∈ω1P (ω1|X )

HSV 颜色空间比较其它的颜色空间更适合人的视觉特性。其中包含色调H(Hue)、饱和度S(Saturation)和亮度V(Value)。色调H 表示表示光的颜色,饱和度S 表示光的浓度,亮度V 表示光的明暗程度。在基于内容的图像检索中,应用这种颜色空间模型会更适合用户的视觉判断。

2.2颜色空间的量化

根据人的视觉分辨能力的分析,颜色大致划分为如下9种:红、黄、绿、青、蓝、紫、黑、灰和白,依据这九种颜色就可以大致描述一幅图像。因此,可以根据这九种颜色来大致确定图像的主颜色特征。具体量化方法可见文献[5]。

2.3分块主色的实现

本文对图像二维空间进行4*4的划分。对其中每一个分块,统计出像素最多的那种颜色作为主色,建立图像的颜色特征向量。分块主色法是统计图像每个分块主色来突出颜色的空间关系,适用于主题位置相对固定的分类问题,对于变化较大的图像效果会明显减弱。

2.4主要MATLAB 程序

函数名:bayesleasterror()

参数:sample :待识别图像特征

返回值:y :待识别图像所属类别

函数功能:最小错误概率的贝叶斯分类器function y=bayesleasterror(sample)clc;load templet pattern; %对图像库和待测图像进行主成分分析[pcapat,pcasamp]=pcapro(sample);temp=0;for i=1:2pattern(i).feature=pcapat(:,temp+1:temp+pattern(i).num);temp=temp+pattern(i).num;end s_cov=[];s_inv=[];s_det=[];for i=1:2s_cov(i).dat=cov(pattern(i).feature');%求个类别的协方差矩阵s_inv(i).dat=inv(s_cov(i).dat);%求协方差矩阵的逆矩阵_s_det(i)=det(s_cov(i).dat);%求协方差矩阵的行列式end sum1=0;p=[];for i=1:2sum1=sum1+pattern(i).num;%求图像库样品总数end for i=1:2p(i)=pattern(i).num/sum1;%求类别的先验概率end h=[];mean_sap=[];for i=1:2mean_sap(i).dat=mean(pattern(i).feature')';%求每类图像的特征值end 6780人工智能及识别技术本栏目责任编辑:唐一东

第8卷第28期(2012年10月) Computer Knowledge and Technology 电脑知识与技术3图形用户界面%计算最大的判别函数for i=1:2h(i)=(pcasamp-mean_sap(i).dat)'*s_inv(i).dat*(pcasamp-mean_sap(i).dat)*(-0.5)+log(p(i))+log(abs(s_det(i)))*(-0.5);end [maxvalmaxpos]=max(h);y=maxpos;

利用MATLAB 程序特点进行模式识别算法编程减少了编程的工作量,对于一个成功的软件来说,其内容固然应该是第一位的,但除此之外,图形界面的优劣往往也决定着该软件的档次。MATLAB 图形用户界面的优点是工具箱形象直观,利用其自身的GUIDE 功能来完成界面结构的设计。图像识别系统的界面程序主要内容就是每个控件的回调函数,利用回调函数,把功能分散的模式识别函数整合在如图1的主界面中,下面以控件“载入图像”为例,给出回调函数Callback 的语句function pushbutton1_Callback(hObject,eventdata, handles) global sample [fnamepname index]=uigetfile({'*.jpg'},'');if index str=[pnamefname];c=imread(str);axes(handles.axes1)image(c);axisoff end C.rgb=c;aa=fenge(C.rgb);for j=1:16tt(j)=color(aa(j));j=j+1;end C.zs=tt;sample=tt;在MATLAB 提示符下键入识别系统名“txsb3”命令则启动如图1所示的识别系统主界面,用户可由其中的载入图像按钮载入需要识别的图像,在菜单栏中选取相应的识别算法,系统就可在相应位置显示图像的类别,主颜色矩阵,

分类时间等信息。

图1图像分类识别系统主界面

4总结

本文介绍了如何利用MATLAB 软件及图形用户界面开发和设计图像分类系统的方法和步骤,图像分类是信息处理的重要研究方向,其中涉及了包括有图像特征提取、建立图像数据决策表,选取适当模式识别算法实现图像的分类。本文选取了模式识别常用的基于最小错误概率的贝叶斯算法,实现了对两类图像的分类问题。利用MATLAB 图形用户界面(GUI )方法,设计了良好的人机交互系统的主界面,最后给出了实际例子的程序运行结果,对推动模式识别理论在图像分类问题实践中的应用和普及,具有实际意义。

软件菜单中的算法还不完善,系统的性能还需要进一步提高,以满足多类图像的识别问题,进一步工作包括增加聚类分析等算法,实现对三类及多类的图像识别问题。

参考文献:

[1][2][3][4][5]杨淑莹. 模式识别与智能计算—MALAB 技术实现[M].北京:电子工业出版社,2008:67-78. 高成, 李淑红.MATLAB 图像处理与应用[M].北京:国防工业出版社,2006:32-45. 吴成玉, 邰晓英, 赵杰煜. 基于颜色特征的图像检索[J].计算机应用,2004,(24):135-137.余芳. 基于颜色特征的图像检索技术研究. 硕士学位论文. 中国石油大学,2007. 徐择峰, 陈世鸿. 一种统一的文本与图像分类算法[J].武汉大学学报:理学版,2004,50(1):79-82.人工智能及识别技术本栏目责任编辑:唐一东6781

第8卷第Knowledge 28期(2012年10月) 电脑知识与技术Computer and Technology Vol.8, No.28, October 2012. ISSN 1009-3044Computer Knowledge and Technology 电脑知识与技术http://www.dnzs.net.cnE-mail:[email protected]

Tel:+86-551-[1**********]964

基于贝叶斯算法的图像分类系统设计

席伟

(沈阳化工大学计算机学院,辽宁沈阳110142)

摘要:图像分类是信息处理的重要研究方向,其中涉及了包括有图像特征提取、建立图像数据决策表,选取适当模式识别算法实现图像的分类。该文选取了模式识别常用的基于最小错误概率的贝叶斯算法,实现了对两类图像的分类问题。利用MATLAB 图形用户界面(GUI )方法,设计了良好的人机交互系统的主界面,最后给出了实际例子的程序运行结果,对推动模式识别理论在图像分类问题实践中的应用和普及,具有实际意义。

关键词:图像数据决策表;贝叶斯算法;MATLAB GUI ;图像分类

中图分类号:TP391文献标识码:A 文章编号:1009-3044(2012)28-6779-03

The Image Classification System Based on the Bayesian Algorithm

XI Wei

(ShenyangInstitute of Chemical Technology,Shenyang 110142,China) Abstract:Image classification is an important research direction of information processing, which involves a include image fea⁃ture extraction, to establish the image data decision table, select the appropriate pattern recognition algorithm for image classifica⁃tion. This paper selects the commonly used pattern recognition based on the minimum probability of error of the Bias algorithm, based on two kinds of image classification problems. Using the MATLAB graphical user interface (GUI ) design method, a good human-computer interaction system main interface, finally gives the practical examples of the program running results, to pro⁃mote the theory of pattern recognition in image classification application and popularization, has practical significance.

Key words:Image data decision table; Bayesian algorithm; MATLAB GUI; image classification

图像分类是一个具有重要应用价值的研究课题。目前,关于图像分类的研究主要集中在图像特征的提取和图像分类器的研究。在准确提取图像特征的基础上,如何有效的对图像进行分类,关键在于分类系统的设计。分类系统设计的主要问题在于分类器的设计和特征量的选择。贝叶斯分类是一种典型的分类器,本文在贝叶斯算法的基础上实现了对两类图像的分类器设计。MATLAB 是高效的数值计算的可视化科技应用软件和编程语言之一。图形用户界面(GraphicalUser Interfaces,GUI) 是提供人机交互的工具和方法。MALAB 图形用户界面开发环境(GraphicalUser Interfaces Developmen Envronment ,简称GUIDE) 提供了一系列创建用户图形界面(GUI)的工具。这些工具极大的简化了GUI 设计和生成的过程。

1贝叶斯算法简介

模式识别分类问题是对待识别的对象提取观测值,然后根据观测值进行分类。首先建立识别对象的训练集,其中每点的类别已知,根据这些条件,建立判别函数,通过现有的样品估计判别函数中的参数,然后用此判别函数去对类别未知的样品进行判定。

1.1贝叶斯法则

贝叶斯法则是对主观判断的一种修正方法,是指当样本足够多时,样本概率与总体概率近似。一般情况下,事件A 在事件B 的条件下的概率,与事件B 在事件A 条件下的概率不相等,然而,这两者是有确定关系的,贝叶斯法则就是这种关系的描述。

1.2贝叶斯决策

贝叶斯法则只是一种方法,是从大的方向上讲,要将它细化又可以分为许多的具体实施的决策。如果统计知识完整,贝叶斯决策理论是一种最优分类器。贝叶斯分类器是分类错误概率最小或者是平均风险最小的分类器。其设计方法属于一种基本的统计分类方法。

1.3基于最小错误概率的贝叶斯决策

一X ,判断X 的类别。由贝叶斯公式可知若每个样品属于ω1, ω2类中的一类,已知两类的先验概率分别为P (ω1), P (ω2) ,两类的类别密度函数为P (X |ω1), P (X |ω2) 。则任给

收稿日期:2012-08-25

本栏目责任编辑:唐一东人工智能及识别技术6779

Computer Knowledge and Technology 电脑知识与技术第8卷第28期(2012年10月)

P (ωj |Χ)=P (X ωj ) P (ωj )/P (X ) ,|

由全概率公式可知

P (X ) =∑P (X |ωj ) P (ωj ) ,M

j =1

2图像分类识别系统实现

2.1HSV 颜色空间P (X ) =P (X |ω1) P (ω1) +P (X |ω2) P (ω2) ,其中M 为类别数。对于两类问题,所以用后验概率来判别P (ω1|X ) >P (ω2|X ) ⇒X ∈ω1P (ω1|X )

HSV 颜色空间比较其它的颜色空间更适合人的视觉特性。其中包含色调H(Hue)、饱和度S(Saturation)和亮度V(Value)。色调H 表示表示光的颜色,饱和度S 表示光的浓度,亮度V 表示光的明暗程度。在基于内容的图像检索中,应用这种颜色空间模型会更适合用户的视觉判断。

2.2颜色空间的量化

根据人的视觉分辨能力的分析,颜色大致划分为如下9种:红、黄、绿、青、蓝、紫、黑、灰和白,依据这九种颜色就可以大致描述一幅图像。因此,可以根据这九种颜色来大致确定图像的主颜色特征。具体量化方法可见文献[5]。

2.3分块主色的实现

本文对图像二维空间进行4*4的划分。对其中每一个分块,统计出像素最多的那种颜色作为主色,建立图像的颜色特征向量。分块主色法是统计图像每个分块主色来突出颜色的空间关系,适用于主题位置相对固定的分类问题,对于变化较大的图像效果会明显减弱。

2.4主要MATLAB 程序

函数名:bayesleasterror()

参数:sample :待识别图像特征

返回值:y :待识别图像所属类别

函数功能:最小错误概率的贝叶斯分类器function y=bayesleasterror(sample)clc;load templet pattern; %对图像库和待测图像进行主成分分析[pcapat,pcasamp]=pcapro(sample);temp=0;for i=1:2pattern(i).feature=pcapat(:,temp+1:temp+pattern(i).num);temp=temp+pattern(i).num;end s_cov=[];s_inv=[];s_det=[];for i=1:2s_cov(i).dat=cov(pattern(i).feature');%求个类别的协方差矩阵s_inv(i).dat=inv(s_cov(i).dat);%求协方差矩阵的逆矩阵_s_det(i)=det(s_cov(i).dat);%求协方差矩阵的行列式end sum1=0;p=[];for i=1:2sum1=sum1+pattern(i).num;%求图像库样品总数end for i=1:2p(i)=pattern(i).num/sum1;%求类别的先验概率end h=[];mean_sap=[];for i=1:2mean_sap(i).dat=mean(pattern(i).feature')';%求每类图像的特征值end 6780人工智能及识别技术本栏目责任编辑:唐一东

第8卷第28期(2012年10月) Computer Knowledge and Technology 电脑知识与技术3图形用户界面%计算最大的判别函数for i=1:2h(i)=(pcasamp-mean_sap(i).dat)'*s_inv(i).dat*(pcasamp-mean_sap(i).dat)*(-0.5)+log(p(i))+log(abs(s_det(i)))*(-0.5);end [maxvalmaxpos]=max(h);y=maxpos;

利用MATLAB 程序特点进行模式识别算法编程减少了编程的工作量,对于一个成功的软件来说,其内容固然应该是第一位的,但除此之外,图形界面的优劣往往也决定着该软件的档次。MATLAB 图形用户界面的优点是工具箱形象直观,利用其自身的GUIDE 功能来完成界面结构的设计。图像识别系统的界面程序主要内容就是每个控件的回调函数,利用回调函数,把功能分散的模式识别函数整合在如图1的主界面中,下面以控件“载入图像”为例,给出回调函数Callback 的语句function pushbutton1_Callback(hObject,eventdata, handles) global sample [fnamepname index]=uigetfile({'*.jpg'},'');if index str=[pnamefname];c=imread(str);axes(handles.axes1)image(c);axisoff end C.rgb=c;aa=fenge(C.rgb);for j=1:16tt(j)=color(aa(j));j=j+1;end C.zs=tt;sample=tt;在MATLAB 提示符下键入识别系统名“txsb3”命令则启动如图1所示的识别系统主界面,用户可由其中的载入图像按钮载入需要识别的图像,在菜单栏中选取相应的识别算法,系统就可在相应位置显示图像的类别,主颜色矩阵,

分类时间等信息。

图1图像分类识别系统主界面

4总结

本文介绍了如何利用MATLAB 软件及图形用户界面开发和设计图像分类系统的方法和步骤,图像分类是信息处理的重要研究方向,其中涉及了包括有图像特征提取、建立图像数据决策表,选取适当模式识别算法实现图像的分类。本文选取了模式识别常用的基于最小错误概率的贝叶斯算法,实现了对两类图像的分类问题。利用MATLAB 图形用户界面(GUI )方法,设计了良好的人机交互系统的主界面,最后给出了实际例子的程序运行结果,对推动模式识别理论在图像分类问题实践中的应用和普及,具有实际意义。

软件菜单中的算法还不完善,系统的性能还需要进一步提高,以满足多类图像的识别问题,进一步工作包括增加聚类分析等算法,实现对三类及多类的图像识别问题。

参考文献:

[1][2][3][4][5]杨淑莹. 模式识别与智能计算—MALAB 技术实现[M].北京:电子工业出版社,2008:67-78. 高成, 李淑红.MATLAB 图像处理与应用[M].北京:国防工业出版社,2006:32-45. 吴成玉, 邰晓英, 赵杰煜. 基于颜色特征的图像检索[J].计算机应用,2004,(24):135-137.余芳. 基于颜色特征的图像检索技术研究. 硕士学位论文. 中国石油大学,2007. 徐择峰, 陈世鸿. 一种统一的文本与图像分类算法[J].武汉大学学报:理学版,2004,50(1):79-82.人工智能及识别技术本栏目责任编辑:唐一东6781


相关内容

  • 遥感图像分类
  • 1 引言 随着卫星遥感图像和航空遥感图片分辨率的不断提高, 人们可以从遥感图像中获得更多的有用的数据和信息. 伴随着"数字地球"概念的提出, 越来越多的民用场合需要用到遥感图像, 包括资源调查, 自然灾害观测.大气气象预报等.由于不同场合遥感图像的应用对遥感图像处理提出了不同的要 ...

  • 基于图像处理的人群行为识别方法综述_高玄
  • 总第322期2016年第8期 计算机与数字工程 Comuter&DiitalEnineerin pgggVol.44No.8 1557 基于图像处理的人群行为识别方法综述 高 玄1 刘勇奎2 汪大峰1 * ()()北方民族大学计算机科学与工程学院 银川 7大连民族学院计算机科学与工程学院 大 ...

  • 概率加权质心跟踪算法研究
  • 第37卷第4期 Vol.37No.4 红外与激光工程 InfraredandLaserEngineering 2008年8月Aug.2008 概率加权质心跟踪算法研究 蔡胜兵1,段哲民1,高进 1,2 ,许家栋 1 (1.西北工业大学电子信息学院,陕西西安710072:2.中国空空导弹研究院,河南洛 ...

  • 物联网信息融合技术及存在的问题
  • 物联网信息融合技术及存在的问题研究 王 洪 波1,2 (1. 合肥工业大学 管理学院 合肥 23009:) (2. 过程优化与智能决策教育部重点实验室 合肥 230009) 摘要:物联网是通过各种传感设备将物品与互联网连接起来的一种新型网络.在物联网信息感知过程中,信息融合已成为一个关键性技术.本文 ...

  • 基于贝叶斯优化构建DBN结构优化算法
  • 第29卷第10期 2007年10月 文章编号:1001-506X(2007)10-1732-06 系统工程与电子技术 SystemsEngineeringandElectronics Voi.29No.10 Oct.2007 基于贝叶斯优化构建DBN结构优化算法 肖秦琨1'2,高 嵩1,高晓光2 ( ...

  • 模式识别理论及其应用综述
  • 模式识别理论及其应用综述 熊超 浙江理工大学公共计算机教学部 学工作者近几十年来的努力,已经取得了系统的研究成果. 1.2模式识别的方法 现在有两种基本的模式识别方法,即统计模式识别方法和结构(句法)模式识别方法.统计模式识别是对模式的统计分类方法,即结合统计概率论的贝叶斯决策系统进行模式识别的技术 ...

  • 基于遗传算法的贝叶斯网络模型研究
  • 2756 2009,30(11) 计算机工程与设计computerEnginee-ngandDesign ・人工智能・ 基于遗传算法的贝叶斯网络模型研究 陈望宇, 廖芹 (华南理工大学理学院应用数学系,广东广州516040) 摘要:目前贝叶斯网络缺乏支持结构建立,参数学习.知识推理的一致算法,使知识 ...

  • 人工智能答案终极版
  • 人工智能复习参考(2015工程硕士) 第1章 绪 论 1-1. 什么是人工智能?它的研究目标是什么? 人工智能(Artificial Intelligence),简称AI,又称机器智能(Machine Intelligence,MI),主要研究用人工的方法和技术开发智能机器或智能系统,以模仿.延伸和 ...

  • 最小错误率贝叶斯分类器
  • 硕士研究生专业课考试大作业 课程名称: 课程编号: 任课教师姓名: 职称: 学生姓名: 学号: 作业题目: 成绩:模式识别 063806 刘海波 副教授 黄跃平 S309060181 最小错误率贝叶斯分类器 二〇一〇年四月二十五日 最小错误率贝叶斯分类 摘要:统计决策理论是处理模式识别问题的基本理论 ...