您现在的位置是:首页 > IT基础架构 > 软件与服务 >
决策树算法在焊接工艺设计中的应用
摘要在焊接工艺设计过程中,因其信息量较大,人工无法对大量参数进行科学分析,也就无法获得可能潜在的信息和规则。...
0 前 言
汽车产业是我国工业的支柱产业之一。汽车中各总成均是直接或间接地安装在车架上,作为汽车结构的重要组成部分,车架在行驶过程中不仅承受着车体自身质量及装载货物的重力作用。而且还承受着汽车运行过程中的载荷作用。为避免某些焊接缺陷对焊接接头变形以及对焊件强度的影响。保证汽车行驶的安全性,选用合理的焊接方法及工艺参数,保证焊缝具有良好的焊接质量是十分必要的。
车架部分的焊点数量较大,而不同的焊点根据板材牌号以及厚度的不同组合会选用不同的焊丝直径和不同的工艺参数,其焊接信息的规模之大,容易在人工管理过程中出现问题,重复、遗漏的现象时有发生。根据工人以及设计人员的设计经验,无法对设计过程中获取的大量参数进行科学分析,也就无法获得可能潜在的信息和规则。在焊接工艺设计中确定焊接参数,不仅可缩短投产前期的设计时间,节约生产成本,而且还能够提高焊接接头的强度,减少焊接变形的产生。
数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中提取隐含在其中的、并且潜在有用的信息和知识的过程。数据挖掘是知识发现的核心环节。其主要任务有分类、聚类、回归分析、概括等。其中,决策树算法是一种逼近离散函数值的方法,其分类精度高,生成的模式简单,并且对噪声数据有很好的健壮性,因而是目前应用最为广泛的归纳推理算法之一,在数据挖掘中受到研究者的广泛关注。
本文针对在汽车生产过程中占有举足轻重地位的CO2气体?;ず腹ひ丈杓乒蹋捎镁霾呤鞯氖萃诰蚍椒ǚ治龈髦趾附庸ひ找蛩囟院附咏油烦尚蔚挠跋?,挖掘出隐含的工艺知识,有效地指导实际生产,极大地提高了焊接接头的质量和性能。
1 决策树的基本原理
决策树方法最早产生于上世纪60年代,到70年代末。由J Ross Quinlan提出了ID3算法,此算法的目的在于减少树的深度。但是忽略了叶子数目的研究。C4.5算法在ID3算法的基础上进行了改进,对于预测变量的缺值处理、剪枝技术、派生规则等方面作了较大改进,既适合于分类问题,又适合于回归问题。
1.1 决策树的构造方法
决策树构造的输入是一组带有类别标记的例子,构造的结果是一棵二叉树或多叉树。二叉树的内部节点(非叶子节点)一般表示为一个逻辑判断,如形式为a=aj的逻辑判断,其中a是属性,aj是该属性的所有取值:树的边是逻辑判断的分支结果。多叉树(ID3)的内部结点是属性,边是该属性的所有取值,有几个属性值就有几条边。树的叶子节点都是类别标记。
由于数据表示不当、有噪声或者由于决策树生成时产生重复的子树等原因,都会造成产生的决策树过大。因此,简化决策树是一个不可缺少的环节。寻找一棵最优决策树,主要应解决以下3个最优化问题:①生成最少数目的叶子节点;②生成的每个叶子节点的深度最?。虎凵傻木霾呤饕蹲咏诘阕钌偾颐扛鲆蹲咏诘愕纳疃茸钚?。
ID3算法是最为经典的决策树学习系统,采用自上而下的不回溯策略,能保证找到一棵简单的树。其工作过程为:首先选出最有判别力的测试属性,把数据分成多个子集,每个子集又选择最有判别力的另一测试属性进行划分.如此一直进行到最后划分出的所有子集仅包括同一类型的数据为止。最后得到一棵决策树,可以用它对新的例子进行分类。ID3中测试属性的选取是以信息熵的下降速度为标准。信息熵的下降也就是信息不确定性的下降。
ID3是在2个假设的基础上采用基于信息熵的方法,把对象集C分为2类,其中P类对象有p个,N类对象有n个,假设为:任何一个正确的决策树,对所有对象依据其所占的比例来进行分类,即对于任意的对象属于P类的概率是,属于Ⅳ类的概率是
。
当用一个决策树对一个对象进行划分时,返回一个类别。一个决策树可以被看成是分类信息的来源,决策树对做出正确划分需要的期望信息熵是:
假如条件属性A有属性值{A1,A2,A3,…,Av},被用作决策树的根时,它将对象子集划分为{C1,C2,C3,…,Cv},其中,Ci是属性A取Ai的对象,包括P类pi个对象,包括N类ni个对象,那么,子树Ci的期望信息熵是I{Pi,ni},对于树根A划分整个树所需的期望信息熵:
通过属性A来分支的信息增益是:
选取属性作为决策树节点的原则就是依据能够得到最大信息增益的属性来分类形成树,然后ID3算法依次检测每个候选属性,用相同的处理过程递归地形成决策子树C1,C2,C3,…,Cv。
1.2 决策树的改进
本文中采用决策树C4.5算法进行知识的发现,C4.5算法继承了ID3算法的全部优点,并且进行了改进,提出了用增益比代替增益进行属性的选择,增益比例的定义为:
其中,确定属性A本身需要的信息熵是:
采用增益比去划分属性得到的决策树,其中每个节点取具有最大信息增益比的属性。
1.3 决策树的修剪
完整的决策树生成以后,一般不能用于对新数据分类或预测,主要原因是:完整的决策树对训练样本特征的过度拟合。对决策树进行修剪也是最常用的简化决策树的方法,它主要包括预先剪枝和后剪枝。预先剪枝是在建树的过程中,当信息增益达到某个预先设定的阈值时,节点不再继续分裂,内部节点成为一个叶子节点。后剪枝是在允许决策树得到最充分生长的基础上,根据一定的规则,剪去决策树中的那些不具有一般代表性的叶节点或分枝。
遍历形成的决策树,从根到叶就发现若干条路径,每一条路径对应一条规则,整棵树就形成了一组析取表达式规则,然后详审规则集去发现最有用的子集,最后的规则集用计算机可读的格式存储在一个文件中。
2 车架焊接工艺设计的知识获取
2.1 数据获取及准备
在汽车的生产制造过程中,CO2气体?;ず敢虺杀镜?。生产效率高,抗锈、抗氢和抗裂纹的能力强,焊后不清渣,变形小,易操作,适于全位置焊,被广泛应用于车架的装焊生产中。CO2气体?;ず负附咏油分柿康暮没担唤鼍龆顺导芎附幼芭涔痰闹圃炱?,同时也决定了汽车使用的可靠性和安全性。在车架焊接工艺设计中,对于不同的板厚,选用不同的焊丝,包括焊丝的型号和直径,以及CO2气体保护焊焊接工艺参数的选取都会对接头的成形造成影响.在本次试验过程中,选取汽车生产中大量使用的低碳钢Q235A钢为母材,焊丝牌号为H08Mn2SiA,焊机型号为NBC-350,选择5个焊接工艺参数(条件属性)来分析对焊接接头成形的影响,它们分别是:焊丝直径、焊接电流、电弧电压、气体流量及焊丝伸出。分别对产生气孔和焊接变形共同作为一个决策属性来讨论焊接接头的成形情况,这样不仅可以充分而全面地分析问题,又可以减少运算量,以提高效率。
本文从汽车车架焊接生产过程中采集40组不同的工艺和几何参数,对焊接件进行分析,得到的数据见表1,其中列出了具有代表性的20组数据。
C4.5算法既可以对离散值进行分析,也可以对连续值进行分析。本文为了能够更细致地反应各工艺参数对成形结果的影响,只对其进行离散值分析。在采用离散化数据前,首先通过焊接知识对表1中的条件属性数据按表2进行离散化,其中条件属性用数字1,2,3来表示不同的等级条件,决策属性分别用1(SAFE,SAFE),2(SAFE,UNSAFE),3(UNSAFE,SAFE),4(UNSAFE,UNSAFE)表示。
2.2 结果分析
分析各参数对焊接气孔的产生和焊接变形的影响,运用C4.5算法对条件属性和决策属性进行分析,得到的决策树如图1,图2所示。
通过决策树的规则形成和规则审查,可以得到有价值的规则如下:
Rule1: Electricity=1→class air vent and metamorphose unsafe
支持度20%,置信度100%;
Rule2:Electricity=2,Air flux=1→class air vent unsafe and metamorphose safe
支持度5%,置信度50%;
Rule3:Electricity=2,Air flux=2→class air vent safe and metamorphose safe
支持度27.5%,置信度64%;
Rule4:Electricity=2,Air flux=3→class air vent unsafe and metamorphose safe
支持度5%,置信度75%;
Rule5:Electricity=3,Voltage=2→class air vent safe and metamorphose safe
支持度22.5%,置信度56%;
Rule6:Electricity=3 Voltage=3→class air vent safe and metamorphose unsafe
支持度10%。置信度100%。
从修剪的决策树和生成的规则可以清晰地看出:焊接电流对焊接接头成形影响最大,起主导作用,直接影响着气孔和焊接变形缺陷的产生;对于选用2种焊丝直径的情况下,如果焊接电流过大,都会导致产生焊接变形:而在焊接电流较小,并且?;て辶髁恳步闲∈保阜齑撞軱。而在焊接电流较大且?;て辶髁恳步洗笫比菀撞附颖湫巍:附拥缌鞔笮?、电弧电压以及保护气体流量的控制对焊接变形和气孔产生也有很大的影响。因此,若想尽量减少焊接气孔和变形的产生,需控制焊接电流在(90,120)A,且?;て辶髁吭?8,10)L/min,或者同时控制焊接电流在(120,150)A,且电弧电压在(23,25)V。
进行各工艺参数对焊接缺陷影响综合分析,焊接电流、电弧电压、?;て辶髁康纳柚枚院附咏油返某尚涡Ч鹬饕饔谩S煤附拥缌?、电弧电压和保护气体流量的合理匹配来控制成形过程,可以得到较好的成形效果。
3 结 论
通过对数据对象之间关系的分析提取隐含在数据中的模式,建立学习的机器模型,使计算机具有学习能力,是人工智能的研究核心,也是使得计算机智能化的根本途径。本文将数据挖掘技术应用于焊接工艺设计中,运用了决策树C4.5算法对汽车车架焊接接头进行成形缺陷分析,能够简单有效地分析出焊接工艺参数对焊缝成形的影响,挖掘出其中蕴涵的有价值的规律,对指导焊接工艺设计具有重要的意义。
(本文不涉密)
责任编辑: