有效性分析-电动折弯机数控滚圆机弯管机价格低液压滚圆机多少钱
作者:lujianjun | 来源:欧科机械 | 发布时间:2018-07-29 15:13 | 浏览次数:

聚类分析中利用有效性指标判断数据集的正确类数极易受到噪声数据、类之间分离性以及聚类算法的影响,所确定类数的正确性难以得到保证。为克服这个问题,以文献[1]中的数据约减方法为基础,对原数据集和约减后的数据集利用有效性指标进行正确类数判别。实验表明:该方法能增大类之间的分离性,有效判断数据集的最优类数。 ,找到使log(wk)下降最快的k值,即最优的类数。DBI和Gap指标通常都采用试错法的策略,即在一个类数的可能范围内[cmin,cmax],反复使用实施聚类,通过指标的最优值确定类数,通常cmin取2,而cmax不超过槡n。2本文提出的方法使用聚类有效性指标确定类数的正确性严重受到以下因素影响:数据集中存在的大量噪声数据、类与类之间的不可分性以及聚类算法的不稳定性等等[9],本文的研究表明,通过数据约简能够有效地降低上述因素的影响。2.1基本动机图1显示了人工数据集Set1和Set2在二维坐标下的分布情况。通过基于张开角的数据约简方法进行约简。图2、图3分别显示了约减30%和90%数据点后的结果,其中星号为保留下来的数据点,黑点的为约减掉的数据点。从约减结果可以看出,约减后的数据点逐渐趋向中心,数据集中类别分离性更加明显。图1原数据集Set1和Set2图230%的数据点约简图390%的数据点约简因此,将数据集中非关键的数据去除,使数据集中类别的分离性更加明显,容易得到更加准确的类数判断[1本文由张家港市泰宇机械有限公司弯管机滚圆机滚弧机网站采集网络资源整理! http://www.gunyuanji.wang0]有效性分析-电动折弯机数控滚圆机弯管机价格低液压滚圆机多少钱。2.2确定计算方向角的最优方式上述基于张开角测度的数据约减方法根据数据集中各个数据点张开角的不同对数据集进行约减。为了得到最优的约减效果,确定以下优化目标:使数基于数据约减的聚类有效性分析的测度最大化。该优化目标基于两点:首先,数据点之间的测度值差别越大,约简结果越稳定[11];其次,方向角测度较大的点对应各个类的核心点而较小的点对应边界点;因此,数据点之间测度值差别的最大化将增大这两类点之间的差别,从而随着约简过程的进行,边界点以及噪声点逐渐被去除,类之间的可分性越来越强。据此定义以下目标函数max(∑ni=1(m(xi)-m珚)2n-1)(9)这里,m珚=∑ni=1m(xi)n,得到此时194332实验中,首先使用张开角的数据约减方法对数据集进行不同比例的约减,对约减前后的数据集运用k-means进行聚类,然后对聚类结果分别应用DBI、Gap两个指标进行最优类数的判别,实验结果如表2、表3以及图4、图5所示。从实验结果中可以得出以下结论:1)从表2、表3可得,与约减前的最优类数相比较,约减后的最优类数更加准确或更加接近数据集的真实类数,说明约减后数据集中类别之间的分离性更加凸显,因此,该方法对于聚类中最佳类数的判别具有一定的有效性。然而对类数未能正确判断的数据集,实际上,数据集中类的形状是任意的,无法用k-means聚类,因而无法得到正确的类数判别有效性分析-电动折弯机数控滚圆机弯管机价格低液压滚圆机多少钱本文由张家港市泰宇机械有限公司弯管机滚圆机滚弧机网站采集网络资源整理! http://www.gunyuanji.wang