聚类分析中利用有效性指标判断数据集的正确类数极易受到噪声数据、类之间分离性以及聚类算法的影响,所确定类数的正确性难以得到保证。为克服这个问题,以文献[1]中的数据约减方法为基础,对原数据集和约减后的数据集利用有效性指标进行正确类数判别。实验表明:该方法能增大类之间的分离性,有效判断数据集的最优类数。 ,找到使log(wk)下降最快的k值,即最优的类数。DBI和Gap指标通常都采用试错法的策略,即在一个类数的可能范围内[cmin,cmax],反复使用实施聚类,通过指标的最优值确定类数,通常cmin取2,而cmax不超过槡n。2本文提出的方法使用聚类有效性指标确定类数的正确性严重受到以下因素影响:数据集中存在的大量噪声数据、类与类之间的不可分性以及聚类算法的不稳定性等等[9],本文的研究表明,通过数据约简能够有效地降低上述因素的影响。2.1基本动机图1显示了人工数据集Set1和Set2在二维坐标下的分布情况。通过基于张开角的数据约简方法进行约简。图2、图3分别显示了约减30%和90%数据点后的结果,其中星号为保留下来的数据点,黑点的为约减掉的数据点。从约减结果可以看出,约减后的数据点逐渐趋向中心,数据集中类别分离性更加明显。图1原数据集Set1和Set2图230%的数据点约简图390%的数据点约简因此,将数据集中非关键的数据去除,使数据集中类别的分离性更加明显,容易得到更加准确的类数判断[1本文由张家港市泰宇机械有限公司弯管机滚圆机滚弧机网站采集网络资源整理! http://www.g
- [2019-07-31]防水施工技术研究-数控滚圆机滚
- [2019-07-31]人工边坡稳定性分析-数控滚圆机
- [2019-07-24]住宅预制装配整体-数控滚圆机滚
- [2019-07-24]冲洗设施优化研究-数控滚圆机滚
- [2019-07-15]信道空时相关性-数控滚圆机滚弧
- [2019-07-15]系统优化法研究-数控滚圆机滚弧
- [2019-07-09]波段四通道T组件-数控滚圆机滚弧
- [2019-07-09]低噪声放大器设计-电动数控滚圆
- [2019-07-05]无损检测系统研究-数控滚圆机滚
- [2019-07-05]用户认证授权系统架-电动液压滚