EN
EN

先进机器学习与图像处理学术论坛

来源: 发布时间:2020-12-07 点击: Views
|

报告题目:k-sums聚类:一种可替代k-means的高效聚类算法

报告人:聂飞平教授(西北工业大学)

报告时间:2020年12月8日(星期二)下午14:30

报告地点:大学城校区工学一号馆学术报告厅

主持人:杨志景教授


报告摘要:

谱聚类和k-means作为两种十分流行的聚类算法,相关研究一直是一个热门方向。这两种算法可以统一到同一种框架下,我们有如下发现:1.本质上,k-means致力于最小化类内的平均距离,而谱聚类致力于最大化类内的平均相似度。2.从图的观点来看,k-means采用的是全图,即任意两个样本之间的距离都没有被忽略,而谱聚类采用的是近邻图,一般只计算每个样本与其k近邻之间的相似度。我们针对平衡场景,首先对谱聚类模型做出简化,并且用近邻距离代替传统的相似度,以避免衡量相似度所带来的困扰。针对简化后的模型,我们提出了一种高效的优化算法。该算法基于标准的坐标下降方法,不同之处在于,我们针对坐标下降中涉及的子问题,设计了更快的求解算法。整个算法的复杂度为O(nk),它和聚类个数无关。因此在类别较多的数据上,相比于k-means算法,我们的算法在获得更好的性能同时,有着明显的速度优势。


个人简介:

聂飞平,西北工业大学教授、博导,科技部领军人才,主要研究兴趣为机器学习理论和方法。已发表IEEE Transactions期刊长文100余篇,CCF A类会议长文100余篇。论文总被引用20000余次,H指数76。入选科睿唯安“全球高被引科学家”,爱思唯尔“中国高被引学者”,Guide2Research“全球顶尖计算机科学家”,清华大学“人工智能全球最具影响力学者”等榜单。