电商网站建设的目的跟意义,连云港建网站公司,建设网站要多久到账,app手机应用开发公司前言
如果你对这篇文章感兴趣#xff0c;可以点击「【访客必读 - 指引页】一文囊括主页内所有高质量博客」#xff0c;查看完整博客分类与对应链接。
在介绍模糊聚类之前#xff0c;我们先简单地列举一下聚类算法的常见分类#xff1a;
硬聚类 (Hard Clustering) Connec…前言
如果你对这篇文章感兴趣可以点击「【访客必读 - 指引页】一文囊括主页内所有高质量博客」查看完整博客分类与对应链接。
在介绍模糊聚类之前我们先简单地列举一下聚类算法的常见分类
硬聚类 (Hard Clustering) Connectivity-based clustering (Hierarchical Clustering)Centroid-based Clustering (k-means clustering)Distribution-based Clustering (Gaussian Mixture Model)Density-based Clusterin (DBSCAN) 软聚类 (Soft Clustering) Fuzzy Clustering
我们之前听说的大部分聚类算法均为硬聚类即要求每个数据点只能属于一个特定的簇scikit-learn 中有关于常见硬聚类算法的可视化展示可供参考 不同于硬聚类软聚类放松了限制即允许数据点可以同时属于多个簇。接下来要介绍的模糊聚类即为一种常见的软聚类算法。 模糊聚类
模糊聚类通常用一个向量来表示一个数据点的归属向量中哪个维度的数值更大意味着该数据点距离该维度对应簇更近也可以理解为是归属于该簇的概率越大。
以 Fuzzy c-means (FCM) 聚类算法为例其过程与 k-means 非常相似
选择 CCC 作为簇个数随机赋予每个点归属于各个簇的概率向量 {wi}i1N{\{\boldsymbol{w}_i\}}_{i1}^N{wi}i1N迭代至收敛 重新计算每个簇的簇中心 {ck}k1C{\{\boldsymbol{c}_k\}}_{k1}^C{ck}k1C重新计算每个点归属于各个簇的概率向量 {wi}i1N{\{\boldsymbol{w}_i\}}_{i1}^N{wi}i1N
簇中心 ck\boldsymbol{c}_kck 计算式如下 ck∑i1Nwi,kmxi∑i1Nwi,km,\boldsymbol{c}_k\frac{\sum_{i1}^N w_{i,k}^m \boldsymbol{x}_i}{\sum_{i1}^N w_{i,k}^m }, ck∑i1Nwi,km∑i1Nwi,kmxi,
其中 m∈(1,∞)m\in (1,\infty)m∈(1,∞) 为超参控制聚类的模糊程度其数值越大聚类结果越模糊其数组越逼近 111 其聚类效果越接近 k-means。
数据点 xi\boldsymbol{x}_ixi 的概率向量 wi\boldsymbol{w}_iwi 计算式如下 wi,k1∑j1C(∥xi−ck∥∥xi−cj∥)2m−1,w_{i,k}\frac{1}{\sum_{j1}^C \left(\frac{\left\|\boldsymbol{x}_i-\boldsymbol{c}_k\right\|}{\left\|\boldsymbol{x}_i-\boldsymbol{c}_j\right\|}\right)^{\frac{2}{m-1}}}, wi,k∑j1C(∥xi−cj∥∥xi−ck∥)m−121,
其满足 ∑k1Cwi,k1\sum_{k1}^C w_{i,k}1∑k1Cwi,k1。FCM 整个聚类过程想要最小化的目标函数如下所示 J(W,C)∑i1N∑k1Cwi,km∥xi−ck∥2.J(\boldsymbol{W}, \boldsymbol{C})\sum_{i1}^N \sum_{k1}^C w_{i,k}^m\left\|\boldsymbol{x}_i-\boldsymbol{c}_k\right\|^2. J(W,C)i1∑Nk1∑Cwi,km∥xi−ck∥2. 参考资料
wiki - Fuzzy clusteringscikit-learn clustering