KMeans 和 SK-Learn 实战

查看原文

K-Means 算法是一个简单有效的非监督学习的聚类算法,它基于数据点的距离聚类数据,一个简单的 Python 实现是通过 sk-learn 来做。准备一个 [[a1, b1], [a2, b2], ...] 的数据,然后应用到 KMeans 模型里:

>>> from sklearn.cluster import KMeans  
>>> kmeans = KMeans(n_clusters=2) # 假设只聚类出两簇数据
>>> kmeans.fit(YOUR_DATA_HERE) # 应用模型
>>> keamns.labels_ # 获得前面准备的数据向对应的标签,每个标签对应一簇数据
[0 0 0 0  1 1 1 1]