聚类(Clustering)就是一种寻觅数据之间内在结构的技术。
聚类把全体数据实例组织成少量类似组,而这些类似组被称作簇。处于相同簇中的数据实例彼此相同,处于不同簇中的实例彼此不同。
聚类技术通常又被称为无监督学习,与监督学习不同的是,在簇中那些表示数据类别的分类或者者分组信息是没有的。
数据之间的类似性是通过定义一个距离或者者类似性系数来判别的。
聚类(Clustering)就是一种寻觅数据之间内在结构的技术。
聚类把全体数据实例组织成少量类似组,而这些类似组被称作簇。处于相同簇中的数据实例彼此相同,处于不同簇中的实例彼此不同。
聚类技术通常又被称为无监督学习,与监督学习不同的是,在簇中那些表示数据类别的分类或者者分组信息是没有的。
数据之间的类似性是通过定义一个距离或者者类似性系数来判别的。