当前位置 博文首页 > dastu的博客:聚类分析(三)——DBSCAN算法

    dastu的博客:聚类分析(三)——DBSCAN算法

    作者:[db:作者] 时间:2021-09-19 19:28

    一.简介

    DBSCAN算法是一种基于密度的聚类算法。

    基于密度的聚类算法会寻找被低密度区域分离的高密度区域。

    .

    该算法我们首先需要将所有的点分为:核心点,边界点,噪声点。

    区分这些点的依据是根据我们提前给出的MinPts和Eps,这里假设我们提前给定MinPts=7
    核心点:如果该点的给定邻域内点的个数超过给点的阈值MinPts。下图的点A,以A为圆心,Eps为半径的区域内共有7个点(包括点A和点B一共7个),那么A就是核心点。

    边界点:边界点不是核心点,但它落在核心点的邻域内。 下图的点B,以B为圆心,Eps为半径的区域只有4个点,小于MinPts,所以B不是核心点,但由于它落在核心点A的邻域内,所以它是边界点。

    噪声点:噪声点是除了核心点和边界点之外的点。如点C,以C为圆心,Eps为半径的区域内只有3个点,所以它不是核心点,并且它不在A的邻域内,所以它不是边界点。所以它为噪声点。
    在这里插入图片描述

    二.DBSCAN算法

    1.将所有的点标记为核心点、边界点、噪声点
    2.删除噪声点
    3.为距离在Eps之内的所有核心点直接赋予一条边
    4.每组连通的核心点形成一个簇
    5.将每个边界点指派到一个与之关联的核心点所在的簇中

    参考书籍:
    《数据挖掘导论》由人民邮电出版社出版,[美]作者Pang-Ning Tan,Michael Steinbach,Vipin Kumar 合著

    cs