当前位置 博文首页 > 晚来天欲雪,能饮一杯无?:基于K-近邻算法的手写数字识别研究

    晚来天欲雪,能饮一杯无?:基于K-近邻算法的手写数字识别研究

    作者:[db:作者] 时间:2021-06-03 14:51

    摘要:基于K-近邻算法研究手写数字(0-9)的识别问题,本文通过对手写数字的图像进行处理,提取特征向量,使用Python实现了K-近邻算法,并在此基础上开发了一个GUI测试程序,不仅能够实时测试手写识别的结果和调整k值,而且能够对识别错误的数字进行更正,将其加入训练库,使得该程序具有持续的学习能力,不断提高识别精度。

    1.引言

    ? ? ? ? ??K-近邻算法是数据分类中最简单有效的算法。通过计算未知样本与已知样本之间的距离,找出离未知样本最近的已知样本,并将该样本的类别赋予未知样本,即实现了对未知样本的分类。其中,样本之间的距离是通过对样本的特征向量进行计算得出的,每个样本在特征空间中是一个点,则只需在特征空间中计算的两点距离就能计算出两个样本之间的距离,距离越小,则说明两个样本之间越相似。在选择最近样本时,如果选择的不止一个,例如k个,则称为k-近邻,此时未知样本分类的准则为:在k个最近的样本中,将出现次数最多的样本所属的类别赋予未知样本,即完成未知样本的分类。

    ? ? ? 在本文中,首先使用python实现了一个k-近邻算法,能够对任意的样本进行k-近邻分类。然后研究了图像特征参数的提取,即从每副图像中提取特征向量用于分类算法。使用该方法对大量的样本进行研究,研究不同k值情况下的分类精度问题,最后使用该算法实现一个手写数字识别演示软件。
    下一篇:没有了