KNN
我在做研究时使用到了较多的机器学习算法,KNN算是使用较多的,于是我完整总结了以下KNN,让大家了解了解。
K-Nearest Neighbors (KNN) 是一种简单且直观的监督学习算法,又名K近邻算法,通常用于分类和回归任务。
它的基本思想是:给定一个新的数据点,算法通过查看其最近的 K 个邻居来决定这个点所属的类别(分类)或预测其值(回归)。
KNN 不需要显式的训练过程,而是直接在预测时利用整个训练数据集。
算法逻辑步骤如下:
- 步骤1选择参数 K,即最近邻居的数量。
- 步骤2计算新数据点与训练数据集中所有点之间的距离。常用的距离度量包括欧氏距离、曼哈顿距离、切比雪夫距离等。
- 步骤3根据计算出的距离,找出距离最近的 K 个点。
- 步骤4对于分类问题,通过对这 K 个点的类别进行投票,选择得票最多的类别作为新数据点的预测类别。对于回归问题,计算这 K 个点的平均值,作为新数据点的预测值。
- 步骤5返回预测结果。