2.1 kNN 算法
引入:电影识别问题
现在我有一些电影,其打斗镜头、接吻镜头、电影类型成一个表格,并且存在着一定的关系。现在我有一部新的电影,已知打斗镜头数量和接吻镜头数量,请问这最有可能是一部什么电影。
我们想象一个坐标轴,x 轴是打斗镜头;y 轴是接吻镜头。然后将源电影的点放在这个轴上。然后我们就可以得到一个很自然的思路:我的目标电影离哪些源电影更近,我的目标电影就更有可能是什么电影。
那么我们如何衡量最近呢?我们知道有三种距离:曼哈顿距离(绝对值差之和),切比雪夫距离(绝对值差最大值),欧几里得距离(方差)。然后我们要考虑到我们要利用一个强大的工具:矩阵。而事实上,这几个距离当中最原教旨的距离就是欧氏距离了。所以最后的方案就是采用欧氏距离。

