机器学习：教你用numpy撰写KNN算法并预测价格走势

机器学习：教你用numpy撰写KNN算法并预测价格走势

作者: 城2021 | 来源:发表于2019-04-26 16:42 被阅读3次

机器学习：教你用numpy撰写KNN算法并预测价格走势
常用机器学习算法
01 KNN算法 - 概述
kNN算法
KNN算法基础
01-kNN算法实战-(机器学习实战)
KNN算法以及欧式距离
机器学习系列（六）——knn算法原理与scikit-learn底
机器学习实战---KNN算法的应用小例
2020-08-10--KNN01

KNN算法简介

KNN 算法实际上是一句中国谚语智慧的体现：“物以类聚，人以群分”，是一种聚类分析的方法，也是目前最简单的无监督类学习方法。

我们在日常生活中有这样的推论，身边朋友都爱喝酒的人，可能是爱喝酒的人；身边朋友都认为身边朋友都爱喝酒的人可能是爱喝酒的人的人，可能是认为身边朋友都爱喝酒的人可能是爱喝酒的人的人。

基于这样的逻辑，如果现在我们有几个点，分布在二维平面上：

现在突然出现了一个这样颜色不明的点（这明明就是黑的）

很自然的我们下意识的觉得这个点

是蓝的！

好好好，别动手有话好商量，事实上正常人肯定觉得这个点颜色应该是红色的。

这种聚类思想可以运用到很多分类问题中，比如股票价格未来走势的预测（醒醒吧，也就这么顺口一说，要是准确率高我还会在这里写文章吗？）

这种方法的严谨的数学表达是：首先确定距离的度量方法，事实上在数学上有很多种距离的度量方法，比如切比雪夫距离，欧氏距离，曼哈顿距离，这些距离实际上对应的是一个叫做范数的数学概念，鉴于这篇文章不是数学讲堂，同时还指望着流量点击养家糊口，就不一一叙述了。这里我们给出对欧式距离（L2 范数）的计算方法

对于 x ∈ Rn，存在 x 的集合 X，x1、x2 ∈ X，定义

诶嘿，是不是突然发现很熟悉，然后读者们可能就要开始骂了，故弄什么玄虚，这不就是 n 维空间内点的直线距离吗，没有错，L2 范数对应的就是点在空间内部的直线距离。根据分类的标的不同，我们使用不同的距离度量方法来适应样本的独特性质，不过一般情况下使用直线距离就足够了，毕竟老夫也不是什么恶魔，况且 L2 范数已经具有相当良好的数学性质，比如连续，可导…跑题了，咳……

既然刚刚已经明确了距离的概念，这样当我们拥有一个非常完整的样本的情况下，特征完整标签明确。当我们想对一个新来的点或者一些样本进行分类的时候，我们可以逐一计算这个（些）新来的样本和已知的样本点之间的距离，然后取离这个点最近的 K 个已知样本。统计一下这些已知样本点对应标签的数量，选取出现次数最多的标签作为新来样本点的分类。

当然这个 K 参数是自行选择的，有一个小技巧是，K 参数尽量避免成为标签集合数量的倍数，原因试一试就知道了。

KNN 算法的优点在于：

①对病态数据不敏感（毕竟取了K个数据，有一两个病态的数据基本不影响结果。有的亲一定要杠一下，就要问了：要是全部样本都病了怎么办呢？亲，我们这边建议殴打给你样本数据的人）

②分类精度比较高

③对数据不需要预先的假设（比如强行规定他服从XX分布……金融分析最喜欢做的事ORZ）

KNN算法的缺点在于：

①计算复杂度高，大样本下计算时间长

②边缘样本分类精度明显下降

KNN算法实战

1.选取标的：中证 800

2.选取特征：5 日MA，5 日价格波动率，日内成交额

3.分类目标：当日获取数据后 3 日收益率，为正标注为 1，为负标注为-1，0 变动标注为 0

4.特征处理：对量纲不同的数据进行归一化

5.算法实现：导入必要库

获取价格，计算三日收益率并标注数据

提取特征值并归一化

分离测试样本与训练样本

定义计算L2范数方法

预测并评估性能

6.训练结果：

最终全市场训练准确率在各个参数下，均值收敛到53.6%，虽然一般但是已经好过随机选择很多了

值得一提的是……emmmm，有只股票的预测准确率居然达到了100%......这显然就是样本数量取少了碰巧蒙上了，但是不要紧，至少这个方法会了就行了。

点击【阅读原文】，查看完整研究源码~

相关文章

机器学习：教你用numpy撰写KNN算法并预测价格走势
KNN算法简介 KNN 算法实际上是一句中国谚语智慧的体现：“物以类聚，人以群分”，是一种聚类分析的方法，也是目前...
常用机器学习算法
常用机器学习算法常用预测（分类，回归）模型：分类算法：LR , SVM，KNN 矩阵分解：FunkSVD，Bi...
01 KNN算法 - 概述
KNN算法全称是K近邻算法（K-nearst neighbors，KNN） KNN是一种基本的机器学习算法，所谓...
kNN算法
一. kNN算法 kNN(k-NearestNeighbor)，即k最近邻算法，是机器学习算法中最基础的入门算法。...
KNN算法基础
KNN算法是机器学习中最好理解的算法之一，属于惰性学习算法的典例。惰性指模型仅通过对训练数据集的记忆功能进行预测，...
01-kNN算法实战-(机器学习实战)
最近在看机器学习实战这本书。刚开始看kNN算法，并写了些程序，分享下一些感悟和细节。什么是kNN kNN中文又称...
KNN算法以及欧式距离
1.KNN算法介绍 KNN 是什么？ KNN(K-Nearest Neighbor)是最简单的机器学习算法之一，可...
机器学习系列（六）——knn算法原理与scikit-learn底
KNN算法本篇将介绍knn算法，knn算法因为思想非常简单，运用的数学知识比较浅显，是非常适合机器学习入门的算法...
机器学习实战---KNN算法的应用小例
ok,今天花了一天时间看了小人书(机器学习实战),并且撸到了KNN算法,并完成了一个KNN算法的应用真的!!!小...
2020-08-10--KNN01
KNN算法的原理介绍KNN算法的一个简单实现(肿瘤分类)将KNN算法封装成函数机器学习套路使用scikit-lea...

网友评论

本文标题：机器学习：教你用numpy撰写KNN算法并预测价格走势

本文链接：https://www.haomeiwen.com/subject/yrjqnqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

量化交易&宽客

热点阅读

投资理财

量化交易&宽客

理财投资

关于我们|服务条款|联系我们|机器学习：教你用numpy撰写KNN算法并预测价格走势|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！