美文网首页
学习计划

学习计划

作者: 中年危机3 | 来源:发表于2018-10-15 10:48 被阅读0次

    今天列下具体的学习计划以及知识点汇总

    推荐算法:CF,LR,SVM,FM,FTRL,GBDT,RF,SVD,RBM,RNN,LSTM,RL

    数据挖掘:分类,聚类,回归,降维,特征选择,模型评价

    数学:微积分,统计学,线性代数

    周边学科:信息论基础

    (数学和周边学科可以顺带巩固)

    以上是理论知识。

    —————————————————————————————————

    以下是实践验证或者工程化具备技能:

    编程语言:Python/R, Java/C++/C,sql,shell

    RPC框架:thrift, Dubbo,gRPC

    web服务:tornado, django, flask

    数据存储:redis, hbase, cassandra, mongodb, mysql, hdfs,hive, kafka, elasticsearch

    机器学习/深度学习:Spark MLib,GraphLab/GraphCHI,Angel,MXNet,TensorFlow,Caffe, Xgboost,VW,libxxx

    文本处理:Word2vec,Fasttext,Gensim,NLTK

    矩阵分解:Spark ALS,GraphCHI,implicit,qmf,libfm

    相似计算:kgraph, annoy,nmslib, GraphCHI, columnSimilarities(spark.RowMatrix)

    实时计算:Spark Streaming, Storm,Samza

    ————————————————————————————

    工程中检验标准学习:

    熟悉常见离线效果指标:准确率,召回率,AUC,基尼系数

    能够定义产品效果指标:点击率,留存率,转换率,观看完整率

    会做对比试验并分析实验结果:指标数据可视化

    知道常见推荐产品的区别:Feed流推荐,相关推荐,TopN推荐,个性化推送

    ————————————————————————————————

    软实力:

    英文阅读;读顶级会议的论文、一流公司和行业前辈的经典论文和技术博客,在Quora和Stack Overflow上和人交流探讨;

    代码阅读;能阅读开源代码,从中学习优秀项目对经典算法的实现;

    沟通表达;能够和其他岗位的人员沟通交流,讲明白所负责模块的原理和方法,能听懂非技术人员的要求和思维,能分别真需求和伪需求并且能达成一致。

    ________________________________

    所以基本学习思路是:理论基础+开源库(经典算法实现)+效果指标+软实力(需求沟通+分解技术)

    相关文章

      网友评论

          本文标题:学习计划

          本文链接:https://www.haomeiwen.com/subject/pvaxzftx.html