KeyQuestions

作者: inspiredhss | 来源:发表于2020-03-31 08:13 被阅读0次

KeyQuestions

1、随机采集实时流数据如何保证随机性且概率均等？
http://wenda.chinahadoop.cn/question/383
2、从左上角到右下角每个格子权重不一如何路径最短？
3、反转链表？
4、数组元素最快查询个数时间？
5、离散数据用在Wide&Deep的哪一侧？
6、LightGBM为啥快？
GBDT 准确率高一次二次；
XGBoost：连续型；分割点；信息增益率信息增益基尼系数；
普通决策树分桶；俩桶？
XGBoost 连续排序唯一值 0123--100相邻中值切割点；穷举；数据集中值；
Wide 离散；LR：连续值离散化；
7、梯度下降一阶牛顿法二阶导数；深度学习：变形；
先用梯度下降最优慢；Adam跑大概范围梯度下降；
7、AUC模型训练中迭代如何计算？ROC曲线如何形成？
卡定不同阈值-指标训练集总样本概率 0-1 正例假阳性真阳性；
0.7-0.8AUC 卡定不同阈值输出不同结果的平均；
8、ALS与ALSW2有啥区别？
9、ALS的优化方法？
10、模型评估，ctr浏览时长等价打分数据如何使用？
用户正样本；负样本；
规则同类的过滤；

11、两个字符串最长子串？
12、Gini原理？交叉熵？信息熵？
不确定性混乱程度不纯度；分类中？分类好坏？
两个分布的差异分类后的与真实的；
数据间差异程度？根据某个指标一堆-两堆；每一堆数据各自的差异度加权；
13、为啥用FTRL优化Wide？
14、DeepFM与WideFM哪个好为啥？
15、随机森林与XGBoost？
Bagging并行多个决策树均值；
XGBoost 决策树拟合前几轮预测残差 Boosting；残差；
LightGBM 子过程并行但仍是Boosting；
Stacking：Bag基础上改进，投票预测结果，家模型
16、KCNN原理？这里为啥选择卷积？注意力网络；
17、对于用户行为数据如何处理？空白数据？如何提高置信？
18、LSH怎么工作？输入输出是啥？内容输入啥？用户输入哪些？
19、如何过拟合？
20、讲讲Word2Vec中 cbow与skip-gram模型？
21、深度模型训练时，初始化权重可以为0吗？为啥？
22、DropOut？还有啥？
BN：batch normolization; 每层计算后结果分布每层正态前一层正态本层正态；

23、Spark如何按照某字段groupby？如何统计TopK?
24、Kafka如何实现数据同步？Partition？参数含义要把握！
25、离线召回？排序？调用模型还是数据表？服务部署？调度逻辑顺序？

网友评论

本文标题：KeyQuestions

本文链接：https://www.haomeiwen.com/subject/gjhoehtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

KeyQuestions

相关文章

KeyQuestions

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读