重点梳理
机器学习
1、如何解决样本不均衡的问题?比如目标检测任务,背景很多,目标很少,怎么办?
https://blog.csdn.net/Jemila/article/details/77992967
2、怎么数据增强?怎么对图像进行数据增强?
3、如何解决过拟合的问题?
4、有哪些模型评价指标?AUC取值范围?(x2)
5、参数更新方法有哪些?
6、手写sigmoid函数的导数
7、手写逻辑斯蒂回归,交叉熵损失函数的公式(x2)
8、每个样本有100维特征,标签是性别(男、女),用线性回归和逻辑回归分别分类,哪种会好一些?两者有什么特点?
9、逻辑斯蒂回归为什么用sigmoid函数?
10、二分类模型中负例很多如何解决?
11、SVM(不常见)
12、GBDT(重点)
13、XGBOOST
深度学习
1、手推梯度反向传播公式
2、unet尺寸会变吗?每一层连起来的时候尺寸不一样怎么办?
3、激活函数有哪些?激活函数对结果影响大吗?(重点)
4、怎么理解dropout?
5、自己一般怎么调参?调哪些参数?
6、怎么理解卷积?算一下特征图卷积后的大小
7、你在训练网络的时候用什么初始化方式?如果初始化时全为0会有什么问题?(参数全部相同)
8、一个神经元,简单手写一下反向传播的梯度更新公式
9、图像局部特征提取算子是什么?介绍拉普拉斯算子(二阶梯度)
10、l1和l2正则化的作用和区别,从梯度角度解释
数据结构、C++基础知识
1、python、C++里list、set、dict是怎么实现的?
https://blog.csdn.net/single_wolf_wolf/article/details/52854015
2、如果让你用C++实现一个map,你会怎么做?
3、讲到了散列函数,然后问会冲突吗?冲突怎么处理
4、map的底层结构,为什么map的查找复杂度为O(1)?
5、malloc和new的区别,解释new的内存分配机制
6、解释堆和栈的区别(内存方面的堆和栈)
7、C++指针和引用的区别是什么?
8、用什么操作系统比较多?LINUX中什么命令可以得到文件夹下所有文件的数目
算法
1、讲一下快速排序,手写快速排序,时间复杂度(x3)
2、有一个无序的数组,怎么找到数组第K大的数?用快速排序怎么做?时间复杂度是多少?
3、剑指offer原题,找出数组中重复的数字,时间复杂度和空间复杂度最低
4、给定一个用户点击商品的日志文件(10亿条记录),格式形如
//userid, itemid, click_time
//要求计算点击次数最多的N个商品 c++/java/python
5、跳台阶,一次只能跳一步或者两步,求台阶数为n时,总的方法数
6、跳台阶,一次只能跳a步或者b步,b>a,求台阶数为n时,总的方法数
7、算法题
struct list
{
int val;
bool deleted;
}
给定两个unordered 的list数组,合并数组, 如果该数的deleted为true,则合并数组里不能出现这个数。
例:
数组1
1 deleted
2
1
3
4
数组2
2 delete
3
4
5
合并后应该输出:3 4 5
8、两两反转链表的结点(递归和非递归)
9、算法题:在一个2*n的地面上铺设瓷砖,有两种一种是a 一种是b形状的,问一共有多少种铺设方法。
10、pow(a,b) 注意边界条件
11、LRU缓存
12、堆排序
开放性问题
1、你理解的图像处理一般用CNN效果好的原因是什么?
2、你了解nlp吗?开始讲nlp的例子,然后问你怎么理解CNN为什么不适用于nlp?
3、你对现在市面上的推荐算法有什么了解,说一说你的体验
4、大概聊一聊协同过滤,目的是扩展用户视野,但是发现用户点击率不高,所以现有的模型一般还是基于用户的日志来做推荐,如果让你建模,你怎么保证扩展视野的同时增加点击率?
5、做过分类的项目吗?
6、分割和超分的区别?
7、听说过nvidia的DSR吗?
8、有什么要问面试官的吗?
9、假如现在我们已经建立起了一个关于猫的抖音频道,怎么来优化模型?
10、假设抖音每天有1000万的短视频,每段15s,现在要把其中有猫的视频都找出来,有什么想法?分类用什么模型比较好?
网友评论