美文网首页
2020届互联网春招实习面经

2020届互联网春招实习面经

作者: 我永远喜欢西片同学 | 来源:发表于2020-07-04 16:11 被阅读0次

    重点梳理

    机器学习

    1、如何解决样本不均衡的问题?比如目标检测任务,背景很多,目标很少,怎么办?

    https://blog.csdn.net/Jemila/article/details/77992967

    2、怎么数据增强?怎么对图像进行数据增强?

    3、如何解决过拟合的问题?

    4、有哪些模型评价指标?AUC取值范围?(x2)

    5、参数更新方法有哪些?

    6、手写sigmoid函数的导数

    7、手写逻辑斯蒂回归,交叉熵损失函数的公式(x2)

    8、每个样本有100维特征,标签是性别(男、女),用线性回归和逻辑回归分别分类,哪种会好一些?两者有什么特点?

    9、逻辑斯蒂回归为什么用sigmoid函数?

    10、二分类模型中负例很多如何解决?

    11、SVM(不常见)

    12、GBDT(重点)

    13、XGBOOST

    深度学习

    1、手推梯度反向传播公式

    2、unet尺寸会变吗?每一层连起来的时候尺寸不一样怎么办?

    3、激活函数有哪些?激活函数对结果影响大吗?(重点)

    4、怎么理解dropout?

    5、自己一般怎么调参?调哪些参数?

    6、怎么理解卷积?算一下特征图卷积后的大小

    7、你在训练网络的时候用什么初始化方式?如果初始化时全为0会有什么问题?(参数全部相同)

    8、一个神经元,简单手写一下反向传播的梯度更新公式

    9、图像局部特征提取算子是什么?介绍拉普拉斯算子(二阶梯度)

    10、l1和l2正则化的作用和区别,从梯度角度解释

    数据结构、C++基础知识

    1、python、C++里list、set、dict是怎么实现的?

    https://blog.csdn.net/single_wolf_wolf/article/details/52854015

    2、如果让你用C++实现一个map,你会怎么做?

    3、讲到了散列函数,然后问会冲突吗?冲突怎么处理

    4、map的底层结构,为什么map的查找复杂度为O(1)?

    5、malloc和new的区别,解释new的内存分配机制

    6、解释堆和栈的区别(内存方面的堆和栈)

    7、C++指针和引用的区别是什么?

    8、用什么操作系统比较多?LINUX中什么命令可以得到文件夹下所有文件的数目

    算法

    1、讲一下快速排序,手写快速排序,时间复杂度(x3)

    2、有一个无序的数组,怎么找到数组第K大的数?用快速排序怎么做?时间复杂度是多少?

    3、剑指offer原题,找出数组中重复的数字,时间复杂度和空间复杂度最低

    4、给定一个用户点击商品的日志文件(10亿条记录),格式形如

    //userid, itemid, click_time

    //要求计算点击次数最多的N个商品 c++/java/python

    5、跳台阶,一次只能跳一步或者两步,求台阶数为n时,总的方法数

    6、跳台阶,一次只能跳a步或者b步,b>a,求台阶数为n时,总的方法数

    7、算法题

    struct list

    {

      int val;

      bool deleted;

    }

    给定两个unordered 的list数组,合并数组, 如果该数的deleted为true,则合并数组里不能出现这个数。

    例:

    数组1

    1 deleted

    2

    1

    3

    4

    数组2

    2 delete

    3

    4

    5

    合并后应该输出:3 4 5

    8、两两反转链表的结点(递归和非递归)

    9、算法题:在一个2*n的地面上铺设瓷砖,有两种一种是a 一种是b形状的,问一共有多少种铺设方法。

    10、pow(a,b) 注意边界条件

    11、LRU缓存

    12、堆排序

    开放性问题

    1、你理解的图像处理一般用CNN效果好的原因是什么?

    2、你了解nlp吗?开始讲nlp的例子,然后问你怎么理解CNN为什么不适用于nlp?

    3、你对现在市面上的推荐算法有什么了解,说一说你的体验

    4、大概聊一聊协同过滤,目的是扩展用户视野,但是发现用户点击率不高,所以现有的模型一般还是基于用户的日志来做推荐,如果让你建模,你怎么保证扩展视野的同时增加点击率?

    5、做过分类的项目吗?

    6、分割和超分的区别?

    7、听说过nvidia的DSR吗?

    8、有什么要问面试官的吗?

    9、假如现在我们已经建立起了一个关于猫的抖音频道,怎么来优化模型?

    10、假设抖音每天有1000万的短视频,每段15s,现在要把其中有猫的视频都找出来,有什么想法?分类用什么模型比较好?

    相关文章

      网友评论

          本文标题:2020届互联网春招实习面经

          本文链接:https://www.haomeiwen.com/subject/wyuuqktx.html