Google的技术面试流程就是各家的标配而已,先远程后现场。
面试以强度闻名,可能看看问题就想回家了。这些题目全部由Glassdoor收集统计。不过,顺便看下参考答案也是好的。
1、求导1/x。
答:-1/x2
image
用Python是这样。
image
2、画出log (x+10)曲线。
答:如图。只要把logx的图像左移10格。
image
用Python是这样。
image
3、怎样设计一次客户满意度调查?
答:第三题就这么抽象了。不知从何说起的我决定指引各位,可以在搜索引擎里查询一下:“客户满意度和客户忠诚度的计算标准”。
4、一枚硬币抛10次,得到8正2反。试析抛硬币是否公平?p值是多少?
5、接上题。10枚硬币,每一枚抛10次,结果会如何?为了抛硬币更公平,应该怎么改进?

答:小数定律或许可以帮到你。
6、解释一个非正态分布,以及如何应用。

答:不知道面试者遇到是怎样的分布。不过,上个月MIT发表了用妖娆的伽玛分布,帮助自动驾驶系统在浓雾里保持如炬目光的算法。
详情传送门:点这里
7、为什么要用特征选择?如果两个预测因子高度相关,系数对逻辑回归有怎样的影响?系数的置信区间是多少?

答:需要处理高维数据的时候,很多模型都吃不消。特征选择可以让我们在给数据降维的同时,不损失太多信息。
参考资料传送门:https://towardsdatascience.com/why-how-and-when-to-apply-feature-selection-e9c69adfabf2
8、K-mean与高斯混合模型:K-means算法和EM算法的差别在哪里?
答:CSDN博主JpHu说,K-Means算法对数据点的聚类进行了“硬分配”,即每个数据点只属于唯一的聚类;而GMM的EM解法则基于后验概率分布,对数据点进行“软分配”,即每个单独的高斯模型对数据聚类都有贡献,不过贡献值有大有小。
9、使用高斯混合模型时,怎样判断它适用与否?(正态分布)

答:依然,请前往以下页面。
详情传送门:https://stats.stackexchange.com/questions/260116/when-to-use-gaussian-mixture-model
10、聚类时标签已知,怎样评估模型的表现?
答: CSDN博主howhigh说,如果有了类别标签,那么聚类结果也可以像分类那样计算准确率和召回率。但是不应该将分类标签作为聚类结果的评价指标,除非你有相关的先验知识或某种假设,知道这种分类类内差距更小——
详情传送门:https://blog.csdn.net/howhigh/article/details/73928635
11、为什么不用逻辑回归,而要用GBM?

答:GB是Gradient Boosting。引用知乎答主Frankenstein的话,从决策边界上看,线性回归的决策边界是一条直线,逻辑回归的决策边界是一条曲线,GBM的决策边界可能是很多条线。
逻辑回归只能处理回归问题,而GBM还可以用于解决分类或排序问题。
参考答案传送门:
12、每年应聘Google的人有多少?
答:两百万。大多数人可能都只是顺便投一下,看看会不会中奖。
image
当然,技术题是出不完的,也是答不完的——以下统一不给答案了,请进行自我测试,并注意考试时间。
13、你给一个Google APP做了些修改。怎样测试某项指标是否有增长
14、描述数据分析的流程。
15、高斯混合模型 (GMM) 中,推导方程。
16、怎样衡量用户对视频的喜爱程度?
17、模拟一个二元正态分布。
18、求一个分布的方差。
19、怎样建立中位数的Estimator?
20、如果回归模型中的两个系数估计,分别是统计显著的,把两个放在一起测试,会不会同样显著?
网友评论