美文网首页
2016.9.20 搜狗笔试

2016.9.20 搜狗笔试

作者: codingXue | 来源:发表于2016-09-20 17:06 被阅读139次

职位:搜狗输入法研究部大数据处理及分析实习生
时间:90 min
题型:10道选择/填空,1道编程题,1道设计题

有关红黑树
设k<n,以下操作的平均时间复杂度与“把k个未排序数插入已含有n个节点的红黑树里”相当的有(AB)
A. 从含n个元素的已整理好的小顶堆里依次取出前k个最小的
B. 利用快排过程,从n个未排序数里找第k小的
C. 利用容量为k的大顶堆,从n个未排序数字中找最小k个
D. 从长度分别为n和k的两个序列中找最长公共子序列
解析:题干中红黑树插入时间复杂度为O(klogn)
A. O(klogn)
B. O(klogn)
C. O(nlogk)
D. O(nk)

数据挖掘算法基础知识
下面属于维规约常用的线性代数技术有(AC)
A. 主成分分析
B. 离散化
C. 奇异值分解
D. 特征加权
解析:关于机器学习中奇异值分解及应用的详细介绍

以下哪些算法是基于规则的分类器(A)
A. C4.5
B. KNN
C. NB
D. ANN

语法问题
要禁止修改指针p本身,又要禁止修改p指向的内容,则p应该定义为(D)
A. const char const *p
B. char const *p
C. char *const p const
D. const char * const p

设计题
三元组(id1, id2, freq)表示id1和id2的共现次数,id1、id2都在0-65535范围内,但三元组是稀疏的,共有400万左右,因此直接用二维数组存储太浪费空间。设计一个存储方案,平衡空间的消耗和快速查找需求。
(这个结构是静态的,不用考虑插入等操作。)

我回答的是用HashTable,用id1和id2形成键值,freq作为实值。键可由id1<<16+id2或将id1、id2字符画后连接成id1_id2作为键。这样只需要存储有值的三元组,而且可在O(1)时间内取值。

相关文章

  • 2016.9.20 搜狗笔试

    职位:搜狗输入法研究部大数据处理及分析实习生时间:90 min题型:10道选择/填空,1道编程题,1道设计题 有关...

  • 9.16 搜狗笔试

    题目1过滤ip,ip格式如(xxx.xxx.xxx.xxx),全数字;过滤规则可以有‘’,‘’只会出现在头或尾,代...

  • 搜狗笔试总结

    看不懂答案。。。尴尬 求方差和最小的idx。方法就是D(x) = E(X^2) - E(X)2,利用前缀和数组,可...

  • 2016.9.20

    夜里下过雨,地上湿漉漉的。天空中满布着厚重的云层,靠北边的云层暗色的,大概今天北边还会有场雨吧。不时有一只黑色的鸟...

  • 2016.9.20

  • 2016.9.20

    一想到我今天指甲不小心扣到了我心爱的口红,我就难受,想把手指给切了⋯⋯我一定是有病☹️

  • 2016.9.20

    好的生活我要享受,但是我不参加建设,因为没有我也能将就。 这不是错误,这只是一种常态,就是人性。

  • 2016.9.20

    包臀牛仔裙 真的不适合骑电动车 福州的太阳 又回到火辣辣的样子 车篮里的那把阳伞 还是没有等到它的主人 第一次听仿...

  • 2016.9.20总结

    今天主讲了利用VMware player虚拟机安装ubuntu,并 安装了了VMware tools,以此在虚拟机...

  • 2016.9.20    晴

    第一次用简书,也不知道这点啥,以后,可能就用它来写写日记吧 从剪了短发到现在有一个多星期啦,总算是适应过来了,不过...

网友评论

      本文标题:2016.9.20 搜狗笔试

      本文链接:https://www.haomeiwen.com/subject/opjoettx.html