l*******0 发帖数: 176 | 1 一轮店面:
1. how to efficiently get all the email address from a page
2. normalized directory without using stack
/a/b/c/.././ -> /a/b
onsite 四轮
1. 国人大哥
a. 怎么实现相关搜索,例如,我搜索 Bush, 相关搜索应该会显示president,
bill clinton等等.
b. 一个fair的coin怎么产生unfair的head/tail 分布
c. 生男生女的概率经典问题.
2. 东欧人
a. process和thread区别
b. 什么是critical section. 什么是mutex,和semaphore的区别。如何设计一个
lock。
c. 怎么判断操作系统的stack的地址是递增还是递减的。
d. coding: Binary tree的width.(经典题)
3.
a. 两个n-ary tree. 找到相同的最大子树(经典题)
b. 增强版本: 如果当前level的node是 a c b d 和 a b c 必须要顺序相同的
match节点。怎么做。 这个例子中就是要么match ab要么match a, c以及他们的子树。
c. NLP相关的问题。如果有很多个同名的Clinton怎么cluster到不同的group
4.
a. 从袋子里每次拿两个球,如果告诉你一次拿到两个蓝色球的概率是50%,估计袋子中一共有多
少球。
b. 字符串分词,一列单词之间没有空格,怎么样划分(经典题)
e.g. bedbathandbeyond -> bed bath and beyond
扩展问题是 对于上面例子如何保证得到的是bed bath and beyond 而不是bed
bat hand beyond?
整体感觉设计题偏多,本身不是做DM或者IE,NLP的,所有感觉设计题应该是全挂了。 |
s*******n 发帖数: 499 | 2 最后一题好难啊,最后见大老板了么?
bless
【在 l*******0 的大作中提到】 : 一轮店面: : 1. how to efficiently get all the email address from a page : 2. normalized directory without using stack : /a/b/c/.././ -> /a/b : onsite 四轮 : 1. 国人大哥 : a. 怎么实现相关搜索,例如,我搜索 Bush, 相关搜索应该会显示president, : bill clinton等等. : b. 一个fair的coin怎么产生unfair的head/tail 分布 : c. 生男生女的概率经典问题.
|
f*******t 发帖数: 7549 | |
s******n 发帖数: 226 | 4 Not hard. I was asked by G. Dynamic Programming and store the max number of
words so far.
I did not solve it on the phone.
But others are hard to me. ai~
【在 s*******n 的大作中提到】 : 最后一题好难啊,最后见大老板了么? : bless
|
w****x 发帖数: 2483 | 5 Bush那个是不是可以每次craw web page 的时候提取key words, 以句子或段落为单位
建立图的连接, 比如句子Bush is a monkey, 提取key words "Bush" & "monkey", 一
个key word是一个node, 这样建立图, 同时按频率设置边的权重. 查找关联的时候先找
到Bush节点, 然后选取Bush节点邻居的权重最大的k个node ... |
l*******0 发帖数: 176 | 6 当时我说的跟你差不多,我说的是,在parse文档的时候维持一个大小为N的window。
然后把window里的词算作是bush的关联词. 然后按照取Top-K. 面试官不置可否。
不知道对不对。
【在 w****x 的大作中提到】 : Bush那个是不是可以每次craw web page 的时候提取key words, 以句子或段落为单位 : 建立图的连接, 比如句子Bush is a monkey, 提取key words "Bush" & "monkey", 一 : 个key word是一个node, 这样建立图, 同时按频率设置边的权重. 查找关联的时候先找 : 到Bush节点, 然后选取Bush节点邻居的权重最大的k个node ...
|
D********g 发帖数: 650 | 7 两个蓝色球那题是不是不完整?袋子里的求可能是什么颜色?
【在 l*******0 的大作中提到】 : 一轮店面: : 1. how to efficiently get all the email address from a page : 2. normalized directory without using stack : /a/b/c/.././ -> /a/b : onsite 四轮 : 1. 国人大哥 : a. 怎么实现相关搜索,例如,我搜索 Bush, 相关搜索应该会显示president, : bill clinton等等. : b. 一个fair的coin怎么产生unfair的head/tail 分布 : c. 生男生女的概率经典问题.
|
l*******0 发帖数: 176 | 8
我当时也是这么问面试官的,他说就这些信息。然后要你估计。然后要写方程求有哪些
可能。
【在 D********g 的大作中提到】 : 两个蓝色球那题是不是不完整?袋子里的求可能是什么颜色?
|
l*******0 发帖数: 176 | 9 嗯,其实这个题面试官更关心的扩展的部分。思路其实都是dp的思路。加了一些设计的
味道在里面。
of
【在 s******n 的大作中提到】 : Not hard. I was asked by G. Dynamic Programming and store the max number of : words so far. : I did not solve it on the phone. : But others are hard to me. ai~
|
S**N 发帖数: 182 | 10 这个很简单
假设X球 里面Y个是篮球
这样
(y/x)*(y-1/x-1)=1/2
例子 比如y=3 x=4
或者当x,y都很大的话
x*x = 2y*y
=>
x = sqrt(2)*y
【在 l*******0 的大作中提到】 : 嗯,其实这个题面试官更关心的扩展的部分。思路其实都是dp的思路。加了一些设计的 : 味道在里面。 : : of
|
|
|
w****x 发帖数: 2483 | |
m****9 发帖数: 492 | 12 Re, Thanks for sharing. Pretty standard NLP/IR design questions. |
h*****g 发帖数: 123 | 13 mark~
★ Sent from iPhone App: iReader Mitbbs Lite 7.28 |
r**********g 发帖数: 22734 | 14 Query log
LDA
【在 w****x 的大作中提到】 : Bush那个是不是可以每次craw web page 的时候提取key words, 以句子或段落为单位 : 建立图的连接, 比如句子Bush is a monkey, 提取key words "Bush" & "monkey", 一 : 个key word是一个node, 这样建立图, 同时按频率设置边的权重. 查找关联的时候先找 : 到Bush节点, 然后选取Bush节点邻居的权重最大的k个node ...
|
r**********g 发帖数: 22734 | 15 你不是学NLP的这个也无所谓。
不过一般不这么做。去Bing面试的话看看IR的综述还是很好的。
【在 l*******0 的大作中提到】 : 当时我说的跟你差不多,我说的是,在parse文档的时候维持一个大小为N的window。 : 然后把window里的词算作是bush的关联词. 然后按照取Top-K. 面试官不置可否。 : 不知道对不对。
|