1、百度 2012数据挖掘机器学习实习一面(非计算机专业应聘百度技术类实习)5月 6号上午百度数据挖掘、机器学习实习笔试,从十点到十一点半,我提前了半个小时交卷,一行代码也没写,本来没想着能通过笔试了,没想到 6号晚上正在上课时接到百度的面试通知,小小的兴奋了一下,不过第二天面试,连衣服都没来得及准备,晚上急匆匆的在网上查了一些面试的技巧和注意事项。5月 7号中午坐公交车到了国际饭店,没有见到有人接待,熟悉了一下环境,还有半个小时 1点,于是坐在休闲沙发上等了一会。我提前 5分钟去敲门了,面试官是一个三十岁左右的中年男士,看上去不是很严肃。他面前摆着一台笔记本,我是和他面对面的位置坐着的。我首先把
2、简历给他看,他看了看就问了一个问题,然后又继续看我的简历,还有在笔记本上不知道写什么。我心里想怎么没有让自我介绍哇,见他这时候没有在继续问,有一点冷场,于是我赶紧说“我先自我介绍一下吧”,他说好。我就按照事先准备的自我介绍了一下,过程中他没有打断,我基本就按照从本科到研究生的时间顺序介绍了一下自己都干过什么。然后他问到最大熵原理,我不懂。后来又问我对线性回归和logistic回归的理解,我只记得线性回归(由于刚考完计量经济学,对这个记得很清楚),跟他讲了关于最小二乘法估计参数,还有回归做完后要进行检验等等。至于 logistic回归,实在是不记得了。他接着问我是偏重于系统还是算法,我说目前在项
3、目里研究的主要是算法,他看看简历,问我关于遗传算法和蚁群算法。对遗传算法,我把它的流程讲了一遍,然后面试官问我遗传算法主要在哪些方面应用,我回答组合优化、分类等,他就让我举例 GA怎么应用在分类上的,我停顿了一两秒在冥思苦想,他看我不太知道,就让我说在其他方面的应用吧。于是我就把我们项目里的那个遗传算法跟他讲了(感觉跑题了,而且他在听到时候好像没怎么在意)。然后他继续问我 ACO,就大概说了一下它的原理。然后,面试官出了一个情景题,大概是说从北京出发有很多旅游路线,怎样从上百万个游客旅游路线中选出最优旅游路线。跟 ACO的机制很像,我冥思苦想用 ACO解决,结果被他说出很多问题,然后问我有没有
4、什么解决方法,讨论了半天,貌似是可以用关联规则挖掘。当我说出关联规则这个词时,他说可以用这个解决,我才恍然大悟,原来思路被蚁群给限制了。他听到关联规则时,便在笔记本上写了啥,他就问我对关联规则了解多少,我就跟他说了 Apriori算法。然后问我你对分类、聚类了解吗,我就列举了 k均值聚类、神经网络、k 最近邻等。他还问我了一个问题,以后工作倾向于金融、计算机、互联网的哪一方面,具体我也不太懂,我就说是互联网,说研究生学的更偏重于互联网。最后他问我能什么时候去实习,还有什么问题。我问了两个问题,一个是百度工作累不累,第二个是百度在深圳的发展。总的感觉就是,一定要把自己的想法说出来,不要被面试官限制思路,一定要有什么想法就说出来,我之前那个关联规则就一直没说出来,其实一开始是有这个想法的。然后就是表达要清楚,一开始那个线性回归的原理我就没解释清楚,说的一塌糊涂。然后,对自己所说的一定要心里有底,你提到的每一个词都可能被考官抓来深入的问。最后,我后悔最后问的那个问题了,问他百度工作累不累,问完我就后悔了,不应该问这样的问题,就好像你怕累似的。