上午去 明略資料,面試官一直不到,有個臨時的面試官先面了一次:
1 hdfs api新特性
2 java7新特性
3 hive的預設分隔符
4 eclipse版本号
之後正式面試官面試:
1 shell 腳本
sort , uniq -u,uniq -t ,uniq -d, cat 組合使用,解決從不同檔案中找出相同資料的問題,還有解決隻在一個檔案中出現的資料的問題
2 java實作上述功能,在TB級别資料情況下,實作方案
3 java實作取出兩個檔案中共有的資料
4 mapreduce的pagerank實作
5 說說掌握那些算法,如決策樹,神經網絡,知道那些聚類算法,
6 和hbase同樣功能的分布式資料庫了解多少
7 redis緩存機制
之後談到薪資和公司的工作方式,說是要經常外出,之後就1點了,找人事不在,就約下周一複試
暫時考慮,不準備去參加複試
另外周一的一家,經過兩天考慮工作,兩天性格測試,然後說基本ok,讓周一在去見見boss,因為這家沒有大資料部門,說是讓去獨立負責這一塊,感覺自己有點抗不住,但暫時沒有回絕
如有需要,可以添加部落客微信,擷取更多面試資料,或者向部落客請教面試經驗