從2015年8月到2015年10月,花了3個月時間找工作,先后通過內(nèi)推參加了美團、阿里螞蟻金服、京東、騰訊、今日頭條、Growing IO、微軟這7個公司的面試,同時參加了網(wǎng)易游戲、LinkedI In中國這2個公司的筆試,拿到比較優(yōu)質的offer是京東Star和阿里星2個Offer。應聘的崗位要么是算法工程師,要么是機器學習與數(shù)據(jù)挖掘崗,企業(yè)叫法不同,工作實質都是利用機器學習與特征工程去解決業(yè)務問題。整個求職過程是一個和互聯(lián)網(wǎng)企業(yè)雙向了解,接收面試反饋后不斷思考、調整職業(yè)規(guī)劃與重復完善知識體系的過程,本文通過介紹我個人的求職過程,向后來者揭示國內(nèi)互聯(lián)網(wǎng)企業(yè)對算法&機器學習崗的要求、面試過程、薪資狀況,也分享一些個人在這個過程中積累起來的見聞、經(jīng)驗。
本文分為三個部分,筆試&面試、經(jīng)驗心得、題目匯總。筆試&面試部分介紹各個公司的內(nèi)推時間點、內(nèi)推形式、我個人的筆試&面試情況,對了,還有不涉及保密協(xié)議的一些薪資情況;經(jīng)驗心得部分簡單介紹簡歷、內(nèi)推、面試的一些體會,對了,還有一些捷徑;題目匯總部分包括我個人3個月求職過程中遇到的題目,分為筆試題、編程題、機器學習&數(shù)據(jù)挖掘問題、解決方案類題目。
筆試&面試
美團公司-貓眼電影部門。美團在2015年8月初開始接收內(nèi)推。貓眼電影今年剛單獨拆分出來,部門內(nèi)缺少算法工程師負責機器學習類的工作,所以面試不難,你懂模型、能搞業(yè)務就沒問題,編程題簡單。薪資為15薪,月薪分為13K、15K、16.5K三檔,后2檔為special offer,16.5檔可以談薪水,沒期權股票,沒北京戶口。
阿里螞蟻金服-安全&服務與數(shù)據(jù)事業(yè)群-數(shù)據(jù)智能部。阿里集團2014年上市,將包括支付寶在內(nèi)的金融業(yè)務剝離單獨成立為螞蟻金服。數(shù)據(jù)智能部剛成立,戰(zhàn)略定位頗似螞蟻的數(shù)據(jù)中樞,用于為各個部門產(chǎn)出數(shù)據(jù)智能。我因為參加阿里的移動推薦競賽獲得亞軍,有專場面試的機會。在專場面試中表現(xiàn)神勇,連面4面+CTO面+HR總監(jiān)面,獲得阿里星。阿里的面試等級為B+,A-,A,A+,A+可以被面試官推到CTO處進行交叉面,面過了就是阿里星。今年阿里的薪資分為AB檔,B檔薪資有8K、10K兩檔,A檔我知道的有16K一檔,定級都是P5。阿里星年薪(此處馬賽克)。
京東-數(shù)字營銷業(yè)務部。京東8月底開始內(nèi)推。數(shù)字營銷業(yè)務部2014年成立,一年實現(xiàn)100多億的營收,賺了大錢,公司因此開始重視技術。在NLP Job上看到相關內(nèi)推,順手發(fā)了封郵件,第2周的周一就被安排面試,面完2輪面試官給了special offer面試機會。最終的面試流程是2輪技術面+1輪HR面+1輪交叉面+1輪VP面,按照校招宣講的說法這個是京東Star的流程。京東今年的年薪有19.5W、21.5W、26.5W三檔,26.5W檔的薪資可以談,最高可談到40W左右。數(shù)字營銷部門有5個左右的戶口,需要按照簡歷情況、面試反饋排隊。
騰訊-TEG。7月底到阿根廷參加IJCAI會議時,碰到TEG的部門老大,在微信上把簡歷給了他。但部門老大自然不把這種校招內(nèi)推的事放心上,到了9月初才被安排面試。面了2輪,算法題比較簡單,但要求bug free,其他時間都在聊模型、數(shù)據(jù)挖掘比賽、實習項目。第二輪面試聊了很久,比較有意思,面試官給我分析了我拿到和可能拿到的offer。騰訊月薪我知道的有13K,15K,18K三檔,18K是騰訊大咖檔。騰訊加班多的部門年終在4個月以上,LOL部門幾十個月年終。北京戶口概率比較大。
今日頭條-推薦組。今日頭條算是一家國內(nèi)少有的技術驅動的公司,目前是C輪。頭條的筆試出的比較有水平,所以會比較看重筆試。我在面頭條時心態(tài)不好,先是拒絕參加筆試,而后以比較高的姿態(tài)和HR、面試官溝通。所以頭條的面試在第三輪時就中斷了。頭條面試的編程題不難,但對模型、推薦系統(tǒng)、項目線上經(jīng)驗等考察得比較深入。了解到的offer是月薪23K,加2000股票,沒有戶口。
Growing IO-機器學習組。Growing IO是原Linked In商務分析部門總監(jiān)張溪夢先生回國創(chuàng)立以提供數(shù)據(jù)分析為主,一鍵埋點為技術壁壘的Start up公司,目前仍在天使輪,進去的話工號排在十幾。面了5面,部門leader2面+交叉面1面+co-founder面+CEO面。面試是按照社招的標準走的,leader面對機器學習考察得比較全面、深入,其他面就是聊聊天,畫畫餅。底薪一般,期權較多,無北京戶口。團隊里都是比較資深的工程師,但機器學習業(yè)務不多。
微軟-Ads。2015年7月開始在微軟小冰組實習,9月中旬開始轉正面試,轉到Ads部門。微軟的轉正面試是2輪技術面+1輪AA面,2輪技術面1輪positive就可以AA面。如果非實習生則需要2輪技術面都positive。另外,微軟有預科生計劃,轉正只需要presentation,無需面試。轉正面試的編程題相對較難,對模型、項目的考察較為深入。微軟今年大幅擴招,還漲薪。21萬左右Base,10%~20% Bonus,一些股票,28萬左右的Package。MSRA的Base是28萬,40萬左右的Package。
網(wǎng)易游戲、LinkedIn中國。在9月中和10月初參加了這2個公司的筆試,2個公司的筆試都比較切合業(yè)務,與SQL語句相關。網(wǎng)易的筆試做了340分,但沒被通知面試LinkedIn中國的筆試接近滿分,但已經(jīng)10月多,已經(jīng)開始參加數(shù)據(jù)挖掘競賽,沒什么面試狀態(tài)就沒去面試。LinkedIn中國的Package在30萬+,網(wǎng)易游戲看學校給錢。
經(jīng)驗心得
國內(nèi)互聯(lián)網(wǎng)公司和國外FLAGS的面試有很大不同,前者重視項目、實習經(jīng)驗、專業(yè)積累,后者看重的是你聰不聰明與編程題刷得多不多。在求職開始的時候心里得有個譜,合理分配時間、精力,并理性看待自己掛了筆試或面試。
簡歷講究簡單粗暴有逼格,簡歷包含聯(lián)系方式、教育背景、實習經(jīng)歷、項目介紹、牛逼的榮譽、崗位相關的技能就好,謂之簡單粗暴,有逼格則指的是實習、項目多用數(shù)字量化描述,省去敘事的過程,結果導向。還有一點經(jīng)驗,可以適當裝逼,但不能裝逼得超過可掌控范圍。
投簡歷的時候,多走內(nèi)推渠道,省去大部分筆試或者電話面試,不吃力又討好。內(nèi)推渠道有以下幾種,我按照靠譜程度排個序:1) 總監(jiān)以下的內(nèi)部技術員工 2) HR 3)總監(jiān)以上的高管 4)北郵人論壇 5)Linked In 6)知乎 7)NLP job 8)微信公眾號。1)和2)是比較靠譜的,3)~7)只能作為備胎。還有一個非主流但很有效的捷徑是參加企業(yè)舉辦的比賽并取得好名次。
面試時要抓住提問環(huán)節(jié)問一些實質性的問題,比如具體的技術問題、部門組織架構、部門戰(zhàn)略地位、以后的工作團隊、對個人的定位、KPI怎樣給出等,尤以部門組織架構、戰(zhàn)略地位、團隊這類大又可說的問題最佳。京東面試官給我講了百度架構部門的痛點,在之后的面試中我就經(jīng)常和面試官聊關于架構部門和業(yè)務部門的話題,學到很多,大局觀也慢慢改善。
在精力允許的情況下多面,多拿offer,一方面漲見識、談資,一方面在談理想公司的offer時能爭取到更好的薪資待遇。
題目匯總
筆試題
在互聯(lián)網(wǎng)分析中,通常會關注用戶的【第N日激活率】來衡量用戶質量。用戶的第N日激活指的是用戶在注冊的第N天登錄網(wǎng)站或App,即算為該用戶的第N日激活。第N日激活率指的是某日注冊用戶在第N天激活的數(shù)量除以該日所有注冊用戶數(shù)量
“赤兔”是領英中國針對中國職場人士推出的一款本土化的社交應用。如果你是領英中國的數(shù)據(jù)分析師,你會從哪些方面和維度來設計各項指標,給產(chǎn)品的設計和運營提供數(shù)據(jù)上的支持?請給出具體的維度和指標,并說明原因。
網(wǎng)易游戲的一道筆試題是給定一條包含3個join的SQL語句,要求寫代碼模擬實現(xiàn)SQL的功能。
編程題
最少時間復雜度求數(shù)組中第k大的數(shù),寫code
去除字符串S1中的字符使得最終的字符串S2不包含’ab’和’c’,寫code
長度為N的序列Sequence=abc….Z,問有多少不同的二叉樹形態(tài)中序遍歷是這個,寫遞推公式
給定整數(shù)n和m,問能不能找出整數(shù)x,使得x以后的所有整數(shù)都可以由整數(shù)n和m組合而成
中序遍歷二叉樹,利用O(1)空間統(tǒng)計遍歷的每個節(jié)點的層次,寫bug free的code
排序二叉樹轉雙向鏈表
一個運算序列只有+、*、數(shù)字,計算運算序列的結果
機器學習&數(shù)據(jù)挖掘問題
L1和L2正則項 》》 它們間的比較
各個模型的Loss function,牛頓學習法、SGD如何訓練
介紹LR、RF、GBDT ,分析它們的優(yōu)缺點,是否寫過它們的分布式代碼
介紹SVD、SVD++
是否了解線性加權、bagging、boosting、cascade等模型融合方式
推薦系統(tǒng)的冷啟動問題如何解決
是否了解A/B Test以及A/B Test結果的置信度
特征工程經(jīng)驗
是否了解mutual infomation、chi-square、LR前后向、樹模型等特征選擇方式
解決方案類題目
為今日頭條設計一個熱門評論系統(tǒng),支持實時更新
給定淘寶上同類目同價格范圍的兩個商品A和B,如何利用淘寶已有的用戶、商品數(shù)據(jù)、搜索數(shù)據(jù)、評論數(shù)據(jù)、用戶行為數(shù)據(jù)等所有能拿到的數(shù)據(jù)進行建模,判斷A和B統(tǒng)計平均性價比高低。統(tǒng)計平均性價比的衡量標準是大量曝光,購買者多則高。
有n個elements和1個Compare(A, B)函數(shù),用Compare函數(shù)作為排序算法中的比較算子給elements排序。Compare函數(shù)有p的可能比較錯。排序完取Top m個元素,本來就在Top m并被正確分在Top m的元素個數(shù)是x。問x的數(shù)學期望。
讀到最后,希望能對你有所幫助。
-
工程師
+關注
關注
59文章
1572瀏覽量
68652 -
算法
+關注
關注
23文章
4630瀏覽量
93356
發(fā)布評論請先 登錄
相關推薦
評論