各位大神安安
本版上面關於數據分析(data analyst)相關工作經驗分享偏少
前兩個月剛好面試了幾間公司
公司類型為新創居多,沒有保險金融、電信業及製造業
在此分享一下面試經驗,也歡迎大家互相討論
提醒:文長慎入
Medium好讀版:http://bit.ly/2M7dKWF
文章會針對
˙背景及經驗介紹
˙履歷投遞
˙面試過程及結果
˙結論
四個部分分享
˙背景及經驗
私校數學系畢業(非理工強校),在校成績普通,沒有被當,但有暑修物理。。。
大三開始接觸數據分析,開始學習python及R語言,python學了一學期,大概就是迴圈、
判斷式等基礎語法;稍微了解爬蟲抓取技巧,但不深入。R語言起初也只是自行摸索,對
於資料整理及統計模型並不上手。
大四學校課程,使用R語言,開始了解資料處理及模型使用,大四下在新創公司的數據分
析部門實習,實習期間做過3個專案(包含獨立專案及合作專案),真正使用R處理資料及分
析。
畢業後,因某些因素,留在學校當助教,負責微積分、統計演習課(非數學本科系),基本
上沒有產出,只有自己摸索python,主要有看了幾個課程
.政大MOOC課程_成為python數據分析達人的第一堂課(這個是免費的線上課程)
.Hahow_Python 資料分析&機器學習入門(這個要錢,當時候募資時購入,很詳細還有
medium的課程檔案可以看)
2018上半年,投履歷前3個月左右,有跟朋友合作專案,主要負責爬蟲及機器學習的
coding部分。算是這年來主要的產出……..吧。
◎實際自評
會使用R語言及python完成獨立專案,包含網路爬蟲、數據前處理,SQL搜尋及操作、模型
建立,視覺化報告。
○能夠使用python串接API,每日自動化整理資料,並上傳SQL。
○模型使用上基本的回歸分類、k-means分群、sklearn套件包,都操作過,但並不會DL(例
如tensorflow)。
○分析經驗以數值統計分析為主,缺少文字探勘的經驗。
○視覺化部分,ggplot2、matplotlib都算熟悉。
○對於簡報製作也稍微有點概念。
˙履歷投遞
◎履歷部分
基本的中文履歷,以及硬生出來的英文CV,整理過去製作過的專案(包含大學零零落落的
報告們)放在雲端,還有把部分程式碼上傳至github,最後建立了linkedin,然後就打開
104開始撒履歷了。
◎目標公司
本身對於金融業沒有興趣,對保險投資也沒太大研究,然後不想穿西裝上班。另外傳統產
業(大公司)也不是我首選,畢竟制度規定很死,我也不是很喜歡。所以差不多就剩下科技
業與新創團隊了,主要來說之前也待過新創公司,所以對新創的氛圍比較熟悉。
就這樣打開104,搜尋 數據分析 就會跑出很多職缺,Title是數據分析師、資料分析師都
會點進去看。條件部分,主要就看期望的工作年資,1-3年我都會投。再來看技術方面,
只要有寫到使用python、R就會投。
關於職位內容,求職網都是寫個大概:數據清理、數據探勘、分析報告、視覺化呈現、機
器學習、深度學習,真的要實際聊過才會比較清楚此職位定位在哪,工作內容是啥。
◎其他
除了104以外還有使用Yourator這裡都是新創公司,相對的也比較多外商公司,在這裡就
算是投中文履歷過去,HR或公司回信也都是英文,但相對的幾乎投過去都能得到回信或面
試邀約。
˙面試及結果
(依面試順序寫)
1.傳統食品業(主力在大陸市場)_數據分析師
○面試
人資接洽後約面試,面試當天先考了30分鐘術科筆試,筆試內容為手寫SQL code(差點以
為我在考資管系期中考xdd),四大題都是 join 、 group by 等合併資料表,然後
where 篩選條件,最後是SQL計算。老實說,超級久沒有寫SQL,更何況是手寫,就只能憑
著印象瞎寫,勉強把四題掰完。
面試前兩關是一對一,最後一關是部門主管+單位主管兩人,第一關是同單位不同部門的
課長,主要了解我過去的專案經驗,還有我對數據分析的了解及概念。還有介紹了主要這
個單位的工作內容及工作分配。
主要分成兩個部門,一個是商業分析,比較偏重於商業應用分析,對程式能力要求較低,
主要就是會SQL撈資料。另一個是我投遞的數據應用,包括了DB處理、數據分析、數據應
用,三個課。然後大概跟我介紹過去做過的一些專案分析;這部分有談論到機器學習的部
分,得到的回答是,公司高層目前還無法接受,他們過去有嘗試使用ML的分析,但高層比
較相信傳統統計分析方法。(我有朋友過去也去應徵此單位的管理職缺,大約比我早三個
月左右,卻因為對ML較不熟悉,而被砲轟;這件事也讓我們很困惑)
第二關是我應徵的部門主管,主要跟我確認我對哪一塊比較有興趣,也大概聊了一下對於
資料處理、整理的概念;以及講了職位的工作內容,主要是以撈SQL整理資料,做ETL為主
的工作。所以一直跟我強調,會一直進行數據蒐集(可能半年或一年以上),才會進行分析
;也有提到剛剛術科SQL寫的還不錯(這部分其實超驚訝,畢竟我超久沒寫SQL)。最後有聊
到pay的部分,當下也開給我,但有說,最後核定要以人資公布為主。
本以為面試到這邊告一個段落,結果,第三關,單位主管進來,氣場很強大,主要也是問
我對於資料處理的概念,以及數據分析跟商業模式之間的關係;談話中,了解到公司決策
很注重是商業概念,數據分析是輔助決策。本以為在這邊會被電得很慘,但也頗和平的結
束。
○結果
約莫一個禮拜後,就接到人資打來,稍微了解一下狀況,還有了解可工作時間,就發
offer過來了。
2.軟體公司(主力做校務分析系統)_大數據資料管理師 (Data Scientist)
○面試
第一次過去,主要看了我的履歷,從中問了一些我的經驗,也讓我問問題了解公司的工作
,模式大概就是互相問對方問題的感覺,大概了解公司是微軟代理商,負責賣軟體,漸漸
往開發公司系統,配合企業需求去建置系統,最後發展到協助大專院校進行校務分析。然
後,也表示,公司主要使用Power Bi ,如果進來之後要學會,還有提到,公司有微軟的
資源,可供學習(畢竟是經銷商),最後就說會約下次面談。結束後,看名片上網搜尋一下
,才發現是公司負責人(CEO的感覺)面試我,難怪名片上沒有Title。
二面,是由部門PM面試,感覺是香港人,講話口音不像是台灣人,針對我實習時的專案,
大概給了我一點建議,表示做的分析對象都是人,變因很大,對公司來說不會是好的研究
主題。最後有談到會讀大量paper,然後說我的英文能力可能不夠好。
○結果
無聲卡,接近兩周的時間,我還有寄信過去詢問,但也沒有消息。
3.區塊鍊交易平台(台灣的新創公司,混合式去中心化的交易平台)_ Data Analyst 數
據分析師
○程式測驗
履歷丟過去後,mail寄過來就是csv檔跟測驗說明,資料是給你一間交易所的交易紀錄
(200Mb,差不多170萬筆資料),請你針對題目分析,並製作報告。題目主要是要看能不能
從中找到高頻交易對手或交易機器人等。
做完之後,丟過去會再決定能不能過去報告分析結果及面試。(但其實看超快,早上寄出
去,下午就打來跟我約面試時間了)
○面試及結果
本來以為要報告,還頗緊張,但因為主管開會,沒有報告到;但有提到報告部分做的不錯
,簡單易懂,也看的出來是有美編過,就由人資主管直接與我面談。公司正要成立data部
門,所以在招聘leader,也必須對區塊鍊有深入研究,大概就知道沒有望了。人資主管也
有詢問,如果是以pt的方式願不願意,也說明人事部分也還在規劃,所以也不排除未來再
通知我。
4.廣告代理商_資料分析師
面試前有上求職天眼通,稍微了解一下這間公司,負評不少(大概是說公司流動很快,還
有會以罰錢逞罰員工?!)
○面試
直接由部門主管面試,一開始稍微介紹廣告業的運作模式,及資料部門做的工作。就直接
進入專業問題,針對我過去做過的專案開始詢問,問得非常深入,都是統計解釋及演算法
部分;例如:羅吉斯回歸中OR勝算比的解釋、k-means的演算過程、計算中心距離的方法(
歐式距離等等)。沒想到會得如此深入,我回答某些部分也不是很有把握。但最後主管卻
說回答得還不錯,觀念沒有太大問題,然後說這些模型可能不適合公司分析,進來之後會
看其他paper學其他模型,還有一開始進來要學spark、hadoop等分散式計算方法(感覺起
來,應該是蠻能學到東西的吧?!)。最後有聊到pay的部分,並說明試用期會扣3k這樣。
○結果
回去大概兩三天就收到offer letter了,薪資也是當下討論到的。
5.新創行銷平台_data engineer
○面試
從面試邀約就是CEO直接跟我聯絡,第一次去也是互相了解公司運作方式,也對我過去的
經驗了解,並說明公司主要是以文字探勘為主,另外大多是分析國外論壇及部落格,所以
英文能力相對也很重要。最後就告訴我回去之後會有一個code challenge要回去做。
⊙Code challenge
給了200個網址,要你寫爬蟲程式抓取作者名字及其社群網站聯絡方式。
第二次面試,先大概聊到寫程式的過程及方法,都做出來了,所以應該也知道沒啥問題,
接著就和公司的data scientist了解實際工作內容及分析方法,大概了解之後會做些甚麼
。最後就是和CEO討論我主要可以做的工作及pay;主要來說公司data team 有人負責爬蟲
、有人負責文字分析,而我對數值分析比較有經驗,也希望我之後能處理這一塊,但當然
一開始也要我先熟悉公司分析的流程等。
○結果
二面最後就有討論了pay及on board時間,也有問我什麼時候能給回覆。回到家offer
letter就來了。
6.國內新創影音平台_大數據分析工程師 (Big Data Analytics Engineer)
○測驗
在面試前一天早上才打電話來,告知我有一個專業測驗,要請我做,然後面試帶過去。有
三題,第一題是設計一份問卷的資料屬性,並針對此問卷看能夠分析什麼、第二題設計一
套推薦系統,並規劃流程,最後寫如何評估成效、第三題問公司發展AI會遇到甚麼難題。
問的問題很有深度,我個人覺得很偏向PM,要規劃流程,也要思考成效。
○面試
先由部門主管面試,主要是我在講我做過的專案及經驗,主管沒有給太多回饋。接著講公
司data部門工作內容,及接下來發展方向。再來是人資的深聊時間,主要針對個人特質的
部分詢問了很多,但就是人資會聊的部分。最後有談到大概2~3周,公司會有一個決定,
但如果沒有錄取,將不會另外通知
○結果
目前正在等待結果中,一個禮拜多過去,還未有消息。(如有消息將會更新
˙結論
先給結論數據部分:
約莫投遞:60間(包含104及yourator)
開信:30間
寄信聯絡:13間(包含回信請你填寫資料表,回傳之後沒有下文;還有二間履歷過去後
,收到感謝信)
面試邀約:6間(上面詳述)
拿到offer:3間
每階段差不多是50%機率,拿到offer是投遞的5%
實際統計下來,我覺得算非常好的結果,畢竟我這一年來的工作,其實並不算可以累計年
資,所以還是以一個新鮮人的身分求職,拿到的offer平均都是現在的N+5~N+7,其實還算
滿意。
實際公司對於技術面的要求,其實也不會因為學歷而有質疑(或許我不是面試金融、傳產
、電信,這幾個比較看重學歷的產業,但其實也有收到金融和電信的面試邀約),只要有
專案經驗,把專案呈現給公司,其實大概也都能知道能力、技術到哪邊。公司寫要會使用
ML/DL,有可能是公司希望有這樣的技術能導入。以目前來說基本的分類分群回歸預測等
,還有基本的資料整理套件都要會使用(有面試時看github,就說:「你會pandas,我們
也要用到。」但其實這應該算基本的)
在104上打入 數據分析 或 資料分析 就會有很多工作跑出來,都可以投遞看看,能有面
試機會就去練刀,就當作了解該產業或者多去聽聽別的公司如何定義數據分析,或者公司
的數據團隊在做些甚麼;面試下來,每間公司要求的都不一樣,都一樣是data analytics
,但做的事情可能不一樣,又或者不少是要求有文字探勘經驗。