Re: [請益]資料分析/科學的工作是不是幾乎都要碩士..

作者: applehpsh   2018-02-09 00:54:35
※ 引述《HWSH (光的夜生活)》之銘言:
: 小弟去年從國立臺北大學統計系畢業
: 計畫先工作個兩三年再去申請國外研究所
: 目前即將服完兵役 本來是希望年後可以開始上班
: 最近幾天開始找工作 履歷卻一直被已讀
: 感到一點小小的「挫折」
: 看了一下應徵者狀況 六七成都是碩博
: 唉學歷拚不過別人真的是硬傷
: 真的沒有一些初階的資料科學家助理工作可以做做看嘛哈哈
: 我很樂意從Data Cleansing的工作做起
: 交代一下背景
: 大概是大三決定要走資料科學家這條路
: 接觸coding到現在大概兩年
: 最常用的是R跟SAS
: 有去修資工的資結跟演算法
: 會一點C跟Matlab
: 最近在看線上課程學python
: 英文聽說讀寫沒問題
: SQL還真的完全沒碰過(滿多職缺都有要求)
: Deep learning幾乎沒有頭緒(只知道ML)
: Hadoop跟Spark只知道是在幹嘛的也沒有實際操作過
: 唉唉真的是太嫩了
: 想請版上的前輩大大們點一盞明燈提供一點建議
: 謝謝謝謝 用力鞭沒關係
身為這一塊的弱弱從業人員給你建議
我覺得你心態可能要改
資料科學家 70%以上的時間都在做data cleansing
但你好像搞錯狀況了 以為這種東西是初階的工作
但是實際上並不是這樣 實戰經驗上需要想辦法增進把資料清整時間到可以拿去建模
在台灣 有意願想做這方面的公司在過去對於資料的管理上都很不嚴謹
你看到的會是雜亂無章又一堆莫名其妙的資料
光是處理資料encoding的問題就夠你燒腦燒時間的 更別說還有一堆雜事
如果你以為資料科學家只要爽爽地建模就好了那真的是太天真了
加上從你內文中沒接觸過SQL 沒玩過Deep learning 好像也不會爬蟲
資料視覺化的工具也沒提到會不會
ML到底接觸多深也不知道 要走資料這塊只會R卻不會python 也是硬傷
勸你先去了解一下R和Python彼此的優缺點
另外有沒有實際上玩過什麼專案也看不出來
講白了如果我部門開缺你來應徵 我還真不知道有什麼誘因讓你進來一同工作
有個建議是如果真的想增進實力
上去Kaggle看看其他人在幹嘛 同樣的dataset你能不能做出跟人家一樣的結果
或是去挑個競賽區的試試看自己做出來的結果到哪
另外就是最近吹很大的各種相關“前景”請審慎看待不要一頭熱
有時候實務面上跟這些投機客炒作的泡泡還是有不小的落差
作者: wilson85771 (HOW)   2018-02-09 01:56:00
推這篇
作者: jerry771210 (說在多也沒用)   2018-02-09 02:13:00
推推
作者: TAKADO (朕沒給的你不能搶)   2018-02-09 02:54:00
10-15年前,大家都在跟風玩data warehousing 炒作data mining種下的惡果啊,看過一堆奇葩系統各種沒建pk fk constrains,沒有正規化,各種垃圾資料狂塞猛送,然後現在抱著這些資料要來玩AI。
作者: laba5566 (最愛56家族 啾咪)   2018-02-09 08:52:00
嘴砲>>>>>>>狗屁ML+資料分析 不會嘴走這行是找死
作者: testPtt (測試)   2018-02-09 09:40:00
nosql就是讓你這樣玩阿
作者: lichai (雷迪咖)   2018-02-09 09:43:00
正解…
作者: Abhoth   2018-02-09 11:29:00
樓上TA大的回覆深有同感QQ
作者: drajan (EasoN)   2018-02-09 14:32:00
你真的懂data warehouse嗎?:) 正規化是要看場合來使用的
作者: askia (過客)   2018-02-09 19:26:00
推,一看就知道是內行。學術界老是講一堆xxx方法、模型但是真正的實務只有三個要點:清資料、清資料還是清資料有乾淨的資料一切都好談,否則什麼都是屁。GIGO
作者: MOONY135 (談無慾)   2018-02-09 20:14:00
哈哈哈清潔工
作者: lovdkkkk (dk)   2018-02-09 21:01:00
掃地僧4ni
作者: vfgce (小兵)   2018-02-10 16:23:00
資料分析用'資料庫正規化'會很想死吧......至於清資料也不用講得多神奇,主要是你對這個資料的了解...知道怎麼用,那些有用,那些雜訊....資料分析常常是一個資料表拿來用,'正規化'反而造成麻煩...
作者: TAKADO (朕沒給的你不能搶)   2018-02-10 16:46:00
樓上幾樓說的沒錯 DW根本沒有正規化的問題但是在那個大家都在玩DW的年代一堆公司DB都剛起步然後看是凹MIS去學或找便宜工作室幫忙弄然後就出現了因為OLTP->DW時 ETL亂寫進不去但是DW是顧問開的 然後只好operational DB做去正規化到1NF或是把DB跟DW混在一起做撒尿牛丸 設計成star-schema這樣就沒有轉資料的問題了,大家都開心如果資料是靠爬蟲或是open data去撈還好如果是抱著整個資料庫來的挺多雷 裡面各種世界奇觀都有
作者: shiauji (消極)   2018-02-11 10:18:00
推樓上大大跟這篇
作者: sailoruranu   2018-02-11 14:01:00
推 我之前做report也都一直在整理資料 老是有莫名奇妙的資料會被放進db

Links booklink

Contact Us: admin [ a t ] ucptt.com