倉儲是資料工程喔,經典著作 The Data Warehouse Toolkit有時間可以慢慢翻一下。會說是高級 Excel 工具應該是指看到MapReduce 的部分,但這種操作並不是只能用在分析上……至於待遇跟薪水問題,去看 DrTech 寫過的某篇文吧,國家跟產業的權重會比職稱和使用的技術要高,你說資料工程跟後端來比誰高,不提產業也無從比較起…框架的大方向未必是處理效率問題,有的是處理擴展性問題Hadoop 生態系沒有偏向資料分析呀~ 至於 Flink 是是為了處理一些需要實時計算的資料的,當大量資料實時產生的同時需要分析計算會用到,要看一下你現在的業務到底接觸的是哪一越接近用戶端使用的部分,相較是比較簡單的,上面 D 大提到的,是偏向於提供資料使用人員(DS/DA)去做的 infra多數 DE 會在串接跟維護 Data Pipeline,你說的套用某個規則去整理出某人或是某個部門的資料,可能只是這條 pipeline上,某一個資料出水口需要做的事~ 要挖的東西是滿多的,有興趣可以從這個方向開始切進來~的確在有些公司 DE 除了基礎服務設施和資料處理之外,還要