[心得] 《人人做得到的網路資料整理術》寫在文末

作者: moodyblue   2018-03-01 23:24:04
《人人做得到的網路資料整理術》寫在文末
網誌圖文版:
http://www.b88104069.com/archives/4281
資料分析有兩個層面:先取得相關資料、後進行有意義的分析。一方面取得網頁資料的技
術大部份人比較不熟悉,另方面資料處理是一般Excel書籍的重點,因此這本書會側重於
藉助Excel VBA取得網站資料,第一章到第六章介紹某特定類型的網站如何獲取資料,到
了第七章和第八章是綜合運用,總承前面幾章所學技巧,批次取得所需要的完整資料,接
著進行有意義分析,依照情況還可以透過Outlook發送結果,所以七八章不但是補充前面
章節不足的部分,同時也是就全書內容做個總復習。
針對這本書的VBA技術三點補充:
首先,從做中學永遠是最快的!贊贊小屋無論是Excel或者VBA,皆緊密與實際應用相結合
,作為講解說明的出發點。「首張同名專輯」《會計人的Excel小教室》票房口碑不錯,
感謝各位讀者捧場,其獨門特色便是以會計實務個案為核心,介紹工作上最常用函數指令
,到了《會計人的Excel VBA小教室》,雖然有一半是關於VBA介紹,但一來篇幅有限,二
來會計非得用到VBA的情況不多,所以 《會計人的Excel VBA小教室》最多僅能讓讀者對
於VBA有基礎概念,操作一些簡單範例,算是初學者的簡單入門。
如今到了贊贊小屋第三本書:《Excel VBA大數據分析》,主要內容為如何取得網頁資料
,技術上以VBA來說至少是進階水平,各個網站的狀況架構不一樣,可能需要不同類型的
程式代碼處理,書裡面各個章節的VBA範例非常多,有心研讀完這本書,每個範例程式如
果都能夠融會貫通,可以算是VBA達人中級了。
第二點,VBA和Excel應當是相輔相成。學習VBA容易陷入一種執著,苦心鑽研VBA技術,力
求讓後台的程式代碼全面取代前台的Excel操作、達到全面自動化境界。這個技術上可行
,VBA正是把所有Excel操作以程式方式編寫成指令,其強項微軟官網寫的很清楚:一方面
把好幾個重複步驟合在一起,寫成像是一鍵懶人包,方便相同對象再次執行一二三步驟;
另一方面,就有規則可循的不同Excel對象,也可以一個一個分別執行類似的多步驟操作

至於VBA弱點,和它的強項正是一體兩面,Excel本來是應用軟體,所有操作於本質上即為
電腦程式,所以一定能以代碼形式呈現,不過隨之而來是較高的學習門檻。
個人電腦發展史一路從Dos進化到Windows,不正是從程式代碼轉換成圖像按鈕,才能如此
普及深化。一般人熟悉了Excel快捷便利的前台操作,一下子要跳到後台寫程式讓Excel動
起來,可想而知會遇到諸多困難。贊贊小屋學習和出書的歷程和大家一樣,都是先熟悉
Excel再進階到VBA,兩者並行不悖,在本書的許多範例,Excel和VBA都是相輔相成,需要
的時候一定要VBA,但也不至於什麼都是VBA,很多情況直接操作Excel才是王道,這一點
過來人經驗,提供有心讀者參考。
第三點,既然是取得網頁資料,對於網頁技術必然須具備基本瞭解,如同書本所示,
ExcelVBA有兩種方法取得網頁資料:Query.table和Application.object。其中
Query.table可設置取得整個網頁或網頁中表格,如此有兩種極端情形,倘若想要資料在
網頁已經以表格形式寫好了,取資料時相當方便,直接下來便是所需資料,而且是Excel
表格形式。然而,假使網頁沒有表格、或者目標並非表格形式,事情變得棘手,勢必要下
載整個網頁,然後運用種種Excel技巧,將相關資料擷取出來。
另一個VBA取得網頁的方法為Application建立物件,它比較靈活,是透過Excel開啟IE瀏
覽器,用純粹瀏覽器方式抓取網頁資料,最好對於網頁技術有基礎瞭解,瞭解遠端伺服器
以什麼格式傳送資料給瀏覽器,至少關鍵的HTML DOM結構模型下點功夫,便能很精準設計
VBA程式代碼,告訴IE瀏覽器抓取哪一個網頁節點的資料,如此Application.object可以
做到Query.table不容易完成的任務。
以上三點補充,相信可以給讀完這本書的讀者一些參考借鏡。
本書命名為《Excel VBA大數據分析》,其實所謂大數據是因應如今資訊爆炸的時代,所
累積起來的電子資料量,已經大於傳統電腦或軟體足以勝任的情況,企業、政府、科學家
必須考慮以更為先進的方法處理資料,其中一個方法將資料化整為零,打散到各個處理器
分別運算,最後才將結果集中彙總。以這本書所提到的各類型網頁而言,再怎樣不會達到
真正大數據程度,然而所有道理是一貫相通,對於個人而言,工作生活中只要有涉及到資
料分析,都可以像大數據分析一樣,平時便將資料以電子形式儲存起來,有需要擷取某部
份資料出來,根據需求加以分析,可謂是屬於個人應用層面的大數據,其中如何以Excel
VBA的方法完成此任務,便是這本書主要核心內容,如同贊贊小屋一脈相傳的特色,書中
所有範例皆源自於實務案例,和實務緊密關連,每個人都有自己特殊的狀況和需求,希望
這本書拋磚引玉,幫助讀者進行專屬個人的大數據分析。
再次感謝各位讀者。
延伸閱讀:
《人人做得到的網路資料整理術》序
http://www.b88104069.com/archives/4276
《會計人的Excel VBA小教室》序
http://www.b88104069.com/archives/4215
《會計人的Excel小教室》 序
http://www.b88104069.com/archives/4128

Links booklink

Contact Us: admin [ a t ] ucptt.com