Re: [問題] 哪個瀏覽器配合插件可以邊瀏覽邊備份網站

作者: danny0838 (道可道非常道)   2014-07-27 02:30:33
※ 引述《Sam0907 (列)》之銘言:
: 所以想找個瀏覽器可以達成邊瀏覽就永久備份到電腦硬碟
: 包含文字以及圖片
: 以及包含強力的搜尋功能,可以在備份的檔案中輸入個關鍵字就可以查到想查的資料
: 或者是用瀏覽的日期進行搜尋
可以試試 Firefox + ScrapBook X + AutoSave
https://github.com/danny0838/firefox-scrapbook/wiki/Intro-%28zh-tw%29
https://github.com/danny0838/firefox-scrapbook/wiki/Addons-%28zh-tw%29
這樣的組合可以在瀏覽特定網址時自動擷取整個頁面,
包括文字、圖片、樣式通通抓下來。
ScrapBook X 內建還算不錯的全文搜尋功能,
支援多關鍵字以 and not 連結,也支援 regexp 搜尋。
效能方面,
我有個測試數據是從 1825 個資料項(共 1.27 GB)中搜尋某關鍵詞,
找出 1917 筆結果,過程不到 3 秒鐘。
不過搜尋前必須先建立快取,
1825 個資料項從頭建立全文搜尋快取約 3~4 分鐘,
如果是建立後再重建(無更新的會自動略過),大約 20 秒以內完成。
就字面上來說,應該都符合原問的需求,
只是...實際上可能不見得有想像中的好用...
首先,每瀏覽一個網頁就擷取,會拖慢速度。
其次,現在很多網頁的肥胖程度是超乎想像的,
比如,用 ScrapBook X 擷取一個臉書頁面,
包含完整的文字、圖片、樣式,大概要 1.6 MB,
臉書很多圖片、樣式表是重覆的,每擷取一頁就複製一次,很浪費空間。
我們簡單算一下,假設一天看 100 個網頁,每個網頁平均 1.5MB,
那麼一年後將會吃掉 1.5*100*365/1024 = 53.5 GB 的硬碟空間。
當然,如果是專看圖多的動漫網站,那絕對不只。
另外,很多 Web 應用程式其實沒有真正的換頁,像臉書、噗浪、gmail,
往往是在同一個網頁動態載入新的訊息串、新的信件等內容,
由於這不是「換頁」,因此 AutoSave 不會在載入這些東西後自動儲存,這也要留意。
我個人不覺得備份所有網頁是很有用的事,
頂多看到覺得有價值的頁面手動備份一下就好,
其他網頁若是無預警掛點,也多半有機會可以從 Google Cache 或 Web Archive 找回。
不過每個人的需求不同,要不要用,要怎麼用,就看施主囉。
作者: karst10607 (誰可以協助我開板?)   2014-07-27 10:54:00
記得加上這個 破解封鎖右鍵套件RightToClick
作者: wingtilldie (振斷雙翼)   2014-08-21 23:28:00
破右鍵根本Ctrl+Shift+I就好了
作者: sanbis (方正無法達成,那麼有沒H)   2013-01-15 00:52:00
裝了 autosave 可以說把整個瀏覽歷史全都記錄下來了~前提是你不在乎速度變慢~畢竟擷取是需要時間的只是不知道有沒有辦法快速啟用/停用 autosave ?畢竟從頭到尾都被 save 下來的話很難說效率到底有沒有增加
作者: drift024   2013-02-07 04:23:00
請教一下假設A與B網頁有相互連結 而且A、B都有擷取網頁那有辦法讓他自動連結起來嗎? 目前是A為擷取的狀態進入A後點內部的B連結是連到網路的版本而不是擷取版本
作者: noonee (我和烤肉間只差一撮孜然)   2013-04-19 01:35:00
另外一個特殊的問題是 scrapbook似乎只能用其專門格式存起有時候想存個別不同頁面 同時分享給別人的話就會不方便雖然那時候可以用mht格式 但是就不是scrapbook 了

Links booklink

Contact Us: admin [ a t ] ucptt.com