[-Fx-][-GC-] 終結內容農場 5.7.0

作者: danny0838 (道可道非常道)   2022-10-12 06:08:01
終結內容農場 5.7 出來了
可到新官網下載:
https://danny0838.github.io/content-farm-terminator/
這回有幾個比較重大的改動:
* 再次改良演算法。
現在普通網域規則、萬用字元規則、正規表示式規則的比對速度
都超越了線性時間複雜度。
許多技術細節都是參(ㄔㄠ)考(ㄒㄧˊ)自 uBO,感恩贊嘆雷蒙大師。
* 支援新的灰名單功能。
灰名單的作用是消除網路黑名單中的相同規則。
有些網路黑名單作者比較激進,會設一些地圖砲規則,比如 wordpress.com,
有時候訂閱者並不想要這些規則,
但是用白名單也不妥,因為如果把 wordpress.com 加到白名單,
那麼一些可能想封鎖的網站如 bad.wordpress.com, sex.wordpress.com
就會因為白名單而無法被封鎖。
想解決這種問題,要嘛是退訂整份網路黑名單,或者把內容複製下來自己管理;
要嘛得在白名單寫入複雜的正規表示式規則,
才能既維持 bad.wordpress.com, sex.wordpress.com 封鎖又不致誤鎖其他網站。
這種問題用灰名單就很容易解決,
在灰名單加入 wordpress.com 可以讓 wordpress.com 這條黑名單規則失效,
但是它不會對 wordpress.com 網站本身有任何保護作用,
所以其他像 bad.wordpress.com, sex.wordpress.com 還是可以封到想封的,
而如果是 wordpress*.com, *wordpress.com 也還是可以封鎖 wordpress.com 本身。
* 強化情境查詢功能。
從封鎖頁面進入選項頁面時,會顯示封鎖規則及出自哪個黑名單,
這樣會比較容易搞清楚該網站大概是因為什麼理由被加入黑名單。
如果不想要這條規則,直接複製新增到灰名單即可。
從一般網頁或封鎖頁面進入選項頁面時,也會顯示該網頁的重導向來源,
方便糾出一些轉址農場。
技術廚還可以寫個書籤小工具,就能做到一鍵把網站和重導向來源一起加進黑名單。
* 取消一次檢視所有黑名單的功能,改為可分別檢視已快取的黑名單。
已快取黑名單列表也會顯示快取的時間,可以看出是否有明顯過期的項目。
* 支援多層次快取,減少重新載入的運算量,
加快名單重新載入的速度,減少啟動瀏覽器、更動選項等情況的延遲。
* 縮短解鎖冷卻時間:
經過之前的討論,我認為目前的解鎖設計大方向上應無太大問題,
只是有人反映等待時間久得太誇張,因此稍作調整,
基本上還是要等,還是要強迫看警告及輸入驗證碼,
不過等待時間不會像以前那麼慘無人道的久。
有用新版的歡迎提供心得和回饋^^XD
其他相關:
* 更新官網,網址即開頭所示。應該有比較簡潔易懂一些?XD
* 網路黑名單現在用腳本做後設管理,可以更快提供更豐富的名單,
並且同步產生 uBO、uBlacklist 等其他格式的版本。
一些黑名單現在也會自動聚合其他可靠黑名單來源,格式不一定,
目前最多的是來自 uBlacklist 的黑名單。
並且增加了幾個黑名單(詳見官網後台資料庫頁面):
* 擴充內容農場清單:自動聚合許多大大提供的網路黑名單,
有些可能會比較激進……不過現在應該都可以用灰名單解決。
* 劣質複製農場清單:一些複製維基百科、GitHub 之類的網站,
由於這些網站基本是採 CC 等開放授權,所以複製它們未必構成侵權,
但是有些網站就只是複製或機翻,沒提供多少有價值的東西,
某方面是可以視為內容農場。
但這個部分比較有爭議,而且目前有不少大大專門提供了這類機翻複製站的名單,
所以就獨立成一個黑名單以方便使用,並且自動聚合那些大大提供的資料。
注意:以上許多是 5.7.0 的新功能,
Google 不知最近吃錯了什麼藥,新版上傳後一直等待審核不給過,現在還是 5.4 ...
想用新版就慢慢等,或暫時改用 Firefox 或 Edge 吧XD
作者: chancewen (閒人亂逛)   2022-10-12 06:46:00
難怪GC商店一直重整都是5.4 看到注意了XD
作者: chancewen (閒人亂逛)   2022-10-12 06:46:00
難怪GC商店一直重整都是5.4 看到注意了XD
作者: rick (可惜沒如果)   2022-10-12 16:14:00
水啦! 辛苦大大了!!! 還好主力是firefox Orz
作者: rick (可惜沒如果)   2022-10-12 16:14:00
水啦! 辛苦大大了!!! 還好主力是firefox Orz
作者: goldie (阿良)   2022-10-12 17:13:00
作者: goldie (阿良)   2022-10-12 17:13:00
作者: jqs8ah5ar (Ra5hUxen)   2022-10-12 18:04:00
google搜尋引擎都淪陷了 農場文連結都高掛排名前面
作者: jqs8ah5ar (Ra5hUxen)   2022-10-12 18:04:00
google搜尋引擎都淪陷了 農場文連結都高掛排名前面
作者: masutaka (taka=米嘎)   2022-10-12 18:56:00
感謝更新
作者: masutaka (taka=米嘎)   2022-10-12 18:56:00
感謝更新
作者: smallreader (小讀者)   2022-10-12 23:49:00
pixnet也是啊 每次搜尋都看到作假時間+一堆重複垃圾
作者: smallreader (小讀者)   2022-10-12 23:49:00
pixnet也是啊 每次搜尋都看到作假時間+一堆重複垃圾
作者: fujisawa (Feel the RUSH)   2022-10-13 00:09:00
我進Egde商店還是5.6耶
作者: fujisawa (Feel the RUSH)   2022-10-13 00:09:00
我進Egde商店還是5.6耶
作者: mjsg (mjsg)   2022-10-13 05:31:00
感謝更新
作者: mjsg (mjsg)   2022-10-13 05:31:00
感謝更新
作者: g5637128 (幫QQ)   2022-10-13 06:41:00
作者: g5637128 (幫QQ)   2022-10-13 06:41:00
作者: zhtw (人生就是不停的後悔。。)   2022-10-14 19:56:00
請問列入r18的標準是啥?為何有的網站列入 但測試其他更大的網站如pronhub、xvideo卻沒在裡面 話說為何要擋r18阿?瞭解 感謝說明!
作者: zhtw (人生就是不停的後悔。。)   2022-10-14 19:56:00
請問列入r18的標準是啥?為何有的網站列入 但測試其他更大的網站如pronhub、xvideo卻沒在裡面 話說為何要擋r18阿?瞭解 感謝說明!
作者: smallreader (小讀者)   2022-10-15 11:32:00
惡性轉址的,我只能從有沒有頁庫存檔來過濾不曉得這兩者關聯性有沒有強到可以直接擋也不會誤殺(說完已經找到反例了: tomshardware.com/reviews)之前是搜尋一些商品名吧,會有一些似是而非的文章,像機器亂湊的,而且網域名很奇怪,又沒有頁庫存檔,點開果然是惡性轉址的。反例是有的正牌網站搜尋結果,也沒有小三角頁庫存檔搜尋對岸色情網站特定長字串,才會出現大量沒有實體頁面/頁庫存檔的結果,我03:32講的是搜尋這些的時候自己分辨哪些不要點。但我現在瞭解到色情、博弈網站不視為內容農場
作者: smallreader (小讀者)   2022-10-15 11:32:00
惡性轉址的,我只能從有沒有頁庫存檔來過濾不曉得這兩者關聯性有沒有強到可以直接擋也不會誤殺(說完已經找到反例了: tomshardware.com/reviews)之前是搜尋一些商品名吧,會有一些似是而非的文章,像機器亂湊的,而且網域名很奇怪,又沒有頁庫存檔,點開果然是惡性轉址的。反例是有的正牌網站搜尋結果,也沒有小三角頁庫存檔搜尋對岸色情網站特定長字串,才會出現大量沒有實體頁面/頁庫存檔的結果,我03:32講的是搜尋這些的時候自己分辨哪些不要點。但我現在瞭解到色情、博弈網站不視為內容農場
作者: chancewen (閒人亂逛)   2022-10-11 22:46:00
難怪GC商店一直重整都是5.4 看到注意了XD
作者: rick (可惜沒如果)   2022-10-12 08:14:00
水啦! 辛苦大大了!!! 還好主力是firefox Orz
作者: goldie (阿良)   2022-10-12 09:13:00
作者: jqs8ah5ar (Ra5hUxen)   2022-10-12 10:04:00
google搜尋引擎都淪陷了 農場文連結都高掛排名前面
作者: masutaka (taka=米嘎)   2022-10-12 10:56:00
感謝更新
作者: smallreader (小讀者)   2022-10-12 15:49:00
pixnet也是啊 每次搜尋都看到作假時間+一堆重複垃圾
作者: fujisawa (Feel the RUSH)   2022-10-12 16:09:00
我進Egde商店還是5.6耶
作者: mjsg (mjsg)   2022-10-12 21:31:00
感謝更新
作者: g5637128 (幫QQ)   2022-10-12 22:41:00
作者: zhtw (人生就是不停的後悔。。)   2022-10-14 11:56:00
請問列入r18的標準是啥?為何有的網站列入 但測試其他更大的網站如pronhub、xvideo卻沒在裡面 話說為何要擋r18阿?瞭解 感謝說明!
作者: smallreader (小讀者)   2022-10-15 03:32:00
惡性轉址的,我只能從有沒有頁庫存檔來過濾不曉得這兩者關聯性有沒有強到可以直接擋也不會誤殺(說完已經找到反例了: tomshardware.com/reviews)之前是搜尋一些商品名吧,會有一些似是而非的文章,像機器亂湊的,而且網域名很奇怪,又沒有頁庫存檔,點開果然是惡性轉址的。反例是有的正牌網站搜尋結果,也沒有小三角頁庫存檔搜尋對岸色情網站特定長字串,才會出現大量沒有實體頁面/頁庫存檔的結果,我03:32講的是搜尋這些的時候自己分辨哪些不要點。但我現在瞭解到色情、博弈網站不視為內容農場
作者: Belieeve (芥末拿鐵)   2022-10-25 19:06:00
感恩分享

Links booklink

Contact Us: admin [ a t ] ucptt.com