作者:
leeles (賢)
2014-06-10 23:04:31※ 引述《leeles (賢)》之銘言:
: 其實有解決的辦法。
: 簡單的說,就是自己的搜索自己做。
: 傳統的搜索引擎是由一家大公司獨佔去做,例如 Google
: 近代 p2p 技術發展之後,自然也有發展出 p2p 搜索
: 例如
: http://yacy.net/en/index.html
: 這個軟體安裝了之後,你的電腦就擁有一個搜索引擎了,同時可以幫助其他有安裝
: 這個軟體的人,由於這種分散式的架構,全部網路上每個安裝者都是搜索引擎
: 因此絕對不會發生這種單一公司想要強姦你,你就得乖乖就範的情形
: 雖然這種發展初期,能夠搜索的到的東西輸給 Google
: 但是現在他的價值已經展現出來了,至少他不會擋住任何關鍵字,包括 ロリ
: 透過每個人自助互助的力量,展現 p2p 的力量,擺脫單一大公司就能掌控你
: 圖書館的戰爭的故事大家都有看到,最終還是要依靠自己的力量
: 絕對不要相信 google 、百度 這種大公司
推 knon060718:不太懂原理耶 我以為google是強在搜索的邏輯與資料庫 06/10 22:36
→ knon060718:照這個解釋 搜尋引擎的強弱是怎麼決定的 06/10 22:36
對不起,佔用一下版面解釋一下 google 搜索的利害之處
google 最偉大的發明就是 map & reduce 以及擁有巨大的資料庫
簡化的形容就是把一份巨大的工作可以拆分成很多小工作,讓每一個小電腦去做苦工
做完之後再把結果整合在一起呈現出來
比方說搜尋一百萬個網頁中的資料,這件事原本是很困難的,google收到你的關鍵字
之後就把這個搜尋工作拆分成數萬份小工作,分散給數萬台電腦執行
每一台電腦的記憶體也是有限制,只能存放一小部分的索引
其實google資料中心的電腦,每一台單獨來看,並沒有什麼特別厲害之處
但是螞蟻雄兵的方式結合之後,就能處理巨大的工作
P2P 的原理其實也是可以做到,單獨一台電腦能夠索引的資料非常有限
但是如果可以集合網路上數萬台電腦一起來索引網際網路,就能發揮力量
所以要參與這種索引計畫的電腦不用很強,拿一般普通的電腦來做就可以
甚至有些人拿手機等級的 raspberry pi 那種 ram 只有 512 mb 的機器來做
但是每一個人都是一份力量,當你丟出一個搜索的關鍵字
這個關鍵字會流過這個搜索引擎網路上的電腦們,大家一起來幫忙你找資料
我想大家多少知道 p2p 可以用來下載檔案
每台電腦上存放一些檔案,但是整體 p2p 網路上的檔案可以超越那些大公司的硬碟數倍
就是這種螞蟻雄兵的方式,原理是一樣的..
這種開放式原始碼的 p2p 搜索引擎很多,這邊介紹的只是其中之一
p2p 可以做的事情很多,不是只有下載動畫而已,而是可以整個解放網際網路
讓某單一政府、公司、人,無法單獨壟斷決定你應該看什麼
圖書館戰爭裡面的人們也是要用自己的力量去捍衛自由
動畫中很清楚的表示出來,如果你不拿槍站出來捍衛自己的自由
就會等著被別人掌控
如果每一個人都死命的抱著一本書逃出來,保存下來
那十萬個人就可以帶著10萬本書獲得自由
Google的優點除了這個以外還有聽過一個他的搜尋排序不是主動比對關鍵字而是被動也就是說,不是你查"A"之後,跟"A"有關的排下去而是當多數一樣要找"A"這個關鍵字的使用者,最後
作者:
leeles (賢)
2014-06-10 23:08:00他是開放原始碼,擔心的人可以自己下載原始碼回來檢查之後
作者:
leeles (賢)
2014-06-10 23:09:00再決定要不要使用...或者自己從原始碼來建立
作者:
leeles (賢)
2014-06-10 23:11:00對,越多人當節點是越強..
作者:
leeles (賢)
2014-06-10 23:12:00所以很多人在努力改進這種 p2p 搜尋的精確度google 公司也是要把電腦都一直開機,電腦也會遷移/故障
個人是覺得P2P是建立在大家都臨時的機制下,然而從所
作者:
leeles (賢)
2014-06-10 23:13:00差別在於 google 有收入可以維持電費等開支,這種就是依靠
作者:
leeles (賢)
2014-06-10 23:14:00嚮往自由的人們的自發精神了
這種幾乎需要隨時在線的資料用P2P本身就有點怪了...
最後面圖書館戰爭就是ACG點啊 是說Google這個方式的缺
作者:
leeles (賢)
2014-06-10 23:15:00你說的對,資料完整度也許輸給 google 但是自由度大勝 goog
點已經浮現出來了 現在越來越多tag網站的排名不斷爬升
作者:
arrakis (DukeLeto)
2014-06-10 23:15:00推薦這篇的觀念。
作者:
leeles (賢)
2014-06-10 23:16:00當 google 不到某些關鍵字時,這種你覺得不穩定的優點反而
網站 可是網站裡面其實也只有垃圾資訊 卻名次上升造成
作者:
arrakis (DukeLeto)
2014-06-10 23:16:00同樣是"與其等待英雄,不如所有人都成為英雄"
恩...所以你的意思大概是無法抵抗Google但是這種作法可以抵抗"殘缺的Google"?
作者:
leeles (賢)
2014-06-10 23:18:00因為人的惰性,我們可以瞭解到這種p2p網路的缺點就如同你說的保種的問題,這的確是 p2p 網路的限制
如果你把自由度看得比完整度重要,就能理解為什麼你推P2P的問題了,的確沒錯
但是他也說了,google的完整度不一定是你想像中的完整啊
作者:
VIP (VIP先生)
2014-06-10 23:19:00那能看到更深的東西嗎?
作者:
leeles (賢)
2014-06-10 23:20:00可以,有些人也有在發展搜尋onion routing但是這些更深層的東西好像不適合在這邊談,所以...就單一這個關鍵字來說,google就輸給這種 p2p 引擎了
作者:
VIP (VIP先生)
2014-06-10 23:22:00在一般搜索的時候 會不小心進去嗎 然後就被抓走了(?)
作者:
leeles (賢)
2014-06-10 23:22:00這也是一個具體的事實,因為 google可以被單一單位掌控
不過先撇去自由度問題的話,P2P要超過Google能給的只有在Google殘缺到一個情況還有在遮蔽結果的部分才會有感受吧....這部分真的可以用驢子當借鏡,沒想像中樂觀Google在資料遷移維護的時候應該還是有備用硬體的這表示整個P2P架構應該要有類似Raid5的修復機制
作者:
leeles (賢)
2014-06-10 23:25:00你說的正是這種p2p 搜索引擎正在努力的地方索引資料都有複數備份,所以你的電腦關機不影響整個網路安裝之後也不用擔心,可以隨時離線,都沒關係的也不用刻意保種,因為其他人的會自動接手
作者:
leeles (賢)
2014-06-10 23:27:00所以我能出力的方是就是把公司閒置的 server 24hr 投入來一般人可以放心關機沒關係,總是會有人幫忙接手
其實阿...個人是覺得PC市佔率降低,NB 平板市佔率提高就算沒有關機,使用者的"在線度"可能也沒有想像中的高應該還有不少問題要克服..
作者:
leeles (賢)
2014-06-11 03:34:00如果發展到手機,那這套系統效率會更高因為手機的數量超級多,每一個人分配到需要在線上的時間可以大幅度的縮短,換句話說,說不定每個手機每天跑這個軟體
作者:
KIWAMI (俺は京都へ行く!)
2014-06-11 03:35:00光是電量和流量就擺明手機使用者不會支持這套
作者:
leeles (賢)
2014-06-11 03:35:005 分鐘,全世界的手機加起來就能超越 googlep2p 的特色就是,單一機器盡量弱沒關係,重點是數量假設每一個手機每天開啟這個軟體查詢 5 分鐘,那就夠了每個人貢獻的這五分鐘,大家整合起來就能產生力量意思是說,當你用手機在查詢的時候,同一時間也貢獻少許的資源出去給其他人,這帶來的效果會很驚人因為你查詢一個詞也許花5分鐘,但是這段期間貢獻了50個查詢這帶來數倍的放大效果,使得全體效率很驚人
作者:
lokilin (Loki)
2014-06-11 07:50:00PC並沒有變少 是其他變多了