1.用"site:"當google搜尋工具,不是什麼奇怪的用法,算一個小技巧而已。
舉例,google "site:ptt.cc"(即https://www.google.com/search?q=site:ptt.cc)
可以看到google抓到的ptt.cc這個網域下面的網頁內容,也可再用空格加關鍵字,
所以假如google "gossiping site:ptt.cc" 就會看到很多八卦版網頁。
若有人用這個方法搜尋北市議會影音,合理理解是要找某個特定內容關鍵字的影音。
2.稍微看了一下google cache內容video.tcc.gov.tw內容出錯(有簡體字的部分),
最早有5月左右的紀錄:
https://tinyurl.com/5uypnu8z
注意最上面google說「這是該網頁於 2021年5月13日 00:47:53 GMT 顯示時的快照」
然後下面簡體字的內容也是5月13日,同天;
這個同天的情形幾乎出現在所有庫存網頁上。
3.看一下網頁原始碼,有個的發現:
所有庫存頁面簡體字網頁的原始碼,都有用到這個網域的圖片:
「www.gd.gov.cn」
gov的!這是什麼網站呢?是广东省人民政府门户网站
4.但我進入www.gd.gov.cn,用這篇錯文的簡體字去搜尋,並沒有找到相關資料,
拿錯文的內文「原标题:台湾客商重视东北亚博览会平台」google,找到中國新聞:
https://news.sina.cn/2019-08-24/detail-ihytcern3292895.d.html
再拿其他篇錯文去google,同樣也在中國新聞可以找到(多家不同的新聞網站)
5.另外,搜尋過程中也發現,bibliosalut這網站的google頁庫存檔有同樣的錯誤情形,
https://tinyurl.com/2z5xk7nr 不過這個網站看不懂原始在做啥,建議沒必要要點
6.我沒有結論,但目前資訊,我大概會先懷疑問題是google cache的問題?
然後,這些庫存頁面都是中國新聞隨意抓取(且新聞標題和內文還不符),
不確定跟SEO有沒有關係?