作者:
GALINE (天真可愛CQD)
2016-05-23 14:14:17※ 引述《red0whale (red whale)》之銘言:
: 假設我有一個PDF檔叫test.pdf,該檔存在http://www.example.com/download/裡面
: 今天如果有人點進了這個PHP頁面裡頭,就會自動下載這個PDF檔案
: 我的這個頁面被Google的「爬蟲」找到了,並被放在他們的搜尋引擎資料庫裡
: 但是問題在:他們顯示出來的結果標題居然顯示「Untitled」,而且沒有說明內容
: 明明我原先的PDF檔(test.pdf)有標題啊,
: 為什麼他們搜尋出來的結果卻是沒有標題和說明內容呢?
: 請各位幫我解惑一下…
: 謝謝
今天很忙,直接貼我用了什麼關鍵字跟找到的結果
因為看不到你實際的檔案,所以也不知道你是不是踩到這問題
「google search result pdf title」
https://www.google.com.tw/search?q=google+search+result+pdf+title
第一筆
https://webmasters.googleblog.com/2011/09/pdfs-in-google-search-results.html
Q: How can I influence the title shown in search results for my PDF document?
A: We use two main elements to determine the title shown: the title metadata
within the file, and the anchor text of links pointing to the PDF file.
To give our algorithms a strong signal about the proper title to use,
we recommend updating both.
關鍵句:
title metadata within the file
anchor text of links pointing to the PDF
PDF 檔案有個標題設定(所以不是你第一行打很大的字他就知道那是標題)
連過去的連結文字
「pdf title metadata」
https://www.google.com.tw/search?q=pdf+title+metadata
第一筆
https://helpx.adobe.com/acrobat/using/pdf-properties-metadata.html
Choose File > Properties.
Click a tab in the Document Properties dialog box.
作者:
AndCycle (AndCycle)
2016-05-24 02:25:00我實際 google 了幾個pdf,實務上 google 現在好像是直接讀 pdf 內文的第一句話當標題, 其他資訊都不拿來用了
作者:
GALINE (天真可愛CQD)
2016-05-24 04:50:00我不太常處理PDF,不過經驗是Google會同時看好幾種資料就算是網頁,也可能有時抓title有時抓內文有時自己組字串而「Untitled」這個字串不太可能是Google自組的,感覺滿可能是從PDF的meta來,除非原文內文就有大大的Untitled...
作者:
AndCycle (AndCycle)
2016-05-24 16:34:00原po的pdf打開是一張圖, 原文就算有也是蓋在圖下面了你可以隨便 google 幾個 google 有標題的 pdf你會發現一堆都 meta 亂設的, google 根本不愛讀 meta