※ 引述《qddcynthia (溫暖的大手)》之銘言:
: 之前面試時遇到的一個假設性問題:
: 公司A的有POS, CRM等系統,想要導入公司B的即時推薦系統.如果是你公司B的
: 技術經理。把公司A的資料複製到B公司準備好的雲端系統之前,你會想要先跟
: A公司確認哪些東西?
如果非單純資料遷移,而是從推薦系統的角度來回答這個問題。
一個完整的推薦系統由三個部分組成:
1.行為紀錄模組:負責紀錄使用者行為
2.模型分析模組:負責分析使用者行為,以建立合適的模型來描述其偏好
3.推薦演算法模組:負責即時從項目集合中篩選出使用者偏好項目進行推薦,又可以分為
:
A.協同過濾(Collaborative Filtering):搜尋一大群人,從中找到與我們品味相近的一
小群人;演算法會針對這些人偏好的其他內容進行計算,產生一個有序的推薦清單。可再
細分為基於使用者(User-based)或基於項目(Item-based)。
B.基於內容(Content-based):不需要依賴使用者對項目的評價,而是依據使用者已經選
擇的項目內容計算使用者之間的相似度。
C.混合法(Hybrid Approaches):擇優汰劣,結合以上兩種方法,可再細分為獨立系統
相互結合,或協同過濾系統加入基於內容法。
協同過濾法又可以分為兩類:
1.基於記憶(Memory-based):根據系統中所有被評分的項目,得到使用者行為模型進行
預測。
2.基於模型(Model-based):根據收集評分資料進行機器學習,得到使用者行為模型進
行預測。
推薦系統有三個典型的問題:
1.冷啟動(Cold Start):如何對新使用者進行推薦或如何推薦新項目給使用者。
2.稀疏性(Sparsity):在任何推薦系統中,已經評分的項目通常比需要推薦的項目數量
少很多,而導致精確度低落之問題。
3.可擴展性(Scalability):面對日益增多的使用者,資料量急劇增加之問題。