欧美中文字幕第一页-欧美中文字幕一区-欧美中文字幕一区二区三区-欧美中文字幕在线-欧美中文字幕在线播放-欧美中文字幕在线视频

產品推薦系統架構初探

我是創始人李巖:很抱歉!給自己產品做個廣告,點擊進來看看。  

想象一下,站在推薦引擎面前的你被抽離出一個數字的軀體。你找到一面鏡子,卻驚詫的發現自己的身體被無數數據所填充,許是:科技10%、籃球4%、熱火隊2.3%、歷史1%、自然0.3%。你仔細觀察,甚至發現了很多連你自己都沒有注意到的細節:雖然熱愛旅游,但你喜歡博物館遠多過自然景觀。當然,你也會發現自己的身體上仍然有一團團的迷霧,那是尚未被系統所發掘的興趣點。

專門為你適配的內容如一群螢火蟲般朝你涌來,你伸手點擊了一條內容將它點亮。就在點擊的那一瞬間、你身上的迷霧有一絲散去了,同時顯示出了新的興趣點:“極限運動:0.01%”,那些原本就存在的密密麻麻的數字也有一些發生了變化:有的權重上升、有的權重下降。每一次選擇與反饋,你都在進化著自己的數字軀體。

現在,你生出了雙翅、原地飛翔了起來,能夠從高處俯瞰整個推薦系統。你看到了一個又一個數字擬態的人,在不同的信息流中暢游。每個人身邊圍繞著許許多多的信息光點、又同其他人之間有著若隱若現的連接。一個個信息被閱讀的點亮、被忽略的變暗。每一個被點亮的光點就像被延續了生命一樣,得以被分裂成更多光點、順著人和人之間的連接,飛舞到更多的人身邊。此起彼伏的光點明滅,共同照亮了整座系統,讓它仿佛有生命一般慢慢擴張。

產品推薦系統架構初探
圖片制作:https://wordart.com/create

這個過程聽起來或許科幻,但用來描繪推薦系統,怕是再恰當不過了。
推薦是一個協作與進化的過程:

  • 對于內容而言,每一個用戶既是消費者又是決策者,被認可的內容得以進一步擴散,不被認可的內容被糾偏、不至于影響更多的人。
  • 對于用戶而言,每一次行為反饋都在不斷完善自己的用戶畫像;而系統的興趣探索行為,也在進一步給這幅畫像補充了更多維度。

大致了解推薦系統的架構,能夠幫助我們認知到:信息是如何匹配給用戶的,而用戶的選擇又是如何影響后續的信息分發的。

作為一個工程問題,推薦系統的架構與搜索系統的架構具有一定的相似度:都做的是信息與用戶意圖之間的匹配。

搜索系統是將海量內容與用戶表意明確的查詢相關聯,推薦系統則是將海量內容與用戶沒有明確表達的偏好相關聯。

如果我們將推薦問題極度簡化:用戶只有一個愛好“NBA”時,那么推薦引擎給用戶的結果就可以近似搜索引擎在“NBA”這個搜索詞下的結果。

那么,一個簡化的搜索架構是什么?

產品推薦系統架構初探

離線部分,專注在內容的搜集和處理上。

搜索引擎的爬蟲系統會從海量網站上抓取原始內容,針對搜索體系的不同要求建立索引體系。在上圖中,為了新內容能夠更好的被用戶看到,就專門建立了時效性索引數據用于存儲幾個小時之內的新內容。這是一個基于關鍵詞的倒排索引,每一個關鍵詞對應一長串提及該關鍵字的文章。比如,“教育”這個詞命中文章1、2、3;“NBA”命中了另外一批文章1、2、4。

在線部分,負責響應用戶的搜索,完成文章的篩選、排序并最終返回給用戶。

用戶輸入一個搜索詞“NBA”,這個詞匯會首先經過搜索詞的處理(會經過分詞、搜索詞變換等步驟),例如“NBA”和“美職籃”是同義詞,那么在兩個詞都可以應用在索引的查詢。

經歷完搜索詞處理后,進入召回環節。系統會通過多種召回方式,從索引數據里獲得候選集合。在圖中,就分別查詢了全量的索引數據和時效性索引數據,獲得了8篇文章的集合。

在召回的候選集之上,會進行排序的步驟,通過進一步計算獲得最終結果反饋給用戶,如圖中的文章10和文章1。

用戶的點擊反饋也會影響排序環節的模型。在上圖中,用戶在展示給他的兩篇文章中只點擊了文章10,這一特征會被模型記錄以統計文章10和文章1在搜索詞 “NBA”下的表現情況。

借由搜索系統為參考,可以更好的理解推薦系統。

產品推薦系統架構初探

離線部分,同樣需要通過各種方式來獲取待推薦的內容(用戶提交、協議同步、數據庫導入等)。并依據推薦引擎處理的不同維度對這些內容進行索引處理,如話題、類目、實體詞等。在上圖中展示了兩個維度:分類維度和實體詞維度。

在線部分,其理亦然:量化用戶的請求,完成文章的篩選和排序。
推薦與搜索最大的差異,在于用戶表意的不明確性,故而,需要盡可能的完善用戶的長期畫像(對哪些類目、實體詞、話題感興趣)和短期場景(時間、地點),以此獲得用戶的意圖,從而進行意圖和內容的匹配。

  • 當用戶打開內容推薦軟件時,提交給系統的信息如:時間、地理位置、網絡環境、手機設備型號、登陸用戶ID等。
  • 基于用戶ID,推薦系統會取出用戶的畫像數據(User Profile)。在分類維度,用戶對體育和科技的內容感興趣;在實體詞維度,對于NBA感興趣。
  • 根據用戶的畫像信息,發起不同的召回過程(類目查詢和實體詞查詢),獲取各種類型的內容構成候選集合。
  • 按照特定預估目標(如點擊導向、互動導向)對候選集統一排序,并反饋給用戶。

值得注意的是:對于推薦系統而言,用戶的行為不僅具有針對內容價值評估的群體投票意義(如:某篇關于NBA的文章,偏好NBA的用戶都不點擊,那么其在“NBA”這個實體詞下應該權重降低)同樣具有針對自身畫像的個體進化意義(如:用戶總是點擊有關于熱火隊的NBA文章,那么這個用戶的畫像中會補充“熱火”這個實體詞,影響后續他自己的推薦內容流。)

本文被轉載1次

首發媒體 產品壹佰 | 轉發媒體

隨意打賞

產品系統設計推薦系統架構產品的架構系統架構
提交建議
微信掃一掃,分享給好友吧。
主站蜘蛛池模板: 女女女女女女bbbbbb级毛片 | 国偷盗摄自产福利一区在线 | 国产精品视频久久久久 | 亚洲精品一区二区三区不卡 | 国产亚洲欧洲国产综合一区 | 天天干天天操天天爱 | 日韩一区二区国色天香 | 九九亚洲精品 | 中文字幕一区2区3区 | 国产欧美网站 | 8x在线永久成人影院 | 亚洲一区二区三区麻豆 | 国产精品100页 | 99精品国产在热久久 | 国产一区二区高清在线 | 成年女人免费看片 | 日韩精品久久不卡中文字幕 | 欧美日韩一区二区三区麻豆 | 一区二区三区亚洲视频 | 国产精品永久免费视频观看 | 日韩欧美国产中文字幕 | 99热久久这里只有精品 | 天天干在线影院 | 日韩中文字幕高清在线专区 | 国内国产精品天干天干 | 99九九99九九九视频精品 | 四虎永久在线免费观看 | 亚洲国产精品视频 | 四虎影视永久免费观看 | 国产成人亚综合91精品首页 | 天天躁天天碰天天看 | 久揄揄鲁一二三四区高清在线 | 久草在线中文 | 九九热视频精品在线 | 欧美日韩在线视频一区 | 最近中文字幕免费版在线3 最近中文字幕无吗高清视频 | 亚洲视频在线播放 | 中国一级特黄高清免费的大片 | 免费视频一区二区性色 | 国产一二精品 | jzz欧美|