雲程若提示您:看後求收藏(八零中文www.80zw.tw),接著再看更方便。
時,系統對物品資訊也會做進一步的資料探勘工作,從而形成物品畫像。在構建好使用者畫像和物品畫像之後,個性化推薦系統會利用所有收集到的資料去聯絡“人”和”物品“。個性化推薦主要分成召回和排序兩部分,召回的主要作用就是儘可能地找到使用者可能感興趣的物品,其中最經典的演算法便是協同過濾演算法。
協同過濾演算法,顧名思義,協同過濾就是協同大家的反饋、評價和意見一起對海量的資訊進行過濾,篩選出使用者可能感興趣的物品的過程。根據技術實現不同,協同過濾演算法又可分為基於使用者相似度的UsercF、基於物品相似度的ItemcF和基於隱向量表達的矩陣分解cF。
基於使用者相似度的協同過濾UsercF的主要思想是興趣相似的人喜歡相似的物品,簡單來說,就是推薦給你和你瀏覽行為相似的使用者所喜歡的物品。
基於物品相似度的協同過濾ItemcF則是從使用者有過行為的物品下手,推薦給你與你喜歡的物品相似的物品。例如你今天看了一部《蠟筆小新》,那麼就推薦給你演算法認為的與《蠟筆小新》比較相似的《哆啦A夢》等動漫。
基於矩陣分解的協同過濾,矩陣分解cF的思想更為直接。它把使用者與商品的互動行為表示為一個矩陣,其中矩陣的行和列代表使用者與商品,矩陣的元素代表使用者對商品的互動行為(如點選與評分等)。矩陣分解cF希望將互動矩陣近似地分解為一個使用者隱含表示矩陣和一個商品隱含表示矩陣的乘積,從而填補互動矩陣中未知的元素。在協同過濾演算法之後,還出現了很多更復雜的召回演算法,例如基於內容的演算法等,究其本質還是基於相似度的推薦。同時,為了更全面地覆蓋使用者的多樣興趣,推薦系統往往會採用多路召回的機制,使得生成的候選商品更加全面多樣。
在做完召回之後,個性化推薦系統已經獲取了其認為使用者可能感興趣的物品,但一般召回階段獲取的物品數量會相當多,此時便需要多個排序模組對召回的物品進行多級排序,最後將精挑細選的少量物品展示給使用者。
排序演算法的原理,排序階段一般會整合現階段能收集到的所有資訊預測使用者對物品發生某種行為(點選、加購、收藏等)的可能性。排序過程可以理解成將使用者定位到某一類人群,再根據現有的資訊給出這一類人群對於當前物品的偏好,當然個性化推薦系統對人群的分類會更細緻,甚至是無法用語言來解釋其對人群的分組,但本質上還是一回事。
後處理,在經過上述過程之後,個性化推薦有時候還會經過後處理。一方面,為了保證使用者看到的資訊具有一定的多樣性,平臺往往會對排序結果進行打散,使得使用者看到的推薦結果不會過度同質化。另外,針對平臺運營的機制與策略,可能會對排序結果進行調整。比如,假設《蠟筆小新》和《哆啦A夢》與給二次元人群的相關度近似,但假如由於《哆啦A夢》的提供商出錢比較多,也可能會導致《哆啦A夢》的排序在《蠟筆小新》之前。
這麼看來,好像個性化推薦完全是為了便利人們生活需求所產生的新事物,但是個性化推薦真的只有好處沒有壞處嗎?恐怕不盡然。
現在社會上對個性化推薦的批判主要有兩點考量,一是批判個性化推薦會導致資訊繭房,二是覺得個性化推薦侵犯了自己的隱私。
一是資訊繭房,資訊繭房指人們關注的資訊領域會習慣性地被自己的興趣所引導,從而將自己的生活桎梏於像繭一般的“繭房”中的現象,簡單來說就是我們每天只會關心同質化的內容。但對於個性化推薦系統本身來說也不希望使用者陷於資訊繭房,從平臺角度出發挖掘出使用者更多的興趣點也就意味著更多的盈利點,比如一個二次元使用者本來只會買二次元產品,如果個性化推薦系統推薦其熱門運動類物品並使