【黃驊seo】看看對模型推薦其重要作用的四類特征。

1.jpg

  下面就來看與模型推薦相關(guān)聯(lián)的四種特征:


  第一種特征就是熱度特征,其中就涵蓋了各個(gè)方面的熱度,例如網(wǎng)站主題的熱度,帖子內(nèi)容分類的熱度,以及網(wǎng)站中關(guān)鍵詞的熱度。而那些內(nèi)容的熱度信息在一些大型網(wǎng)站中會(huì)有一些意想不到的效用。


  第二種特征就是相關(guān)性的特征,相關(guān)性就是要將文章的內(nèi)容屬性要與用戶的需求相匹配。而這里的匹配分為顯性匹配和隱性匹配,像一些文章分類的匹配,網(wǎng)頁中關(guān)鍵詞的匹配,頁面主題的匹配等等這些都屬于顯性匹配。像一些FM模型中的匹配那就是隱性匹配。這些我們可以從內(nèi)容與用戶的向量距離可以看出。


  第三種特征就是我們常說的協(xié)同特征,這一特征在一定程度上解決了算法越走越艱難的問題。協(xié)同特征并不是看用戶所瀏覽的內(nèi)容,而是通過對一個(gè)個(gè)用戶的分析來判斷不同用戶之間是否存在相似,比如興趣相似,主題相似,亦或者是點(diǎn)擊相似,從這幾個(gè)方面我們就可以擴(kuò)展模型的搜索能力。


  第四種特征就是環(huán)境特征,這一特征包括文章的發(fā)表時(shí)間,發(fā)表地點(diǎn)等等,這既是bias特征,也是匹配特征。


  在模型的訓(xùn)練上,絕大多數(shù)的網(wǎng)站都推薦自己旗下的產(chǎn)品能夠采用實(shí)時(shí)訓(xùn)練。在這里的實(shí)時(shí)訓(xùn)練不僅節(jié)省資源而且用戶對于產(chǎn)品的反饋也非???。要知道在我們的網(wǎng)站中現(xiàn)如今的網(wǎng)站處理是要樣本數(shù)據(jù)的。這里面包括點(diǎn)擊率,展覽次數(shù)以及分享程度的動(dòng)作類型等等。