【萊蕪百度】我們來談一談網(wǎng)站SEO中的內(nèi)容分析
網(wǎng)站中的內(nèi)容分析主要是指文本的分析,圖片的分析以及視頻的分析。舉個例子吧,今日頭條最初也是做資訊的,由它來說一說文本分析。用戶的興趣建模就是文本分析在網(wǎng)站推薦系統(tǒng)中的尤為重要的作用。如果自己的文章中沒有內(nèi)用以及文本標(biāo)簽,那么它就無法引起用戶的興趣。例如當(dāng)文章的標(biāo)簽顯示文章的來源是互聯(lián)網(wǎng)時,用戶才能在網(wǎng)頁中搜索瀏覽。
從另一個角度來看能夠?qū)W(wǎng)頁的推薦特征起作用的就是文本內(nèi)用的標(biāo)簽。而文本內(nèi)用的標(biāo)簽現(xiàn)在越走越艱難。比如金立手機中的內(nèi)容就可以推薦給關(guān)注金立手機的用戶。這種情況就是用戶標(biāo)簽的匹配結(jié)果。如果在一段時間中推薦的效果不明顯,同時出現(xiàn)推薦趨于窄項化。這樣用戶在發(fā)現(xiàn)具體頻道后繼續(xù)閱讀。
例如今日頭條中的推薦系統(tǒng)主要就是抽取文本特征的幾個類型。第一就是語言標(biāo)簽類的特征,這一特征在網(wǎng)站中顯示為文章中的語義標(biāo)簽。因為這一類的標(biāo)簽主要就是由人為定義的。在網(wǎng)站中每一個標(biāo)簽都有它自己明確的意義,而且網(wǎng)站中的體系是要提前穿插定義的。另一特征就是隱式語義特征,這里面主要包括topic的特征和關(guān)鍵詞的特征。topic特征主要是對文章中關(guān)鍵詞的概率分布的描述,在這里他沒有明確的意義。我們要知道文章中的關(guān)鍵詞要有統(tǒng)一性,但不一定聚集在一起。