????? 大學時候?qū)W離散數(shù)學,啥都沒學好,但是還有一個東西觸動了我。比如一個事物,我們常說真的、假的事物(真命題、假命題),但是還有一個東西,有些事物對與錯是有概率性,不一定對也不一定錯,這樣我們只能把概率融入到選擇中來進行選擇,這就是貝葉斯算法。
2011年學了seo之后,沒料到這個算法影響了很多方面。在seo的很多方面都是這樣的,呈現(xiàn)了很多的兩面性,而且在一定概率之后,影響的因素會發(fā)生了很多的變化。seo實質(zhì)是追求平穩(wěn)態(tài)的一個動態(tài)過程,例如圖上的就說明白了很多問題。所以你了解seo后,你發(fā)現(xiàn)現(xiàn)在所謂的seo培訓都是不行的,因為他們的都是告訴你哪些因素的影響了那些權(quán)重,其實任何的一個因素和其它因素之間,一個因素自身對網(wǎng)站影響都是具有著非線性、相對性、階段性的影響,下面我就 慢慢解釋一下:
比如百度切詞,粒度越小,召回就越多,建立倒排索引時,索引的長度就越長;粒度的層次越多,索引的數(shù)量就越多。一個多,一個長形成了不同的用戶體驗,搜索 引擎一般采用性價比的方式來進行選擇。例如搜索排序算法里存在著這里的例子,網(wǎng)頁排序與查詢的匹配程度,和網(wǎng)頁本身的好壞都有關(guān)系,如過兩者存在一定的差異,就只好采用貝葉斯算法進行匹配……(本段節(jié)選百度博客)
在鏈接方面也存在著相同的東西。在網(wǎng)站權(quán)重理解上,我一般分成了三種,其中2個鏈接因素兩個內(nèi)容因素,兩個內(nèi)容因素是相反的,兩個鏈接因素也是相反的。這其實是出乎我的意料之外的。
以上所說的解釋了一個東西,那就是seo的影響因素是相對性的,真假命題很多時候是貝葉斯算法在起著作用,下面的一個感想對我感觸非常大,也是這篇博客所要說的:
昨晚第N次讀了夜息的金字塔鏈接模型http://www.imyexi.com/?p=235,思考一下,在以前我曾經(jīng)讀了這篇文章后狠狠地研究了下鏈 接模型和拓撲連接模型,例如我這篇博客的頭型就是最好的拓撲連接模型,但是我昨晚卻忽然覺得有些地方錯誤了,就在2012年鐘聲敲響的時候,我忽然想也許 夜息和我們都錯了……
如果您已經(jīng)讀了那篇博客,其中有兩個概念不得不說,一個是鏈輪一個是站群,這兩個都是目前非常流行的seo策略,被很多人所推崇,前一段經(jīng)??吹竭@方面的研究,都在說明網(wǎng)站權(quán)重傳遞是怎么的好,其中的原理就是鏈接之間的相互迭代傳遞,或者在圖論邏輯上是向量空間模型。
說道向量空間模型,這里有一個問題必須說明的是,在數(shù)據(jù)結(jié)構(gòu)里搜索是如何存儲數(shù)據(jù)的。一般情況下我們認為是單一節(jié)點存儲的,但是大量的鏈接關(guān)系的話,需要 的存儲空間是非常巨大的,如何節(jié)省存儲呢,最簡單就是把相同方向指向的放在一起,這樣一來一個問題就產(chǎn)生了,如果采用鏈輪或者站群在第一層迭代和第二層迭 代里數(shù)據(jù)是相同的(或者第二層迭代小于第一層迭代),如果搜索采用數(shù)據(jù)統(tǒng)計來研究網(wǎng)站鏈接的話,這么簡單的數(shù)據(jù)蜘蛛不明白是什么神馬嗎……我嚇死差點…… (本人認為搜索會進行此數(shù)據(jù)統(tǒng)計,而且會采用二叉樹節(jié)點計算來做鏈接的迭代計算。)
其實,更加深究這些問題,比如外鏈要不要做模型。我們可以這么一個設(shè)想,假如一個網(wǎng)站有101個頁面(1個首頁和100個內(nèi)頁),假設(shè)兩種特別情況,每個頁面都連向首頁,但是相互之間不連接,首頁連向每個頁面;另一個條件是每個網(wǎng)頁都連向其他100個鏈接,那么對于一個網(wǎng)站來說,這兩種情況下網(wǎng)站權(quán)重一樣嗎?(這是在理想情況下,沒有任何外鏈情況下,切記首頁只是一個網(wǎng)頁)
對于這個問題我曾經(jīng)一度非常的糾結(jié),后來借助三權(quán)(頁權(quán)、位權(quán)和域權(quán))分立研究,發(fā)現(xiàn)了很多有趣的問題,假如我們把上面的問題改為另外一個問題,假如一個人擁有一個公司100%的股份,價值是100W,或者一個人擁有100個公司每個公司1%股份,價值也是100W,請問這個人的財富影響力變化了沒有?
其實結(jié)果是或許是這樣的,如果這個人比較強勢,那么其影響力輻射到100個公司,其財富影響力最大可以到100個100W,如果一個人比較弱勢,那么其影 響力從100w到了0.這非常類似于谷歌的隨機沖浪模型,如何用戶體驗很好,或許會點很多,也許只點擊進入頁就走了……
就現(xiàn)實來說,其實還存在一個問題,就是公司股權(quán)問題,以上兩種之外還存在一個黃金點35.9W控制一個公司的股權(quán)(具體大家可以參考金融),那么這個很穩(wěn)定的控制影響力,可以控制200W和其他的一點,這個我可以稱之為穩(wěn)定態(tài),而最初的兩種被稱為初始態(tài)和最終態(tài),而35.9是最好的比例點,這點也可以解釋 每個網(wǎng)頁最穩(wěn)定的最好的鏈接比例是多少,一個網(wǎng)頁有36個主題html鏈接有最穩(wěn)定的隨機沖浪點擊鏈接(大家可以測試下)。
這個問題其實我是想說的是偽命題,因為每個網(wǎng)站內(nèi)容不同,用戶體驗不同,其連接位置、鏈接關(guān)鍵詞不同等,同一個網(wǎng)站任何一個網(wǎng)頁權(quán)重產(chǎn)生了差異性。但是任何鏈接模型都是在降低域權(quán)來提高位權(quán)的一個過程,兩者的權(quán)重和是沒有改變的,有改變的是其中的“現(xiàn)實過程”或隨機沖浪者可以達到的UV數(shù)量,而這個最終和頁權(quán)改變有關(guān)系。而頁權(quán)就是和你勞動力有關(guān)系的一個權(quán)重,所以做了一圈總的能量是守恒的,而變化的是您的力氣化作了能量。(頁權(quán)、位權(quán)和域權(quán)是三種不同的 權(quán)重計算方式,任何一個網(wǎng)頁都是由此三種權(quán)重傳遞而來,看清楚了是三種不是三個……)
看到這里,連我這個解釋者都覺得很多人難以理解,其實這個意思簡單就是說無論站群或者鏈輪并沒有從本質(zhì)上改變網(wǎng)站權(quán)重,和連不連接模型一點關(guān)系都沒有,因為鏈輪和站群并沒有增加二度迭代的鏈接數(shù)量,所以說搜索引擎不會K掉鏈輪和站群的,因為是您的“花費的時間”轉(zhuǎn)化為了頁權(quán),而您在這段時間里也可以通過提高其他權(quán)重達到相同的效果。
1,36個是相對穩(wěn)定態(tài),不是絕對值,不要追究為何不是35;
2,一些說法都是相對說法,都不是絕對的,所以你要站在相對論的前提下閱讀本篇文章;
3,本人研究seo時間很短,很慚愧地說也沒有接受神馬培訓,不過看了很多免費資料,自己造的一套seo理論是依據(jù)三權(quán)、五構(gòu)、七標、十三點(核心是自然 的平穩(wěn)態(tài)),里面內(nèi)容比較駁雜,以后慢慢通過寫博客分享出來,其中這篇文章當中很多細節(jié)都需要解釋的,會在以后慢慢解釋;