- 交互設(shè)計(jì)模式:流行的站點(diǎn)導(dǎo)航設(shè)計(jì)模...
- LOGO設(shè)計(jì)理論:三角形在LOGO設(shè)計(jì)中的運(yùn)...
- 什么是移動(dòng)設(shè)備的最佳閱讀體驗(yàn)
- 信息設(shè)計(jì)的交流原則和信息設(shè)計(jì)中的圖...
- 網(wǎng)頁設(shè)計(jì)與眾不同通過細(xì)節(jié)的設(shè)計(jì)體現(xiàn)...
- 互用體驗(yàn)設(shè)計(jì):雜志類電子客戶端優(yōu)化體...
- 用戶體驗(yàn)衡量:Google應(yīng)用的用戶中心的...
- 輿情監(jiān)測(cè)和危機(jī)公關(guān):輿情軟件的灰色地...
- 豆瓣為什么會(huì)做α城?不負(fù)責(zé)任地評(píng)價(jià)...
- 互聯(lián)網(wǎng)產(chǎn)品設(shè)計(jì):Dropbox邀請(qǐng)返利設(shè)計(jì)...
- 交互設(shè)計(jì)方法:利用人物角色做web信息...
- 產(chǎn)品交互設(shè)計(jì)實(shí)例:首都機(jī)場(chǎng)的點(diǎn)煙器
超級(jí)揭秘:百度谷歌識(shí)別偽原創(chuàng)算法
首先我寫的這篇文章完全源自本人長(zhǎng)期觀察總結(jié),如果有何不妥請(qǐng)指正。畢竟我研究SEO也有一段時(shí)間,雖然說SEO的最高境界是忘記SEO,但是SEO技術(shù)也還是非常有趣的,我研究SEO技術(shù)純粹是個(gè)人興趣,寫這篇文章也是給各位站長(zhǎng)做一個(gè)很好的參考。
第一,搜索引擎會(huì)過濾“的,了,呢,啊”之類的重復(fù)率非常之高的對(duì)排名無幫助的無用詞語。
第二,這里要談為什么有時(shí)候轉(zhuǎn)換近義詞無效。從這里開始就算是我個(gè)人的經(jīng)驗(yàn)總結(jié)了。既然市場(chǎng)上有一堆偽原創(chuàng)工具能夠?qū)⒃~語偽原創(chuàng)比如將“電腦”偽原創(chuàng)為“計(jì)算機(jī)”,那么有什么理由不相信強(qiáng)大的搜索引擎不會(huì)偽原創(chuàng)?所以肯定的,搜索引擎一定會(huì)近義詞偽原創(chuàng),當(dāng)搜索引擎遇到“電腦”和“計(jì)算機(jī)”時(shí),會(huì)將他們自動(dòng)轉(zhuǎn)換這里姑且假設(shè)為A,所以很多情況下的近義詞偽原創(chuàng)不收錄的原因。
第三,這里要談為什么有時(shí)候不僅近義詞轉(zhuǎn)換了并且打亂句子與段落依然無效。當(dāng)搜索引擎過濾掉無用詞,并將各類近義詞轉(zhuǎn)化為A,B,C,D后開始提取出這個(gè)頁面最關(guān)鍵的幾個(gè)詞語A,C,E(這里舉個(gè)例子,實(shí)際可能提取的關(guān)鍵字不是ACE三個(gè)而是1個(gè)到幾十個(gè)都是說不定的)。并且將這些詞進(jìn)行指紋記錄。這樣也就是說,近義詞轉(zhuǎn)換過的并且段落打亂過的文章和原文對(duì)于搜索引擎來說是會(huì)認(rèn)為一模一樣的。
第四,這段更深層次解釋為什么幾篇文章段落重組的文章依然可能會(huì)被搜索引擎識(shí)別出。首先既然百度能夠生成指紋自然也能解碼指紋,段落重組的文章不過是重要關(guān)鍵字的增加或者減少,這樣比如有兩篇文章第一篇重要關(guān)鍵字是ABC,而第二篇是AB,那么搜索引擎就可能利用自己一個(gè)內(nèi)部相似識(shí)別的算法,如果相差的百分?jǐn)?shù)在某個(gè)值以下就放出文章并且給予權(quán)重,如果相差的百分?jǐn)?shù)高于某個(gè)值那么就會(huì)判斷為重復(fù)文章從而不放出快照,也不給予權(quán)重。這也就是為什么幾篇文章段落重組的文章依然可能會(huì)被搜索引擎識(shí)別出的原因。
第五,我要解釋下為什么有些偽原創(chuàng)文章仍然可以被收錄的很好。我上面的推理只是對(duì)于百度識(shí)別偽原創(chuàng)算法的大致框架,實(shí)際上谷歌百度對(duì)于識(shí)別偽原創(chuàng)的工作要更加龐大并且復(fù)雜的多,谷歌一年就會(huì)改變兩百次算法足以看出算法的復(fù)雜性。為什么某些偽原創(chuàng)的文章依然可以被收錄的很好。只有兩個(gè)原因:
1.網(wǎng)站自身權(quán)重高,哪怕不為原創(chuàng)照搬別人的文章還是百分之百會(huì)被收錄給予權(quán)重。
2.搜索引擎絕對(duì)不可能完美到過濾所有偽原創(chuàng),這是不可能的,就好像人工智能的圖靈永遠(yuǎn)無法完美到擁有人類的情緒一樣。
個(gè)人建議:
1)各位做垃圾站群的朋友們注意了,你們?cè)诳梢該埔还P的時(shí)候就盡情撈一筆吧。但是也希望你們能夠考慮下今后是不是有別的方向可以做?如果百度一下子更改某些算法使得判斷偽原創(chuàng)更智能,哪怕是一些細(xì)小的變動(dòng)也可能就是你們的滅頂之災(zāi)吧。另外今年谷歌也對(duì)垃圾站宣戰(zhàn)了,呵呵你們自己看吧。
2)各位老老實(shí)實(shí)寫原創(chuàng)的站長(zhǎng)們,你們絕對(duì)選對(duì)路了。但是同時(shí)也注意下自己的版權(quán)問題哦。
本文為本人原創(chuàng) 最后也歡迎各位有什么好的想法我們一起交流 我的站是 江蘇企業(yè)SEO www.seohcit.com
全國統(tǒng)一免費(fèi)服務(wù)電話
400-028-5488
800-829-8988
專業(yè)網(wǎng)站建設(shè)咨詢電話
028-66533110
028-66533120
24小時(shí)移動(dòng)總機(jī)
15902883120
天府星空05號(hào):張小姐
負(fù)責(zé)范圍:域名主機(jī)、網(wǎng)站建設(shè)
免費(fèi)熱線:400-028-5488
在線聯(lián)絡(luò):QQ:80002030
電子郵件:sale@tfxk.com
負(fù)責(zé)范圍:業(yè)務(wù)咨詢、疑問解答
免費(fèi)熱線:400-028-5488
在線聯(lián)絡(luò):QQ:800002030
電子郵件:sale@tfxk.com