在线观看肉片AV网站免费_97在线中文字幕免费公开视频_人妻无码二区自慰系列_高清无码黄色在线网站

行業(yè)新聞

自動(dòng)從網(wǎng)站上抉擇一些詞語輸入表格

作者:admin    來源:tfxk    發(fā)布時(shí)間:2012-01-05    閱讀:1357次

  之前咱們已經(jīng)曉得Googlebot除了能抓取文本、視頻、音頻、Flash等類型的內(nèi)容外,它還能夠通過JS代碼抓取鏈接。并且在將來,Googlebot還有望直接辨認(rèn)圖片及視頻里的文字。為了進(jìn)一步抓取互聯(lián)網(wǎng)的內(nèi)容,Google發(fā)布Googlebot已可通過提交表格抓取更多內(nèi)容。


 


  據(jù)Google所述,當(dāng)前Googlebot正對(duì)一小局部高品質(zhì)網(wǎng)站進(jìn)行表格提交的實(shí)驗(yàn)。當(dāng)Googlebot發(fā)明這些網(wǎng)站上有HTML表格時(shí)(即檢測(cè)到

 

  Matt Cutts也寫了個(gè)帖子舉例解釋這么做的利益。有許多網(wǎng)站首頁只是以表單方法列出公司下屬的各地域分站,不以鏈接情勢(shì)列出各分站。這種網(wǎng)站以前是不能被深度收錄的,因?yàn)镚oogle不提交表單,就發(fā)現(xiàn)不了隱蔽在表單后面的URL。

 


 

 


  這種表格抓取當(dāng)前只是一個(gè)小范疇的試驗(yàn),Google表現(xiàn)不會(huì)對(duì)網(wǎng)站造成影響。既不會(huì)對(duì)網(wǎng)站的PR值造成影響,也不會(huì)對(duì)網(wǎng)站的畸形抓取、排名等造成影響。

 

  這當(dāng)然給一些網(wǎng)站的收錄發(fā)明了機(jī)遇,是否也會(huì)對(duì)某些公司網(wǎng)站帶來一定的保險(xiǎn)危險(xiǎn)?網(wǎng)站某部門不想被收錄的話,趕快用robots.txt文件禁止吧。


 


  Google固然已經(jīng)是抓取頁面最多的搜索引擎,但仍是不滿意,由于有良多網(wǎng)頁跟信息是很難被發(fā)現(xiàn)和抓取的。這也就是為什么做網(wǎng)站時(shí)必定要留神搜索引擎友愛。


 

 


  同時(shí)Google也強(qiáng)調(diào),假如網(wǎng)站的robots.txt文件里制止了對(duì)表格進(jìn)行了暗藏,不盼望表格提交后所發(fā)生的鏈接被抓取,那Googlebot 是不會(huì)抓取的。此外,當(dāng)前Googlebot只提交GET類型的表格。比方當(dāng)表格須要輸入用戶個(gè)人信息好比密碼、用戶名、接洽人等,Googlebot是 會(huì)主動(dòng)略過這些表格的。

 

  當(dāng)初Google開端供給提交表單(form)發(fā)現(xiàn)其后的網(wǎng)頁。本想寫個(gè)具體闡明,恰好看到破滅已經(jīng)寫了,就直接援用重要內(nèi)容如下。


 


  時(shí)),它就會(huì)自動(dòng)從網(wǎng)站上抉擇一些詞語輸入表格的文本框里,而后再取舍不同的按鈕、勾選項(xiàng)及驗(yàn)證項(xiàng),再提交表格。提交表格后一旦 Googlebot以為呈現(xiàn)的新內(nèi)容是正當(dāng)并且是有趣及奇特的,它就可能會(huì)把內(nèi)容抓取進(jìn)Google的搜尋成果索引數(shù)據(jù)庫(kù)里。這象征著Googlebot 現(xiàn)在已經(jīng)理解通過提交表格而取得新內(nèi)容。

回到頂部