我們專注于SEO網(wǎng)站搜索引擎優(yōu)化
robots是搜索引擎爬蟲(chóng)協(xié)議,也就是你網(wǎng)站和爬蟲(chóng)的協(xié)議。
簡(jiǎn)單的理解:robots是告訴搜索引擎,你可以爬取收錄我的什么頁(yè)面,你不可以爬取和收錄我的那些頁(yè)面。robots很好的控制網(wǎng)站那些頁(yè)面可以被爬取,那些頁(yè)面不可以被爬取。
主流的搜索引擎都會(huì)遵守robots協(xié)議。并且robots協(xié)議是爬蟲(chóng)爬取網(wǎng)站第一個(gè)需要爬取的文件。爬蟲(chóng)爬取robots文件后,會(huì)讀取上面的協(xié)議,并準(zhǔn)守協(xié)議爬取網(wǎng)站,收錄網(wǎng)站。
robots文件是一個(gè)純文本文件,也就是常見(jiàn)的.txt文件。在這個(gè)文件中網(wǎng)站管理者可以聲明該網(wǎng)站中不想被robots訪問(wèn)的部分,或者指定搜索引擎只收錄指定的內(nèi)容。因此,robots的優(yōu)化會(huì)直接影響到搜索引擎對(duì)網(wǎng)站的收錄情況。
robots文件如下圖
存放目錄
robots文件必須要存放在網(wǎng)站的根目錄下。也就是 域名/robots.txt 是可以訪問(wèn)文件的。你們也可以嘗試訪問(wèn)別人網(wǎng)站的robots文件。 輸入域名/robots.txt 即可訪問(wèn)。
如下圖
robots寫(xiě)作語(yǔ)法
首先我們來(lái)看一個(gè)范例(下圖)
user-agent這句代碼表示那個(gè)搜索引擎準(zhǔn)守協(xié)議。user-agent后面為搜索機(jī)器人名稱,如果是“*”號(hào),則泛指所有的搜索引擎機(jī)器人;案例中顯示“User-agent: *” 表示所有搜索引擎準(zhǔn)守,*號(hào)表示所有。
Disallow是禁止爬取的意思。Disallow后面是不允許訪問(wèn)文件目錄(你可以理解為路徑中包含改字符、都不會(huì)爬?。?。案例中顯示“Disallow: /?s*” 表示路徑中帶有“/?s”的路徑都不能爬取。 *代表匹配所有。 這里需要主機(jī)。 Disallow空格一個(gè),/必須為開(kāi)頭。
如果“Disallow: /” 因?yàn)樗新窂蕉及? ,所以這表示禁止爬取網(wǎng)站所有內(nèi)容。
如果沒(méi)有被禁止到的路徑,默認(rèn)為可以被爬取。
關(guān)于robots的注意事項(xiàng)
1、不要禁止爬蟲(chóng)爬取網(wǎng)站的所有,因?yàn)閺慕?jīng)驗(yàn)來(lái)看,如果屏蔽一次,解封后好一段時(shí)間爬蟲(chóng)都不會(huì)來(lái)你網(wǎng)站,收錄成為問(wèn)題。
2、代碼后需要【冒號(hào)+空格+斜桿】 ,比如“Disallow: /*?* ”
3、當(dāng)網(wǎng)站為靜態(tài)路徑時(shí),需要屏蔽掉所有動(dòng)態(tài)鏈接。網(wǎng)站中存在一種鏈接被收錄即可,避免一個(gè)頁(yè)面2個(gè)鏈接。代碼如下“Disallow: /*?* ”表示禁止所有帶 ?號(hào)的網(wǎng)址被爬取。通常動(dòng)態(tài)網(wǎng)址帶有“?”“=”等。
4、根據(jù)自己網(wǎng)站情況定,屏蔽不需要收錄的網(wǎng)址。
北京愛(ài)品特SEO網(wǎng)站優(yōu)化提供專業(yè)的網(wǎng)站SEO診斷服務(wù)、SEO顧問(wèn)服務(wù)、SEO外包服務(wù),咨詢電話或微信:13811777897 袁先生 可免費(fèi)獲取SEO網(wǎng)站診斷報(bào)告。
北京網(wǎng)站優(yōu)化公司 >> SEO資訊 >> SEO技術(shù)技巧 >> 關(guān)于網(wǎng)站robots協(xié)議,看這篇就夠了 本站部分內(nèi)容來(lái)源于互聯(lián)網(wǎng),如有版權(quán)糾紛或者違規(guī)問(wèn)題,請(qǐng)聯(lián)系我們刪除,謝謝!
售后響應(yīng)及時(shí)
全國(guó)7×24小時(shí)客服熱線數(shù)據(jù)備份
更安全、更高效、更穩(wěn)定價(jià)格公道精準(zhǔn)
項(xiàng)目經(jīng)理精準(zhǔn)報(bào)價(jià)不弄虛作假合作無(wú)風(fēng)險(xiǎn)
重合同講信譽(yù),無(wú)效全額退款加微信1v1咨詢
13811777897