国产成人freesex在线_亚洲精品中文字幕在线视频 _久久久久视频综合_十八禁高潮呻吟视频 _999久久久精品免费观看国产_国产男女超爽视频在线观看_成人三级做爰电影_久久久久国产精品人妻一区二区

<strong id="17c32"><button id="17c32"></button></strong>
  • <ins id="17c32"></ins>
      1. <strong id="17c32"></strong>

        爬行、抓取、索引、收錄到底是什么意思有什么區(qū)別

        日期:2023-02-10 23:34:44     閱讀:248     文章來(lái)源:本站     標(biāo)簽: 搜索引擎優(yōu)化 網(wǎng)站優(yōu)化 百度SEO

          很多SEO人員并沒(méi)有真正理解爬行、抓取、索引、收錄這些概念到底指的是什么、區(qū)別在哪,以及noindex、nofollow、robots文件的實(shí)質(zhì)功能又是什么。對(duì)這些概念沒(méi)有精準(zhǔn)理解,處理大型網(wǎng)站結(jié)構(gòu),決定什么頁(yè)面需要被抓取,什么頁(yè)面需要被索引,哪些頁(yè)面需要禁止抓取、素引等情況時(shí),就很難明白SEO該怎么做。所以,這里先來(lái)弄清楚這些概念的意義。

          網(wǎng)站收錄和索引介紹

          1.爬行

          爬行指的是搜索引擎蜘蛛從己知頁(yè)面上解析出鏈接指向的URL,也就是沿著鏈接發(fā)現(xiàn)新頁(yè)面(鏈按指向的URL)的過(guò)程。當(dāng)然,蜘蛛并不是發(fā)現(xiàn)新URI就馬上爬過(guò)去抓取新頁(yè)面,而是把發(fā)現(xiàn)的URL存放到待抓地址庫(kù)中,按照一定順序從地址庫(kù)中提取要抓取的URL。

          2.抓取

          抓取是指搜索引擎蜘蛛從待抓地址庫(kù)中提取要抓的URL,訪問(wèn)這個(gè)URL,把讀取的HTML代碼存入數(shù)據(jù)庫(kù)的過(guò)程。蜘蛛抓取就是像瀏覽器一樣打開(kāi)這個(gè)頁(yè)面,過(guò)程和用戶瀏覽器訪問(wèn)一樣,也會(huì)在服務(wù)器原始日志中留下記錄。

          3.索引

          索引的英文是index,指的是將一個(gè)URL的信息進(jìn)行整理,并存入數(shù)據(jù)庫(kù),也就是素引庫(kù)。用戶搜索時(shí),搜索引擎從素引庫(kù)中提取URL信息并排序展現(xiàn)出來(lái)。索引庫(kù)是用于搜索的,被索引的URL是可以被用戶搜索到的,沒(méi)有被索引的URI,用戶在搜索結(jié)果中是看不到的。

          要注意的是,所謂“一個(gè)URL的信息”,并不限于蜘蛛從URL上抓取來(lái)的內(nèi)容,還有來(lái)自其他來(lái)源的信息,如外部鏈接、鏈接的描文字等。有的時(shí)候,索引庫(kù)中關(guān)于這個(gè)URL的信息,根本沒(méi)有從這個(gè)URL抓取來(lái)的內(nèi)容,但搜索引擎知道這個(gè)URL的存在,并且存在一些其他信息。

          4.收錄

          我個(gè)人覺(jué)得收錄和索引沒(méi)有區(qū)別,在這里是混用的。只不過(guò)收錄是從站長(zhǎng)角度看的,搜索時(shí)能找到這個(gè)URI,就是這個(gè)URL被收錄了。從搜索引擎角度看,URL被收錄了,也就是這個(gè)URL的信息在索引庫(kù)中存在了。英文中并沒(méi)有收錄這個(gè)詞,它和索引使用的是同一個(gè)詞index。

          有的時(shí)候,站長(zhǎng)并不希望某些頁(yè)面被收錄(或者說(shuō)被素引),如復(fù)制內(nèi)容頁(yè)面。網(wǎng)站上不出現(xiàn)鏈接,或者使用JavaSoript鏈按,使用nofollow等方法都不能保證頁(yè)面一定不被收錄。站長(zhǎng)自己雖然沒(méi)有鏈按到不想被收錄的頁(yè)面,其他網(wǎng)站可能由于某種原因鏈接到這個(gè)頁(yè)面,導(dǎo)致頁(yè)面被抓取和收錄。

          有的時(shí)候,站長(zhǎng)也不希望某些頁(yè)面被抓取,如付費(fèi)內(nèi)容、還在測(cè)試階段的網(wǎng)站等。還有一種很常見(jiàn)的情況,搜索引擎抓取了大量漢有意義的頁(yè)面,如電子商務(wù)網(wǎng)站按各種條件過(guò)調(diào)、飾選的頁(yè)面,各種排序、排版格式的頁(yè)面,這些貝面數(shù)量龐大,抓取過(guò)去會(huì)消耗掉搜索引擎分配給這不網(wǎng)站的抓取份額,造成真正有意義的頁(yè)面反倒不能被抓取和收錄的情況。如果通過(guò)檢在日志文什發(fā)現(xiàn)這些無(wú)意義頁(yè)面被反復(fù)大量抓取,想要收錄的頁(yè)面根本沒(méi)有抓取,那就應(yīng)該直接禁止抓取無(wú)意義的頁(yè)面。

          要確保頁(yè)面不被抓取,需要使用robots文件,要確保頁(yè)面不被收錄,需要使用noindex meta robots標(biāo)簽。


        北京愛(ài)品特SEO網(wǎng)站優(yōu)化提供專業(yè)的網(wǎng)站SEO診斷服務(wù)、SEO顧問(wèn)服務(wù)、SEO外包服務(wù),咨詢電話或微信:13811777897 袁先生 可免費(fèi)獲取SEO網(wǎng)站診斷報(bào)告。

        北京網(wǎng)站優(yōu)化公司 >> SEO資訊 >> SEO技術(shù)技巧 >> 爬行、抓取、索引、收錄到底是什么意思有什么區(qū)別    本站部分內(nèi)容來(lái)源于互聯(lián)網(wǎng),如有版權(quán)糾紛或者違規(guī)問(wèn)題,請(qǐng)聯(lián)系我們刪除,謝謝!

        上一篇:網(wǎng)站URL設(shè)計(jì)子域名和目錄如何選擇

        下一篇:seo快速排名軟件有哪些,8款SEO常用軟件推薦

        返回列表
        SEO案例
        OUR ADVANTAGE WORKS

        售后響應(yīng)及時(shí)

        全國(guó)7×24小時(shí)客服熱線

        數(shù)據(jù)備份

        更安全、更高效、更穩(wěn)定

        價(jià)格公道精準(zhǔn)

        項(xiàng)目經(jīng)理精準(zhǔn)報(bào)價(jià)不弄虛作假

        合作無(wú)風(fēng)險(xiǎn)

        重合同講信譽(yù),無(wú)效全額退款
        满城县| 修水县| 芷江| 兴安县| 苏尼特左旗| 海兴县| 泊头市| 克山县| 额敏县| 红河县| 梁平县| 攀枝花市| 砀山县| 武穴市| 岚皋县| 奎屯市| 绥滨县| 桦甸市| 图们市| 田东县| 石台县| 山阳县| 射阳县| 祁阳县| 庆元县| 册亨县| 洛隆县| 织金县| 江津市| 乐平市| 安吉县| 卢龙县| 汉寿县| 胶南市| 铅山县| 萨嘎县| 崇义县| 屏南县| 双辽市| 两当县| 建德市|