網(wǎng)站抓取量是影響網(wǎng)站收錄的重要因素,因此把控好網(wǎng)站的抓取量很重要,那么怎么來(lái)提升網(wǎng)站的抓取量呢?
網(wǎng)站抓取量=網(wǎng)站的總抓取時(shí)間/網(wǎng)站單個(gè)頁(yè)面的抓取時(shí)間
那么自然我們可以從二個(gè)維度來(lái)提升網(wǎng)站的抓取量:
一、降低網(wǎng)站單個(gè)頁(yè)面的抓取時(shí)間
對(duì)于網(wǎng)站單個(gè)頁(yè)面的抓取時(shí)間,主要是提高網(wǎng)站的性能,主要包括服務(wù)器空間以及網(wǎng)站代碼,JS、圖片壓縮、視頻等優(yōu)化,促使網(wǎng)站會(huì)有很快的打開(kāi)速度,使得搜索引擎程序抓取下載單頁(yè)面時(shí)間變短,從而訪問(wèn)更多的頁(yè)面,增加抓取量。
二、增加網(wǎng)站的總抓取時(shí)間
網(wǎng)站的總抓取時(shí)間又可以細(xì)分,可以分為搜索程序的主動(dòng)抓取以及被動(dòng)抓取
對(duì)于主動(dòng)抓取,就是蜘蛛沿著站內(nèi)的某個(gè)鏈接不斷爬去,那么怎么來(lái)控制主動(dòng)抓取時(shí)間呢?
首先許多鏈接要可抓取,不要讓蜘蛛程序無(wú)法識(shí)別或者無(wú)權(quán)限,比如JS跳轉(zhuǎn)什么的,注冊(cè)才能訪問(wèn)之類,然后就是網(wǎng)站的物理層級(jí)以及邏輯層級(jí)要簡(jiǎn)短,物理層級(jí)我們可以把一些重要的頁(yè)面放在首頁(yè),縮短物理距離;邏輯層級(jí)方面網(wǎng)站的層級(jí)關(guān)系要簡(jiǎn)潔,比如常見(jiàn)的樹(shù)狀結(jié)構(gòu),首頁(yè)-欄目頁(yè)-內(nèi)容頁(yè);{zh1}就是內(nèi)鏈的設(shè)置,把網(wǎng)站相關(guān)的內(nèi)容盡量的串聯(lián)成網(wǎng)狀,使得蜘蛛程序可以方便爬取。
至于被動(dòng)抓取嘛,更多是從站外鏈接的角度去理解的。
我們可以在站外建立外部鏈接來(lái)吸引蜘蛛來(lái)到我們網(wǎng)站,增加網(wǎng)站的抓取頻次以及抓取時(shí)間,不過(guò)對(duì)于外鏈不要隨便的去做,盡量去分享價(jià)值,就像百度的工程師LEE說(shuō)的,有推薦價(jià)值的外鏈才是有用的,要不然只是起到吸引蜘蛛作用,我們外鏈的效用就大打折扣了,說(shuō)的有點(diǎn)跑題了,當(dāng)然對(duì)于有些人來(lái)說(shuō)聊勝于無(wú)嘛。
還有一點(diǎn)要引起大家的注意,就是要允許蜘蛛程序的爬取,這里就涉及到了robots文件的設(shè)置,其次不少網(wǎng)站會(huì)有反采集系統(tǒng),有的服務(wù)器的防火墻,還有日志的HTTP狀態(tài)碼,這些都會(huì)影響到蜘蛛對(duì)于網(wǎng)頁(yè)的抓取,從而影響收錄以及流量。
從上面的算式大家其實(shí)也基本可以看出大概的方式了,網(wǎng)站抓取量怎么提升?無(wú)非是減小分母增大分子,無(wú)痕在這里只是簡(jiǎn)單的陳述下自己的一些見(jiàn)解吧,更多的知識(shí)大家可以去看看廣州SEO相關(guān)的分享,謝謝。