合肥網(wǎng)站優(yōu)化公司淺談:網(wǎng)站為什么不被收錄?
發(fā)布日期:2019-12-19 訪問次數(shù):
網(wǎng)站優(yōu)化過程中收錄一直是一個不管是菜鳥還是老鳥都非常揪心的問題,收錄盡管與網(wǎng)站排名沒有直接關(guān)系,但是排名與收錄的的關(guān)系總所周知,隨著百度算法的不斷更新,百度對于收錄的準則也越來越高,如何做好收錄成了不管是站長還是企業(yè)都非常關(guān)心的一個問題,接下來企航互聯(lián)小編就來談談網(wǎng)站為什么不收錄的問題。
一、是否知道這個頁面的存在
對頁面進行收錄當然首先就必須要知道有這個頁面,蜘蛛都不知道這個頁面,談何收錄?這一點主要分為2大類:搜索引擎找不到網(wǎng)頁入口和不讓搜索引擎抓取。
1、搜索引擎找不到網(wǎng)頁入口
很多時候不是你更新了文章搜索引擎就要來抓取收錄的,要怎么讓蜘蛛知道你的更新呢?除了有規(guī)律的更新,可以向百度站長平臺主動提交URL或者是提交站點地圖,也可以讓搜索引擎被動收集,這就是通過外鏈讓蜘蛛知道你的網(wǎng)頁,還有很多時候蜘蛛來到了你的網(wǎng)站,卻找不到你更新的鏈接,因為網(wǎng)站的鏈接結(jié)構(gòu)做得太復雜或是內(nèi)鏈結(jié)構(gòu)差,以致搜索引擎在抓取時間類不會爬到網(wǎng)站深處的頁面,這也造成蜘蛛不知道該頁面的存在。所以不管怎么樣,第一步我們要保證頁面能被蜘蛛看到,關(guān)于這一點可以通過查看網(wǎng)站日志來判斷蜘蛛是否來訪過。
2、不讓搜索引擎抓取
很多網(wǎng)站有意無意的直接在robots文件屏蔽了百度或網(wǎng)站部分頁面,卻整天在找原因為什么蜘蛛不來抓取我的頁面,這能怪百度嗎?你都不讓別人進門了,百度是怎么收錄你的網(wǎng)頁?所以有必要時常去檢查一下網(wǎng)站robots文件是否正常。
二、是否可以正常的抓取
好了,蜘蛛發(fā)現(xiàn)了這個頁面,也有權(quán)利抓取這個頁面了,那能否正常抓取就是一個很大的問題,我們都知道蜘蛛抓取這個頁面要從域名到DNS服務器再到網(wǎng)站空間,所以其中任何一個環(huán)節(jié)出現(xiàn)問題,蜘蛛都不能正常的抓取,首先域名需要備案,然后域名解析要正常,如果解析出現(xiàn)問題,域名是不能訪問網(wǎng)站ip地址的,這個時候網(wǎng)站打不開,蜘蛛抓取不了頁面。
在有就是經(jīng)常提到的空間服務器了,服務器長期打不開那肯定是抓取不了的,這個大家都知道。并且如果服務器比較卡或者不穩(wěn)定,就會影響蜘蛛的抓取,蜘蛛不能很好的去抓取頁面或由于加載慢只抓取到網(wǎng)頁一半,這就很大程度上影響了網(wǎng)站的收錄。具體可以看《草根站長做SEO,如何選擇域名和空間》
三、是否達到收錄標準
很多人覺得蜘蛛抓取就代表著收錄,其實這是錯誤的,蜘蛛訪問網(wǎng)站抓取頁面并不代表就要收錄你的網(wǎng)頁,頁面被抓取后要進行對比篩選,符合要求的才會被收錄,為什么有的頁面會被收錄后又被吐出來?就是因為蜘蛛在不停的過濾,這個我們先不談。既然是符合要求才會收錄,那收錄標準到底是什么呢?
1、行業(yè)不同標準也不同
這個是顯而易見的,新聞類網(wǎng)站肯定比一般企業(yè)站容易收錄,而對于醫(yī)療、博彩、成人用品等網(wǎng)站,標準肯定是更加嚴格,所以對于不同的行業(yè),百度給予的收錄標準也是不一樣的。
2、不同的網(wǎng)站標準不同
百度有一個優(yōu)先抓取的原則,對于絕大多數(shù)用戶喜歡,權(quán)重高的網(wǎng)站收錄得要快,就像新浪網(wǎng)、騰訊網(wǎng)收錄得肯定要比一般網(wǎng)站要快,為什么?因為信任,這類網(wǎng)站本身就有其嚴格的過濾系統(tǒng),在此類網(wǎng)站公布的內(nèi)容百度基本是直接抓了就收,搜索引擎是互聯(lián)網(wǎng)與用戶的橋梁,它的目的就是給用戶提供有價值的內(nèi)容,你能為它提供良好的內(nèi)容,它當然也會對你更好,這是互利的。所以搜索引擎不是做慈善,你的網(wǎng)站能給它什么?
3、主體收錄標準
百度有一個收錄標準值,對頁面進行評分,滿足評分收錄,否則扔掉。這個在百度網(wǎng)站綜合得分算法一文中已經(jīng)說過了,主要是從頁面基礎(chǔ)、站內(nèi)、站外、用戶四個方面進行評分,感興趣的可以看一看,這里就簡單談一談網(wǎng)站頁面的內(nèi)容:
(1)頁面字數(shù)建議是在500-800字,內(nèi)容健康良好,信息豐富;
(2)受眾多:文章要有一定得用戶需求,也即用戶檢索需求的大??;
(3)時效性:寫最新的東西用戶和搜索引擎都喜歡
(4)稀缺性:稀缺主要是描述頁面在互聯(lián)網(wǎng)中的獨特性。稀缺不等于無重復,只有對于大量完全無增益的重復頁面,我們才應該認為其稀缺度較低。
四、是否有干凈的域名
剛說了百度的收錄標準,其實這一點也屬于一個特別的標準,域名不干凈同樣是影響網(wǎng)站收錄的一個重要原因,這個不干凈我們分為2種情況。第一種就是域名在購買之前就有人用過了,不僅使用了而且還是用廢了,這樣的域名背景就是不干凈,這就相當于以前如果你去考警察,如果家里是黑幫世家,那肯定是會影響你的,這和百度的收錄是一個道理,嚴重的甚至域名直接作廢。
另一種情況是我們經(jīng)常說的降權(quán),網(wǎng)站被降權(quán)這段時間是百度的一個審核期,網(wǎng)站的內(nèi)容就算滿足了上面所說的3點也可能收錄慢或者是不收錄,這個就需要我們堅持了。有恒心,能再次獲得百度的信賴就會收錄正常。
五、是否達到收錄最大限度
等級不同的網(wǎng)站總收錄的最大限度不同,日收錄限制也不同。在新浪上更新1萬篇文章可能會收錄90%,但是如果在你的企業(yè)站更新1w篇文章可能是只會收錄幾十篇。這就是因為新浪的等級比你的高。等級不等于權(quán)重,權(quán)重只是等級的一個部分,等級是網(wǎng)站的重要程度,就像我們一個網(wǎng)站中不同頁面的重要程度不一樣,而在整個互聯(lián)網(wǎng)不同網(wǎng)站的重要程度也不一樣。所以中小型網(wǎng)站不要為了有大量的收錄不斷的去大量更新文章,這樣的做法是錯誤的。不同的行業(yè)的更新的頻率和數(shù)量是不一樣,娛樂新聞行業(yè)可能需要幾分鐘更新一次,但是小型企業(yè)站可以幾天或者幾周更新一次都沒有關(guān)系。
同時不同網(wǎng)站總收錄最大限度也不一樣,一個中小型新站目前的權(quán)重是1或者沒有權(quán)重,那么它的收錄限制維持在幾十、幾百到一千的數(shù)量。如果你發(fā)現(xiàn)不管你怎么更新做原創(chuàng)高質(zhì)量的內(nèi)容收錄也上不去,可能就是因為網(wǎng)站權(quán)重處于一個階段達到了收錄限制,所以收錄不可能上去。就好比家里的貓長得再大食量也沒有豬多,所以豬分配的食物就自然要比貓多了,如果網(wǎng)站要突破這個收錄的限制就要在權(quán)重上上升一個等級。
好了,就寫到這了,我們不建議刻意的去提升收錄,因為收錄不等于排名,收錄也不會直接影響到網(wǎng)站排名,網(wǎng)站根據(jù)行業(yè)需求和用戶需求有規(guī)律的更新就可以了,用戶在進入你的網(wǎng)站之后不需要再進入其它網(wǎng)站補腦了,這說明你的網(wǎng)站內(nèi)容滿足了用戶所有的需求。
掃描添加好友
免費提供:網(wǎng)站建設(shè)、網(wǎng)絡(luò)推廣解決方案
已幫助
人
人
您的鼓勵是站長的最大動力
轉(zhuǎn)載請注明來自:http://dgctj.com/news/1538.html