網站制作中的百度快照索引是什么?跟網頁收錄有什么關系?
搜索引擎首先通過地址索引庫或者鏈接關系爬行到網站,之后將網站上的內容“下載”到搜索引擎自身的硬盤,這個過程叫做“收錄”,這個收錄與平時我們所說的網頁收錄是不一樣的,我們平時總將網頁快照數量當做網頁收錄數,而實質上那只能稱為網頁索引。
網頁快照,也即網頁索引,到底該怎么理解呢?
在搜索引擎對網頁內容收錄之后,再到呈現給用戶查詢,需要有一個審核機制,濾除一些垃圾內容,濾除一些重復內容,通過一些機制防止作弊,等等,這些過程為了保證搜索引擎呈現給用戶的網頁體驗是最優化的,所以,難免有非常多的內容被收錄,但是未建立索引。
1.新站。為了提高spam的作弊成本,從而杜絕spam及其他相關問題,對于新站,搜索引擎往往收錄了但是沒有建立索引。
2.對于高重復性的頁面,搜索引擎可能對其收錄了但是不建立索引。
3.對于被懲罰的站點,許多內容都在搜索引擎的服務器中但是沒有建立索引。
而網頁已經有快照,但是沒有收錄的原因是什么呢?
通常會有如下情況:
1.百度搜索開放平臺:眾所周知,這個平臺是查看不到快照的,搜索引擎不一定對原網頁進行了索引,即使進行了索引,百度顯示的標題和描述的內容,和收錄中的是盡不相同的。
2.自身利用robots.txt設置對搜索引擎進行了屏蔽的,但是有網站外鏈對其進行了指向,搜索引擎會對其進行索引但是并沒有收錄內容,只是一個快照形式。
關于百度快照的基本原理就介紹到這里了,了解百度快照,百度索引機制,對SEO的理解思路會更加清晰,而這也是SEO原理化的必要方法。
- 上一篇:如何做好網站的雅虎排名
- 下一篇:外貿網站建設優化如何利用圖片