當前位置:首頁 --> 對于搜索引擎優化,很多seoer都沒問題 |
|
對于搜索引擎優化,很多seoer都沒問題,但是把網站能優化到百度首頁的卻不多。經過最近一段時間的觀察發現很多網站排名都處于中低端,排名不是太理想。
那么百度搜索引擎的整個工作原理是怎樣的呢?杭州SEO陳寶文來告訴大家。
搜索引擎工作原理可分為四個部分:抓取、過濾、收錄、和排序,對此我是這樣認為的。
一、抓。
搜索引擎抓取程序蜘蛛可分為:百度蜘蛛(Baidu spider)、谷歌蜘蛛(Google spider)、360蜘蛛(360 spider)、雅虎蜘蛛(YAHOO spider)、搜狗蜘蛛(Sogou spider)等。
既然知道了各大搜索引擎的蜘蛛名稱,那么怎樣讓蜘蛛來抓取我們的網站內容呢?可分為以下三點:
1、外部鏈接:外部鏈接分為發布外鏈的鏈接和友情鏈接兩種,外鏈也是網站外部優化的唯一方式,高權重的外鏈站可以給網站起到催化提升排名得作用,友情鏈接注意高質量的,也可以給網站帶來意想不到的排名;
2、提交鏈接:提交鏈接主要是新站剛上線未收錄的時候用,可以通過百度站長平臺提交網站首頁鏈接;
3、讓蜘蛛自己來:對于前兩點可以起到一定的排名作用,但是單憑前兩點也是不夠得,那么怎樣讓蜘蛛自己來抓取我們的網站內容呢?毋庸置疑,網站的內容是否是高質量的、網站內部布局是否合理、是否有網站地圖、服務器是否穩定等等都占有一定的因素。
當我們每天都在更新網站內容、發布外鏈的時候,那么怎樣才能知道蜘蛛有沒有來我們的網站抓取內容?
其一、可以通過百度平臺的抓取頻率(見上圖),只要每天有壓力反饋,那么就代表蜘蛛有來過我們的網站,并且抓取了一部分內容,回收到百度數據庫;
其二,通過服務期日志,一般命名位log的文件就是網站服務器日志。通過服務期日志可以看出,哪些搜索引擎來過我們的網站,訪客的IP,還有一點就是我們的網站被攻擊掛馬了,也可以通過log文件看出攻擊我們網站人的IP以及篡改了哪些頁面。
很多網站收錄少或是排名上不來原因也在于蜘蛛的抓取因素,主要分為路徑過長或是中文路徑。
路徑過長就是一個網頁的URL太過于長,超過64字節,那么后邊的鏈接蜘蛛就無法抓取。如果是靜態鏈接可能是網頁的層次太深,這樣搜索引擎會認為該頁面不重要,從而可能影響網站收錄;如果是動態鏈接,層次過深也不利于優化;
另一種影響蜘蛛抓取的因素是中文路徑,如果URL是中文路徑,那么主機空間里的文件名稱也是中文命名,由于很多空間不支持中文命名的文件,這樣可能會導致網頁加載緩慢、或是加載的URL亂碼,從而導致搜索引擎識別不了。
二、過濾:
搜索引擎為什么要過濾抓取的內容?
由于現在互聯網快速的發展,同時網站數量的與日俱增,那么也就會出現大量的高重復內容、低質量文章,有的內容中還存在著大量的死鏈接,這一步搜索引擎就是將這些低質量的網頁過濾掉,為用戶提供有價值的內容。
既然搜索引擎要過濾網站內容,那么影響過濾的因素有哪些呢?
1、識別:搜索引擎抓取來的網頁內容,有很多識別不了的,比如代碼、圖片、鏈接等等,所以我們就要對這一系列做出相應的解決措施,代碼做到規范化、圖片添加Alt屬性、鏈接盡量使用靜態(偽靜態),不要出現中文路徑的URL;
2、頁面質量:很多站長都喜歡抄襲別人的內容,從而充實自己的網站,對于這一點搜索引擎剛開始是抓去收錄了,但是隔一段時間就會把這些低質量的內容刪除掉,所以也就造成網站排名不穩定、甚至下降。
三、收錄:
搜索引擎抓取了我們的網站內容,那么到底收錄了多少網站內容呢?
查詢網站收錄情況可以使用站長工具,但是站長工具只能作為參考,具體的可以使用site:指令,查看相關域,這個關乎到網站的首選域;另一種方法就是通過百度站長平臺工具查詢網站收錄情況。
很多網站收錄少但又有很多網站收錄較多這是什么原因?
對于新站,剛開始收錄少是很正常的,畢竟新站在百度眼里沒有建立起信任、也沒有權威,只要定時更新高質量的內容,和高質量的外部鏈接即可;
對于老站,收錄很少的網站有很多,一般一個網頁超過一個半月沒有收錄,那么就要看一下網頁內容質量是否偏低、文字是否太少等原因。
百度蜘蛛將每個網站內容收進數據庫,進行相應的關鍵詞權重計算,這樣已達成排名的效果。
四、排序:
網站的排名是建立在搜索引擎的基礎優化上,百度將計算好的關鍵詞權重排在百度頁,就是大家經常關心的排名上升下降。 想要做好關鍵詞的排名就要做好以下幾點:
網站搭建布局、模板代碼優化、URL鏈接靜態、鏈接縮短、圖文并茂、內容短句子、圖片Alt屬性、高權重的外部鏈接、高質量的友情鏈接,只要做好這些。然后就是循序漸進的更新網站內容、網站外鏈,排名就會慢慢的上來。
總結:
對于做搜索引擎優化,在我自己看來主要就是堅持力、執行力、以及腦子要轉到快,這樣才不會在互聯網的大潮中拍死。
|
|
|
|