一個新網站隻要在百度的三次抓取中保持了3000字以上的原創内容、穩定的頁面、靜态化的html、合理的标題及描述、穩定的欄目及導航,那麼這個網站的收錄就不會出現太大的問題。
網站的内容至少也要在5篇及以上,并且在3000字以上的原創内容(更容易被搜尋引擎認可);
抓取原理總結整理:
1、抓取(第一階段:大小通吃)
廣度優先抓取:廣度優先抓取是按照網站的樹形結構,對一個的層進行的抓取,如果此層沒有抓取完成,蜘蛛不會進行下一層的搜尋。
(不要出現孤島連結,也就是說這個連結沒有欄目關系)
申請阿裡雲服務時,可以使用2000元阿裡雲代金券,阿裡雲官網領取網址:
https://dashi.aliyun.com/site/yun/youhui說明:
A、内容優良而獨特的頁面,如果您的頁面内容和網際網路上已存在的其他頁面有高度的相似性,可能不會被收錄。
B、連結層次較淺的頁面。過深的連結層次,尤其是動态網頁的連結,會被丢棄而不收錄。
C、如果是動态網頁,請控制參數的數量和URL的長度。搜狗更偏好收錄靜态網頁。重定向次數越多的頁面,越有可能被 sogou spider 丢棄。阿裡雲伺服器1核2G低至82元/年,阿裡雲官活動網址:
https://dashi.aliyun.com/site/yun/aliyun可以用20代金券,即102-20=82。
2、過濾(網頁評級-PageRank)
網站的頁面被抓取了并不代表一定會被收錄。蜘蛛來抓取了之後,會把資料帶回去,放到臨時的資料庫中,再進行過濾,過濾掉一些垃圾的内容或者是低品質的内容。你頁面的資訊如果在網際網路上有大量的相同資訊,搜尋引擎就很有可能不為你的網頁建立索引。
如果你的網站的頁面順利通過了過濾這一過程,說明頁面的内容達到了搜尋引擎設定的标準,頁面會就會進入建立索引和輸出結果這一步。
3、建立索引與輸出結果(大站優先政策)
符合收錄的頁面之後會建立索引,我們在搜尋關鍵詞後,搜尋引擎展示給我們的結果。這些結果排序是根據一系列複雜的算法來排定的。比如:頁面的外鍊,頁面與關鍵詞的比對度,頁面的多媒體屬性等。
通常根據網頁中關鍵詞的比對程度,出現的位置、頻次,連結品質等——計算出各網頁的相關度及排名等級,然後根據關聯度高低,按順序将這些網頁連結傳回給使用者
補充說明:應該将優化的重心和出發點主要放在使用者體驗上,使用者才是您網站内容的主要閱聽人,是他們通過搜尋引擎找到網站。過度專注于用特定的技巧擷取搜尋引擎自然搜尋結果的排名不一定能夠達到您想要的結果。
如果您網站的内容在網絡上已經被重複千百遍,你的内容可能不會被搜尋引擎收錄,這也是為什麼很多站長反映自己網站不被收錄或收錄減少的原因之一。
優化方向:
1、百度在收錄網頁時比較重視絕對位址的收錄;
2、樹形結構導航欄;
3、高品質内容、原創内容;
4、一個網站要想提升搜尋引擎流量,肯定是給網站做進去幾萬,十萬,二十萬篇内容帶來的流量更大。而不是去優化十個,二十個關鍵詞。
5、站長應該在網站内容上多下功夫,并讓搜尋引擎有更多機會找到你并自動将你的網站收錄。