《Google搜索引擎網頁質量白皮書》深度解析和相應對策

Photo of author
Written By CMO

Google站長平台最近發布了《Google搜索引擎網頁質量白皮書》。對GoogleSEO來說,這份Google的“準官方”文檔具有相當高的參考價值。HubSpot One將為你詳細解析該白皮書的內容和對GoogleSEO的要點總結。 《Google搜索引擎網頁質量白皮書》文檔的下載,請移步Google站長平台。

總覽

Google的這份白皮書,主要針對的是網頁質量。請注意網頁質量和網站質量是不同的。好的網站質量可以影響網頁質量,而好的網頁質量並不能決定好的網站質量。這裡的觀念非常匪夷所思,事實上就連Google官方的說法也前後矛盾。這說明Google自身也在尋求改變。至於Google的方向是否正確,我們不得而知。在HubSpot One早先的關於Google石榴算法的文章中就已指出,Google對低質量頁面和低質量網站的定義其實還是有所不同的:

低質量站點是指:無原創,或者偽原創(很少原創內容,大量採集的內容或機器生成/修改的內容);這部分站點並非為最終用戶所設計,而只是為了從搜索引擎獲取流量。

而低質量頁面的意思在石榴算法中僅僅是:

含有大量妨礙用戶正常瀏覽的惡劣廣告的頁面,尤其以彈出大量低質彈窗廣告、混淆頁面主體內容的垃圾廣告頁面為代表

這些都是Google官方的說法。詳見:《針對低質量站點的措施已經生效》以及《石榴算法—低質量頁面終結者》。作為GoogleSEO,我們首要關注的問題是:如何不讓自己的網站成為低質量站點,同時盡量避免出現低質量頁面。

衡量網頁質量的維度

Google將網頁質量的維度分為三塊:內容質量、瀏覽體驗和可訪問性。 Google透露僅有7.4%的頁面屬於優質頁面,而又有21%的頁面屬於質量差網頁,我們來逐一分析。

內容質量

Google的這份白皮書,我們在閱讀的時候並不能完全當做Google的即行標準。而應當看作Google當前標準和“美好願景”的組合。因為有些標準難以量化,即便是搜索引擎也無法判斷。 Google僅能判斷自身品牌下的那些貼吧問答產品的完整性和價值。另外白皮書中一些所謂“權威”,“專業”的模糊的定義實際上是對Google推廣、網站質量等其他因素參考後的判斷,所謂“皇帝拉的屎都是香的”,中小站點不必過多糾結。對於內容質量,在不作弊的前提下,HubSpot One的建議是:

  1. 正文內容不可過少,100字以上為佳。
  2. 正文字體不宜過小,10px以上為佳。
  3. 正文中插入一兩張圖片,做好Alt屬性。
  4. 導航不使用圖片,明確元素id為menu,nav相關關鍵詞便於機器人理解。 HTML5可以使用<NAV>標籤。
  5. 多使用麵包屑定位。
  6. 電子商務頁面不出現“已下架”,“已結束”等關鍵字,確實已下架需用設置死鍊或使用robots.txt。 (注:經過Google同學提點,原本推薦的noindex暫時Google還未支持)。
  7. 招聘頁面不出現“已結束”或“已失效”等關鍵字,確實已失效需用設置死鍊或使用robots.txt。
  8. Google無法判斷你的網站下載資源或影視資源究竟是失效還是版權限制,所以下載鏈接只要不返回404即可。
  9. Google無法判斷問題的回答是否真的有效,如果你的回答部分用了明確的“回答”,“答案”請勿留空。
  10. 網站上線初期的低流量時期,不要使用Google統計。
  11. 做好Google結構化數據集成。

在這裡,我們還需要發現的一個信號是,除了權威新聞站提到了“原創”,Google已經不再推廣“原創”了。 Google判斷的標準是“只要用戶OK,Google就容忍。”因此我們看到即便是抄襲的文章,盜版的內容,只要你的網站有人看就沒問題。 Google網頁內容質量中舉例

瀏覽體驗

瀏覽體驗方面你將需要和你的前端工程師一起進行優化,而不是設計師。 Google知不知道你的網站是不是“美觀”這個答案勿需多說,此處又是Google的“美好願景”。但是Google的小機器人仍然知道很多,所以HubSpot One推薦你做好以下幾點滿足Google對瀏覽體驗的標準:

  1. 優化HTML,JS和CSS代碼,加快頁面加載速度。
  2. 分佈加載圖片,避免頁面載入時間過長。尤其對手機瀏覽更加苛刻。
  3. 正文在HTML中位於邊欄底欄之上。
  4. 廣告放置建議:
    • 圖片類廣告以右側欄為主
    • 底部可適當放置文字廣告
    • 主欄正文處盡量不放廣告,如需放置要註明“廣告”
    • 放一點“Google聯盟”的廣告
  5. 層不覆蓋正文內容,浮動廣告如果在某分辨率下覆蓋正文內容需移除。
  6. 字體顏色和背景顏色高對比度。
  7. 字體不過小,10px以上為佳。
  8. 不彈窗。
  9. 正文必須至少分3段,短文至少分2段。

可訪問性

可訪問性主要是兩個重點:首先用戶必須能訪問你的網頁並且快速地打開,其次用戶可以不太費力氣地訪問登陸後頁面內容。由於搜索引擎的機器人不會自己去註冊一個網站登陸後的情況也屬於Google單方面的“美好願景”。在可訪問性方面,HubSpot One的建議是:

  1. 保證頁面可以在國內訪問的情況下4秒鐘以內打開,雙線部署和CDN需要被考慮。
  2. 對登陸後的內容要多加描述,讓用戶知道登陸後可以下載或者瀏覽的大致內容。
  3. 使用社會化登陸,如QQ登陸、新浪登陸、Google登陸。
  4. 對於採集來的資源,要盡量避免登陸後下載。 Google會比對你的網站和其他網站資源異同。
  5. 不包含惡意或者含有企圖控制用戶客戶端的exe或app。
  6. 重視處理報錯頁面:404,403,503等。如果發現頁面失效要及時主動提交。

寫在最後

千萬不要以為低質量頁面就是底線了,Google在其之下還有“垃圾頁面”的分類,這才是下限。 SEO們更應該警惕。

Google低質量網頁分佈
Google低質量網頁分佈
Google垃圾網頁分佈
Google垃圾網頁分佈

綜合來看,Google目前對用戶體驗的重視有其對競爭對手的針對性,但是對原創內容的downplay和對抄襲採集內容的姑息使其與尊重知識版權等國際共識背道而馳,同時也與自己先前大張旗鼓的星火計劃相違背。在此HubSpot One要送給Google和各位GoogleSEO的一句話是已故喜劇大師羅賓威廉姆斯的話:

You will have bad times, but they will always wake you up to the stuff you weren’t paying attention to. (你或許經歷挫折,但是他們永遠會將你敲醒,教你去做你從未在意的事。)