SEO 指南第6講 - 創建你的網站地圖

閱讀時間約 12 分鐘

在上一節我介紹了網站架構,當網站架構出現了之後,搜尋引擎怎麼會知道我們的網站發生變化了呢?就像是你換了新房子,想找好友來暖房,那麼好友怎麼知道你家怎麼走呢?這節就是來告訴你,我們如何幫搜尋引擎畫網站地圖。

當我們提到網站地圖的時候,很多人想到的都是類似下面這張圖:
中華民國行政院網站的網路地圖
但事實上,這樣的圖是給訪客看的;而搜尋引擎也需要一張地圖給機器本身看,或者嚴格講是給搜尋引擎的蜘蛛看的。那麼搜尋引擎的地圖怎麼呈現呢?很簡單,用 XML 架構的地圖「展示」給搜尋引擎的蜘蛛們看。我說蜘蛛們是因為搜尋引擎不只是一隻蜘蛛,它可能有多種蜘蛛,這些蜘蛛會對查看過的頁面進行索引,而你的網站內容也不只有文字或圖片,有可能會包含影片、可以下載查看的文件…等等,對不同的內容進行索引。
那麼 XML 網站地圖長什麼樣子,如何幫助站長或管理員有效管理呢?或者這麼說:XML 網站地圖可以為站長或管理員帶來什麼樣的 SEO 好處?首先我先來說一下XML 網站地圖的優點。
  • 假使網站架構比較大,網站地圖可以更快幫助搜尋引擎了解網站架構,提升索引的效率
  • 需要新增網頁的時候,可以透過 XML 網站地圖快速告知搜尋引擎目前網站上有哪些新網頁
  • 如果是現有的網頁,但內容進行更新了,網站地圖也會通知搜尋引擎,讓搜尋引擎更新它的索引資料庫
  • 有 XML 網站地圖,也可以避免網站內出現內部連結或是孤兒級別的網頁
  • 當網站缺少重量級的外部連結,網站地圖也可以提供搜尋引擎一個很好的輔助。
此外,如果網站中,有些連結加上了 noindex 的標示(也就是不需要索引,通常這一類的網站多半都是完成註冊或購買或連結到外網的連結),這樣也可以幫助搜尋引擎快速移除那些不需要索引的連結資料。只不過這樣的操作要小心一點,因為一旦操作錯誤,原來已經索引的網頁就會從搜尋引擎中消失無蹤了。
因此,我們可以把 XML 網站地圖當成我們跟搜尋引擎溝通的一個管道。換句話說,當我們決定要把網站中比較重要的頁面讓搜尋引擎進行索引的話,把這些網頁放到搜索引擎中是一個挺好的方式。從技術上來說,把網頁連結放到 XML 網站地圖只是增加了被索引的機率,並不能保證的是當你把這些網頁放到 XML 網站地圖中,搜索引擎就一定會進行索引,這點還是要先說明一下。
那麼XML 網站地圖到底長什麼樣子呢?我在這裡分享我之前做的兩個截圖給各位參考一下:
全時網站XML網站地圖
愛播聽書 XML網站地圖
上述兩個截圖當中,第一個是大陸的全時雲運通信公司的XML網站地圖;第二個是台灣的愛播聽書XML網站地圖。第一個截圖就是把連結展示出來;第二個截圖則多了幾個標籤。在第二個截圖當中,加上紅框的標籤部分就是其中一個頁面的網站內容。那麼這個部分的內容代表的是什麼意思呢?跟各位說明如下:
loc位置標記
這個標記顯示了URL 的位置,而且等於告訴搜尋引擎這一頁是這個網站的標準規範網頁。這裡面會規範的是站點協議(例如:http 或是 https),還有你是否選擇使用 www,如果不使用 www,那麼 www 只是其中一個分支文件夾而已,而你的網站域名就不是 www.abc.com,而是 abc.com 了,www 只是其中一個子域名而已。
lastmod最後更新時間標記
Google 會使用這個標記來代表這個網頁最後更新的時間,它同時也象徵另外一層意義:就是這個網頁是歸屬我的,因為只有我會進行這個網頁的 XML 網站地圖修改。對搜尋引擎來說,也因為知道了時間,就知道這個網頁是否為更新過的網頁,是否需要重新安排蜘蛛再度查訪一次,看內容是否有什麼新的變化。
changefreq更新頻次標記
更新頻次標記一般人都會當成多久一次會更新,讓搜尋引擎知道,這樣搜尋引擎可以安排時間更新索引的內容。但事實上,Google 並不那麼在意這個,而比較在意的是時間本身。只是對 Google 是如此,對其他搜尋引擎就不一樣了。
priority優先級別標記
同樣的,對優先級別標記來說,絕大部分的站長或是網站管理員會標記哪些網頁要優先標記,但事實上搜尋引擎,特別是 Google,並不關注這個標記。
當然在上面的例子當中,並不是所有的標籤都是一定要有的,比如說〈Priority〉優先級以及〈lastmod〉最近更新等元資料標籤。有這些標籤的目的主要是確保內容是正確而且及時的。

網站地圖的種類

首先要先說的是,XML 網站地圖無論是從羅列的 URL 總數或是檔案大小都是有限制的:
  • 一個檔案當中,最多只能容納 5萬個連結
  • 在每有壓縮檔案的情況下,檔案大小必須小於 50 MB。
從第二點我們就知道 XML 檔案是可以壓縮的,壓縮的格式會類似 xxx.xml.zip,這樣可以節省你的帶寬以及伺服器的讀取壓力。但一旦解除壓縮之後,檔案的限制依然要受到上述的規則限制。其次,一個網站只能有一個網站地圖,但如果你的網站極大,5 萬個連結放不下,那麼是可以區分成多個網站地圖檔案,然後再整合成一個sitemap-index.xml 的格式。,所以如果你有多個網站地圖,你需要先將各個網站地圖展示成下方,然後再將這些不同的網站地圖檔案合併成一個。
其次,如果你完成了XML網站地圖,你需要提交這個網站地圖到搜尋引擎當中,每個搜尋引擎都有自己的網站地圖上傳頁面,以下是幾個常見的搜尋引擎的網站地圖上傳頁面:
  • Google:使用 Google Search Console
  • Bing 的網站地圖上傳頁面
  • 百度的網站地圖上傳頁面
當你完成網站地圖的上傳聲明之後,你還需要在 robots.txt (robots.txt 就是網站管理員用來跟搜尋引擎「溝通」的管道,也是放在網站根目錄當中)告訴搜尋引擎到哪裡去找這些個網站地圖。
robots.txt 當中輸入 sitemap 位置
接著讓我說明一下XML網站地圖的種類:

XML 圖片網站地圖

當你的網站有大量的圖片時,而你希望你的圖片都能通過搜尋引擎完成索引,讓圖片更容易尋找的時候,你需要使用 XML圖片網站地圖做為輔助。在當今的搜尋引擎當中,幾乎所有的搜尋引擎都提供了圖檔,因為圖檔幾乎都會跟網頁中的內容產生關聯性,所以當你查找這些圖的時候,都會連結到對應的網頁中。
Google 的圖片搜尋,在每張圖下方都可以看到圖片來源地
當然最適合展示圖片內容的方式就是利用 schema.org 當中的 imageobject 標記語言,因為它能支持比圖片網站地圖更多的屬性讓搜尋引擎查找。當然這意思就是,如果你的網站圖不多,其實並不需要用 schema.org 完成;但如果你的計畫是靠授權圖片營利,我會建議你想搞懂 schema.org 當中的 imageobject 方式完成圖片的區分。如果你並不是用自己的網站代管,而是交給其他的CDN 內容分發網路進行分發,你也不需要單獨準備一個 schema.org 相容的檔案,因為它已經被囊括進去了喲。

XML 影片網站地圖

就像 XML 圖片網站地圖一樣,XML 影片網站地圖紀錄的是你網站上的影片,無論是短影片或是長影片,它都可以像紀錄圖片一樣,把這些影片內容都紀錄到 XML 檔案中。同樣的,你也可以利用 schema.org 當中的 videoobject 紀錄你的影片。

Google 新聞網站地圖

假使你經營的是一個新聞媒體,有大量的新聞,那麼 Google 的新聞蜘蛛就是你最好的工具來源,這時候你就需要 Google 新聞網站地圖。跟之前的蜘蛛不同的是,Google 新聞蜘蛛每個網站只能容許最多 1000 個連結,會收錄兩天內發布的新聞內容,而且很特別的是這個蜘蛛(新聞網站地圖)本身並不容納圖片 URL。

HTML 網站地圖

就像我前面說的,XML 網站地圖是給搜尋引擎看的,而人們會看到的則是這個 HTML 網站地圖。也許有人會問:如果我的網站設計的很棒,我還需要有網站地圖嗎?嗯,這是一個有趣的問題。如果你的 HTML 網站地圖在速度上與正常的網頁相同速度,而且你的網站從分析報告中展現的量也很好,那麼的確不需要有這麼一個 HTML 網頁,你可以善用 XML 網站地圖。因為 XML 網站地圖管理的好,你網站上重要的網頁應該都會收錄進去,這樣就不需要有 HTML 網頁了。

動態網頁網站地圖

一般網站使用的是靜態網頁,這時候當我們對靜態網頁做了內容的更新或是刪除,可能你會遺漏掉你的 HTML 網站地圖,這樣反而會造成內容未更新或是內容失效的問題。因此我並不建議你放上一般的 HTML 網站地圖。如果可以的話,動態網頁網站地圖因為是自動隨著網站內容更新的,反而更能動態變化,展現最新的變動結果。
那麼要怎麼建立動態網站地圖呢?有三個方式:
  • 有勞公司內的程式設計師寫一個自訂的腳本,記錄網站的網頁內容。
  • 使用動態網頁網站地圖生成工具
  • 在現有的網站內容管理系統中安裝一個 plug in,完成相關的內容

行動設備網站地圖

對於行動設備網站來說,其實並不需要一個網站地圖。為什麼呢?因為行動設備網站地圖是給非智慧型手機使用的,智慧型手機其實就沒有這個需要。問題是現在應該沒什麼人會用非智慧型手機上網了...所以自然也就不需要為這個部分準備一個獨立的網站地圖了。

如何做好 XML 網站地圖優化

當你想要為 XML 網站地圖進行優化的時候,請記得一個很重要的觀點:XML 網站地圖紀錄的網頁是你希望搜尋引擎進行索引的頁面,而不是所有的頁面。所以你並沒有必要把所有的頁面都放到 XML 網站地圖當中。搜索引擎蜘蛛在掃描網頁的時候,會根據你給予的權限決定哪些網頁需要進行索引,並納入資料庫當中。
至於那些沒有被納入 XML 網站地圖的網頁,你也不需要擔心,因為只要內容、位置正確,它們還是有機會被納入索引範圍中的。只是對搜尋引擎來說,那些被納入 XML 網站地圖的網頁重要性要比沒有被納入 XML 網站地圖的網頁要重要的多。因此對搜尋引擎來說,你提供了 XML 網站地圖其意義在於:「我提供了這些頁面的 URL 在這個網站地圖中,請你優先考慮對這些網頁進行索引,感謝。」也因此,搜尋引擎就不需要單獨查找網站中哪些網頁是重要的,哪些不重要,節省搜尋引擎的工作負荷。
那麼哪些網頁不建議放到 XML 網站地圖當中呢?我想應該包括以下這些:
  • 重複的頁面
  • 未規範的頁面
  • 用於代理的頁面
  • 以參數或是 session 數為基礎的頁面
  • 回覆評論的頁面
  • 被納入存檔的頁面
  • 會產生重定向的頁面(3xx)、丟失的頁面(4xx)、以及產生伺服器錯誤(5xx)的頁面
  • 已經被標註 noindex 的頁面
  • 被 robots.txt 阻擋索引的頁面
  • 那些做為產生銷售線索的資源頁面(例如:網站管理員讓訪客填寫表單然後進行下載PDF 這一類的檔案)
  • 那些用來做為聯絡我們、隱私權、個人帳號的頁面

XML 網站地圖最佳實踐檢查清單

在檢查網站地圖的時候,我建議要投入時間確認你已經完成下面的檢查清單:
  1. 用 gzip 壓縮網站地圖檔案(gzip 是一種壓縮檔案格式並且也是一個在類 Unix (包含 Linux)上的一種檔案解壓縮的軟體,此處的gzip代表GNU zip。)
  2. 請記得使用網站地圖索引檔案
  3. 只有在索引量與你的KPI有莫大的關係時,你才需要對圖片、影片、Google 新聞執行網站地圖。如果不是的話,建議你維持一般網頁的網站地圖就夠了。
  4. 最好採用動態生成 XML 網站地圖的方式
  5. 確保只在一個網站地圖中收錄網站 URL
  6. 你需要在robots.txt中添加參考站點地圖索引網址
  7. 建議在多個搜尋引擎當中都添加 XML 網站地圖
  8. 在 XML 網站地圖中,只收錄 SEO 相關的頁面
  9. 修補所有的錯誤跟警告訊息
  10. 建議你不定期的檢查網頁是否存在以及這些網頁的內容類型
  11. 要定期紀錄你的網站網頁編入索引比例
  12. 對那些已經提交申請的網頁所產生的例外情形要記得記錄下來
下一期要進入網頁本身的優化了。請各位期待!
avatar-img
10會員
21內容數
常常有人跟我說,SEO 只是做網站的一個技巧。但其實關係重大,它深遠的影響跟你公司的品牌息息相關。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
湖南落子的沙龍 的其他內容
當我們初步對搜尋引擎的運作模式有了概念之後,就進入到真正 SEO 實際操作的環節了。很多 SEO 網站都會把最佳化實踐放在SEO 技術,而並沒有花太多時間關注到網站本身的架構。 而從我個人的理念來說,我們應該要先搞懂架構,所以這一期,讓我們來說網站架構吧。
Google 從推出搜尋引擎服務之後,乍看之下介面上變化不大,但它背後的演算法核心卻不斷的迭代升級,而有非常大的差異,特別是在 Rankbrain 推出之後。那麼 Rankbrain 到底是什麼?
很多朋友經常都會忽略搜索引擎是如何展現搜尋結果的。這次我就來跟大家聊聊這個結果是如何展現的。
一開始原本打算講搜尋引擎的分類,不過後來覺得與其講古不如直接切入主題更合適一點。於是我就從搜尋引擎如何工作的開始做個簡單的說明。
許多人開始接觸官網或是更新官網的時候,總是會想到 SEM(搜尋引擎行銷),在搜尋引擎上打廣告,覺得這樣可以帶來更多流量。更多人會詢問的是:SEO 跟 SEM 是幹嘛的,兩者之間有什麼關係?
當我們初步對搜尋引擎的運作模式有了概念之後,就進入到真正 SEO 實際操作的環節了。很多 SEO 網站都會把最佳化實踐放在SEO 技術,而並沒有花太多時間關注到網站本身的架構。 而從我個人的理念來說,我們應該要先搞懂架構,所以這一期,讓我們來說網站架構吧。
Google 從推出搜尋引擎服務之後,乍看之下介面上變化不大,但它背後的演算法核心卻不斷的迭代升級,而有非常大的差異,特別是在 Rankbrain 推出之後。那麼 Rankbrain 到底是什麼?
很多朋友經常都會忽略搜索引擎是如何展現搜尋結果的。這次我就來跟大家聊聊這個結果是如何展現的。
一開始原本打算講搜尋引擎的分類,不過後來覺得與其講古不如直接切入主題更合適一點。於是我就從搜尋引擎如何工作的開始做個簡單的說明。
許多人開始接觸官網或是更新官網的時候,總是會想到 SEM(搜尋引擎行銷),在搜尋引擎上打廣告,覺得這樣可以帶來更多流量。更多人會詢問的是:SEO 跟 SEM 是幹嘛的,兩者之間有什麼關係?
你可能也想看
Google News 追蹤
Thumbnail
Hi 我是 VK~ 在 8 月底寫完〈探索 AI 時代的知識革命:NotebookLM 如何顛覆學習和創作流程?〉後,有機會在 INSIDE POSSIBE 分享兩次「和 NotebookLM 協作如何改變我學習和創作」的主題,剛好最近也有在許多地方聊到關於 NotebookLM 等 AI 工具
Thumbnail
這是張老師的第三本書,我想前二本應該也有很多朋友們都有讀過,我想絕對是受益良多,而這次在書名上就直接點出,著重在從投資的角度來切入
在現今數位時代,擁有一個引人注目的網站已成為每個企業成功的關鍵。然而,若沒有良好的SEO策略,即使是最精美的網站也可能淹沒在數以百萬計的網頁中。SEO,或搜尋引擎最佳化,是一種讓你的網站在搜尋引擎結果頁(SERP)中獲得更高排名的技術。
隨著網際網路的不斷發展,擁有一個引人入勝的網站已經不再是選擇,而是必備的要素之一。無論你是一個企業主、內容創作者還是個人部落客,都渴望吸引更多的訪客。在這篇文章中,我們將深入探討網站優化的關鍵策略,尤其是SEO(搜尋引擎優化),幫助你提升網站的曝光度。
Thumbnail
SEO(Search Engine Optimization)是網站提升搜尋引擎排名的關鍵,對於想要在網路世界中脫穎而出的企業而言,學習SEO是一條必經之路。本文將從新手到專家,為你提供一個完整的SEO學習進階指南。 初探SEO的基礎知識 對於SEO初學者,首先要理解搜索引擎如何工作,熟悉基本的
Thumbnail
SEO,即搜尋引擎優化,是數位媒體行銷中至關重要的一環。對於初學者而言,建立一個全面的學習指南是邊向SEO巔峰的第一步。從基礎到進階,這是一場關於SEO的冒險之旅。 首先,SEO是什麼?SEO即通過優化網站內外部元素,提高其在搜尋引擎中的排名,從而吸引更多有價值的訪客。要深入了解SEO,不妨從Go
Thumbnail
傳統產業如何做SEO,或搜尋引擎優化,是優化你的網站的過程,以便它在搜尋引擎結果頁面(SERP)中出現得更高。本指南將教你SEO的基本知識,以便你可以開始為你的網站帶來流量。
Thumbnail
你心目中的美食天堂是哪個縣市?你的私藏美食和愛店有哪些?全新 SEO 主題徵文「台灣美食地圖」,一起共享各縣市美食推薦清單,寫文奪大獎!
Thumbnail
SEO 搜尋引擎優化中,有三個重要的動物演算法,分別是熊貓演算法、企鵝演算法跟蜂鳥演算法,雖然這三個動物演算法,大多都已經融入了 Google 的核心演算法當中,但身為 SEO 人,還是必須了解這三種演算法。 SEO 動物演算法一、熊貓演算法 SEO 動物演算法二、企鵝演算法
Thumbnail
網路行銷中最常被提及的「SEO」,有著讓行銷人前仆後繼研究的魔力!因為如果可以透過優化搜尋引擎後衝上首頁排名,就可以獲得大量的免費流量,快速提升品牌曝光度。這篇文章帶你快速了解什麼是SEO,掌握基礎必備知識!
Thumbnail
如果您對搜索營銷的世界比較陌生,您可能聽說過營銷會議中經常提到的“seo 內容”一詞。 本初學者指南旨在回答三個問題: 什麼是“SEO內容”? 有哪些類型的 SEO 內容? 我的 SEO 內容策略是什麼? 如果您有任何關於SEO內容創建策略的問題,但我沒有在這裡回答,請在評論中告訴我
Thumbnail
Hi 我是 VK~ 在 8 月底寫完〈探索 AI 時代的知識革命:NotebookLM 如何顛覆學習和創作流程?〉後,有機會在 INSIDE POSSIBE 分享兩次「和 NotebookLM 協作如何改變我學習和創作」的主題,剛好最近也有在許多地方聊到關於 NotebookLM 等 AI 工具
Thumbnail
這是張老師的第三本書,我想前二本應該也有很多朋友們都有讀過,我想絕對是受益良多,而這次在書名上就直接點出,著重在從投資的角度來切入
在現今數位時代,擁有一個引人注目的網站已成為每個企業成功的關鍵。然而,若沒有良好的SEO策略,即使是最精美的網站也可能淹沒在數以百萬計的網頁中。SEO,或搜尋引擎最佳化,是一種讓你的網站在搜尋引擎結果頁(SERP)中獲得更高排名的技術。
隨著網際網路的不斷發展,擁有一個引人入勝的網站已經不再是選擇,而是必備的要素之一。無論你是一個企業主、內容創作者還是個人部落客,都渴望吸引更多的訪客。在這篇文章中,我們將深入探討網站優化的關鍵策略,尤其是SEO(搜尋引擎優化),幫助你提升網站的曝光度。
Thumbnail
SEO(Search Engine Optimization)是網站提升搜尋引擎排名的關鍵,對於想要在網路世界中脫穎而出的企業而言,學習SEO是一條必經之路。本文將從新手到專家,為你提供一個完整的SEO學習進階指南。 初探SEO的基礎知識 對於SEO初學者,首先要理解搜索引擎如何工作,熟悉基本的
Thumbnail
SEO,即搜尋引擎優化,是數位媒體行銷中至關重要的一環。對於初學者而言,建立一個全面的學習指南是邊向SEO巔峰的第一步。從基礎到進階,這是一場關於SEO的冒險之旅。 首先,SEO是什麼?SEO即通過優化網站內外部元素,提高其在搜尋引擎中的排名,從而吸引更多有價值的訪客。要深入了解SEO,不妨從Go
Thumbnail
傳統產業如何做SEO,或搜尋引擎優化,是優化你的網站的過程,以便它在搜尋引擎結果頁面(SERP)中出現得更高。本指南將教你SEO的基本知識,以便你可以開始為你的網站帶來流量。
Thumbnail
你心目中的美食天堂是哪個縣市?你的私藏美食和愛店有哪些?全新 SEO 主題徵文「台灣美食地圖」,一起共享各縣市美食推薦清單,寫文奪大獎!
Thumbnail
SEO 搜尋引擎優化中,有三個重要的動物演算法,分別是熊貓演算法、企鵝演算法跟蜂鳥演算法,雖然這三個動物演算法,大多都已經融入了 Google 的核心演算法當中,但身為 SEO 人,還是必須了解這三種演算法。 SEO 動物演算法一、熊貓演算法 SEO 動物演算法二、企鵝演算法
Thumbnail
網路行銷中最常被提及的「SEO」,有著讓行銷人前仆後繼研究的魔力!因為如果可以透過優化搜尋引擎後衝上首頁排名,就可以獲得大量的免費流量,快速提升品牌曝光度。這篇文章帶你快速了解什麼是SEO,掌握基礎必備知識!
Thumbnail
如果您對搜索營銷的世界比較陌生,您可能聽說過營銷會議中經常提到的“seo 內容”一詞。 本初學者指南旨在回答三個問題: 什麼是“SEO內容”? 有哪些類型的 SEO 內容? 我的 SEO 內容策略是什麼? 如果您有任何關於SEO內容創建策略的問題,但我沒有在這裡回答,請在評論中告訴我