方格精選

SEO 指南第7講 - 網頁本身的 meta 元資料以及 robots.txt(上)

更新於 發佈於 閱讀時間約 9 分鐘

對許多網站編輯或是產品經理來說,我們經常會注意要 SEO 的點是內容、連結、meda 原資料描述、圖片名稱優化、網站架構優化這些細節,但是很少人會關注 robots.txt、robots 標記元資料、XML 網站地圖以及 X-Robots 標記這些更細微的內容,而這很可能會讓你的網站怎麼樣也上不到成為 SERP 第一名的關鍵。為什麼呢?恐怕問題來自於 robots.txt 這一類的內容。想多了解嗎?來吧!

什麼是 robots.txt?

robots.txt 如同我之前說的,非常像是站長或網站管理員與搜尋引擎的溝通管道,你可以把 robots.txt 視為一個 walkie talkie,你告訴搜尋引擎要查找哪些網頁,哪些網頁不要找,都透過 robots.txt 告訴搜尋引擎,而且這個檔案涉及到所有的搜尋引擎,讓搜尋引擎乖乖聽話,完成站長或網站管理員的要求。

理論上,robots.txt 是一個文本格式的檔案,robots.txt 放在網站的根目錄,搜尋引擎可以在根目錄找到這個檔案,然後根據站長或網站管理員的要求執行索引。

robots.txt 為何那麼重要?

就像前面說的,robots.txt 會告訴搜尋引擎哪些文件夾或網頁要索引,哪些不需要進行索引,所以每個網站都需要有 robots.txt 做為指引搜尋引擎的重要方向。因此在 Google Search Console 這個提供給站長或者網站管理員管理網站的工具當中,就有 robots.txt 的確認內容。當你輸入了 robots.txt,並且經過搜尋引擎確認無誤之後,搜尋引擎就會加速網站的索引過程。

robots.txt 並不是一個難以查找的檔案,事實上,所有網站都可以找到 robots.txt 這個檔案,也就是說你無法隱藏或是為這個檔案加密,它是眾所週知的一個文本檔案;而且無論網站做的好不好,只要有這個 robots.txt,搜尋引擎就可以根據你的指示查找網站上最有價值的網頁。所以如果你想找到某個網站的 robots.txt,只要直接輸入 www.example-website.com/robots.txt 就可以找到了。

如果你的網站上還沒有 robots.txt,並不代表搜尋引擎不會對你的網站進行索引,它依然會進行索引,只是在網站上有些你不想讓搜尋引擎找到的內容(如:電子商務網站上的內部測試頁、或是還沒有完成的網頁、或是不想給外部用戶看到的網頁),就很可能一覽無遺。

robots.txt 的入門檔案包括哪些?

首先,當你要準備一個 robots.txt 的時候,可以打開記事本,然後儲存為 UTF-8 格式的文字檔。並且請記得完成後,要請營運人員放在網站的根部,然後在瀏覽器當中輸入 www.example-website.com/robots.txt,確認看到這個檔案的內容,安裝的動作就算完成了。

就像 XML 網站地圖一樣,robots.txt 也有限制,它的限制包括:

  1. 只有 txt 文本格式,而且必須以 UTF-8 的格式儲存
  2. 設定的規則不能超過 1024 個規則
  3. 整個檔案必須小於 500KB
  4. robots.txt 只能有一個,不能有多個版本或是多份內容

如果你在 robots.txt 放le UTF-8 以外的格式,那會怎麼樣呢?嗯,首先搜尋引擎會忽略這些非 UTF-8格式的內容,只執行屬於 UTF-8 的內容,而且搜尋引擎也不會告訴你哪裡是寫錯的。(但是搜尋引擎的工具如 Google Search Console 會)

整個 robots.txt 內容可以指定給單一或多個搜尋引擎,透過下指令的方式讓搜尋引擎根據你的要求執行工作。下指令的時候,你可以指定目錄名稱、操作要求、以及下指令的值做為一個指令。這些指令包含:disallow(不允許)哪個搜尋引擎執行哪些操作;或是 allow(允許)哪個或哪些搜尋引擎針對特定的目錄進行操作。比如:允許哪一個搜尋引擎對哪些內容進行索引,哪些內容不准進行索引、執行 XML 網站地圖等作業。在檔案中,你可以添加一些說明,在說明文字前方,要記得加上 # 做為說明使用。

那麼哪些網頁或目錄是我們不希望搜尋引擎找到的呢?我儘量把相關的內容寫在下方,供你們參考:

  • 內容重複的網頁
  • 搜尋結果頁
  • 動態產品與服務頁面
  • 購物車聊天頁面
  • 謝謝頁面

OK。講了那麼多,還沒有看到 robots.txt 的真面目,現在就揭示給各位看看一個 robots.txt 真正的樣貌長什麼樣子:

raw-image

上方是台灣 104 人力銀行的 robots.txt 檔案內容。從這裡我們就可以看到網站管理員不允許搜尋引擎對特定的目錄進行索引。

如何使用 robots.txt

我們拿上面提及的 104 人力銀行網站當中的 robots.txt 來做例子好了。在這個網站中,它禁止了所有搜尋引擎(user-agent: *)訪問下方的這些目錄。

那可不可以只對特定的搜尋引擎設定條件呢?當然是可以的。robots.txt 的彈性很大,幾乎適用於各類搜尋引擎,所以你可以批次指定,也可以只針對特定的搜尋引擎指定條件。當你希望不要讓搜尋引擎對某個目錄進行索引的時候,只需要輸入 disallow: /xxx (xxx 指的是目錄名稱)然後上傳到伺服器更新就可以了。這裡再舉一個例子:好市多網站的 robots.txt 如下:

raw-image

發現了嗎?好市多的 robots.txt 裡面提供的規則就比較多了,它不允許 gigabot 索引所有的網頁;但它允許所有搜尋引擎查看它的網站地圖,但不允許搜尋引擎對checkout 等這些頁面進行索引。

robots.txt 會出現的錯誤

robots.txt 看起來很簡單,但是寫起來還是會有機會發生錯誤的。以下就是經常會出現的錯誤,提供給你參考:

檔名顯示為大寫文字

在輸入檔名的時候,只能用 robots.txt,而不能用 ROBOTS.txt 或是 Robots.txt 的檔案名稱。

存檔時輸入錯誤的檔名

儲存檔名的時候,要注意檔案名稱,不要用 robot.txt,而要使用 robots.txt

格式指引的寫法不正確

舉例來說:如果要設定 Googlebot 不允許索引所有的頁面,那麼這樣的寫法應該是
User-agent: Googlebot
Disallow:/
而不應該是
Disallow: Googlebot

在一個命令之下輸入多個目錄

如果你想在一個命令下指定多個目錄,那麼應該是一個命令,指定到一個目錄之下,而不應該寫成 Disallow: /css /images /cgi-bin

忘了輸入 user-agent 之後的名稱

 以下這種寫法是錯誤的:
User-agent:
Disallow:
正確的寫法應該是:
User-agent:*
Disallow:

在檔案內使用了大寫字

除了不能用大寫字寫檔案名稱之外,在檔案內的文字描述也請改成用小寫文字替代。例如這樣的寫法是錯誤的:
USER-AGENT: GOOGLE
DISALLOW:

在主站目錄使用鏡像網站

雖然對絕大部分的用戶來說,使用 https://www.site.com、https://site.com、http://site.com 這幾種展現方式都是一樣的,但對搜尋引擎來說就不一樣。所以如果我們指定了主站目錄,但用了鏡像網站的頁面,就需要注意輸入的內容是否正確。

在目錄當中列舉一個目錄當中的多個頁面

robots.txt 指定的都是目錄,而不是單一的網頁,單一網頁的方式我會在下一階段單獨說明。

404重定向錯誤

在我寫這篇稿子的時候,我找了很多網站,但許多網站都沒有添加 robots.txt,因此這個情況下,搜尋引擎可能還是會場時訪問 robots.txt 檔案。因此建議各位創建一個空的 robots.txt,這樣就可以避免出現“404 未找到”頁面的問題發生。

User-agent 指定內容與 host 網站不同

比如說,你設定的 user-agent 是所有搜尋引擎(事實上應該是搜尋蜘蛛機器人),那麼如果你這樣設定,就會發生錯誤。

這一期先寫到這裡,我們在下一期說明,如果要阻擋索引單獨的頁面,我們該怎麼做才好。請等待下一期咯!


留言
avatar-img
留言分享你的想法!
avatar-img
湖南落子的沙龍
10會員
21內容數
常常有人跟我說,SEO 只是做網站的一個技巧。但其實關係重大,它深遠的影響跟你公司的品牌息息相關。
湖南落子的沙龍的其他內容
2021/01/30
我們都知道網站是相互連結的,那麼什麼叫做反向連結。為何要有這個反向連結?反向連結與搜尋引擎之間的關係是什麼?它又如何幫助搜尋引擎找到更正確、更貼近答案的網站呢?這次我們就來好好談談反向連結。
Thumbnail
2021/01/30
我們都知道網站是相互連結的,那麼什麼叫做反向連結。為何要有這個反向連結?反向連結與搜尋引擎之間的關係是什麼?它又如何幫助搜尋引擎找到更正確、更貼近答案的網站呢?這次我們就來好好談談反向連結。
Thumbnail
2021/01/23
我的關鍵字選擇內容還是沒寫完,只好先把其他的內容先墊檔放上來。這次我想先提一下我今年參與的一個專案,從事後的結果來看,這個專案並沒有成功,但也不算是徹底失敗,只能說後續還需要持續補充內容。我曾回顧我當時犯了哪些錯誤,但是在那個時刻,也曾經找了對應的案例補充說明。經過幾個月的沉,現在看起來應該是適合反
Thumbnail
2021/01/23
我的關鍵字選擇內容還是沒寫完,只好先把其他的內容先墊檔放上來。這次我想先提一下我今年參與的一個專案,從事後的結果來看,這個專案並沒有成功,但也不算是徹底失敗,只能說後續還需要持續補充內容。我曾回顧我當時犯了哪些錯誤,但是在那個時刻,也曾經找了對應的案例補充說明。經過幾個月的沉,現在看起來應該是適合反
Thumbnail
2021/01/17
原本要在這週發佈一篇談到如何挑選關鍵字的長文,不過剛好看到 Semrush 發佈了 2021 年內容行銷的調查報告,而我看了之後覺得這篇內容很適合給各位同學在SEO 行銷上的參考,所以決定放下這篇未寫完的文章,改成先發佈這篇海外的譯文,提供給各位參考。
Thumbnail
2021/01/17
原本要在這週發佈一篇談到如何挑選關鍵字的長文,不過剛好看到 Semrush 發佈了 2021 年內容行銷的調查報告,而我看了之後覺得這篇內容很適合給各位同學在SEO 行銷上的參考,所以決定放下這篇未寫完的文章,改成先發佈這篇海外的譯文,提供給各位參考。
Thumbnail
看更多
你可能也想看
Thumbnail
2025 vocus 推出最受矚目的活動之一——《開箱你的美好生活》,我們跟著創作者一起「開箱」各種故事、景點、餐廳、超值好物⋯⋯甚至那些讓人會心一笑的生活小廢物;這次活動不僅送出了許多獎勵,也反映了「內容有價」——創作不只是分享、紀錄,也能用各種不同形式變現、帶來實際收入。
Thumbnail
2025 vocus 推出最受矚目的活動之一——《開箱你的美好生活》,我們跟著創作者一起「開箱」各種故事、景點、餐廳、超值好物⋯⋯甚至那些讓人會心一笑的生活小廢物;這次活動不僅送出了許多獎勵,也反映了「內容有價」——創作不只是分享、紀錄,也能用各種不同形式變現、帶來實際收入。
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
SEO你只知道關鍵字嗎?它其實沒那麼重要!能讓搜尋引擎更懂你寫作主題的Meta Description,還有內部與外部的網站連結,在增加流量及提升品質分數的效果更好! 自架站更不要錯過一個超有效SEO投資-Google Ads
Thumbnail
SEO你只知道關鍵字嗎?它其實沒那麼重要!能讓搜尋引擎更懂你寫作主題的Meta Description,還有內部與外部的網站連結,在增加流量及提升品質分數的效果更好! 自架站更不要錯過一個超有效SEO投資-Google Ads
Thumbnail
為什麼網站地圖對於SEO這麼重要呢? 什麼是網站地圖XML呢? (英語:Sitemap)描述了一個網站的架構。 它可以是一個任意形式的文檔,用作網頁設計的設計工具,也可以是列出網站中所有頁面的一個網頁,通常採用分級形式。這有助於訪問者以及搜索引擎的爬蟲找到網站中的頁面。那麼我們來聊聊XML或圖像站點
Thumbnail
為什麼網站地圖對於SEO這麼重要呢? 什麼是網站地圖XML呢? (英語:Sitemap)描述了一個網站的架構。 它可以是一個任意形式的文檔,用作網頁設計的設計工具,也可以是列出網站中所有頁面的一個網頁,通常採用分級形式。這有助於訪問者以及搜索引擎的爬蟲找到網站中的頁面。那麼我們來聊聊XML或圖像站點
Thumbnail
我們在上一期提到了 robots.txt 的各項功能描述,這一期我們來介紹一下在 meta data (元資料)當中的 SEO 優化。用更白話的方式來說,就是讓大家學習如何對單一網頁進行控制是否要進行索引或是禁止索引的過程。。
Thumbnail
我們在上一期提到了 robots.txt 的各項功能描述,這一期我們來介紹一下在 meta data (元資料)當中的 SEO 優化。用更白話的方式來說,就是讓大家學習如何對單一網頁進行控制是否要進行索引或是禁止索引的過程。。
Thumbnail
對許多網站編輯或是產品經理來說,我們經常會注意要 SEO 的點是內容、連結、meda 原資料描述、圖片名稱優化、網站架構優化這些細節,但是很少人會關注 robots.txt、robots 標記元資料、XML 網站地圖以及 X-Robots 標記這些更細微的內容
Thumbnail
對許多網站編輯或是產品經理來說,我們經常會注意要 SEO 的點是內容、連結、meda 原資料描述、圖片名稱優化、網站架構優化這些細節,但是很少人會關注 robots.txt、robots 標記元資料、XML 網站地圖以及 X-Robots 標記這些更細微的內容
Thumbnail
在上一節我介紹了網站架構,當網站架構出現了之後,搜尋引擎怎麼會知道我們的網站發生變化了呢?就像是你換了新房子,想找好友來暖房,那麼好友怎麼知道你家怎麼走呢?這節就是來告訴你,我們如何幫搜尋引擎畫網站地圖。
Thumbnail
在上一節我介紹了網站架構,當網站架構出現了之後,搜尋引擎怎麼會知道我們的網站發生變化了呢?就像是你換了新房子,想找好友來暖房,那麼好友怎麼知道你家怎麼走呢?這節就是來告訴你,我們如何幫搜尋引擎畫網站地圖。
Thumbnail
當我們初步對搜尋引擎的運作模式有了概念之後,就進入到真正 SEO 實際操作的環節了。很多 SEO 網站都會把最佳化實踐放在SEO 技術,而並沒有花太多時間關注到網站本身的架構。 而從我個人的理念來說,我們應該要先搞懂架構,所以這一期,讓我們來說網站架構吧。
Thumbnail
當我們初步對搜尋引擎的運作模式有了概念之後,就進入到真正 SEO 實際操作的環節了。很多 SEO 網站都會把最佳化實踐放在SEO 技術,而並沒有花太多時間關注到網站本身的架構。 而從我個人的理念來說,我們應該要先搞懂架構,所以這一期,讓我們來說網站架構吧。
Thumbnail
一些技術的細節都會影響SEO優化的效果,哈利熊為大家整理了技術面的SEO優化方式!
Thumbnail
一些技術的細節都會影響SEO優化的效果,哈利熊為大家整理了技術面的SEO優化方式!
Thumbnail
說真的,你花了那麼多時間設計網頁,卻沒被搜尋引擎收錄,不是很可惜嗎? 所以接下來,我們就要告訴你,有關於「Technical SEO」的語法重點,讓你的網頁也能快速又有效率的被搜尋引擎收錄進去。
Thumbnail
說真的,你花了那麼多時間設計網頁,卻沒被搜尋引擎收錄,不是很可惜嗎? 所以接下來,我們就要告訴你,有關於「Technical SEO」的語法重點,讓你的網頁也能快速又有效率的被搜尋引擎收錄進去。
Thumbnail
Meta Description 是提供網頁摘要的一個標籤。最多可以填寫160個字元。Meta Description會在Google搜尋結果中顯示,所以它的內容可以影響使用者的點擊率。
Thumbnail
Meta Description 是提供網頁摘要的一個標籤。最多可以填寫160個字元。Meta Description會在Google搜尋結果中顯示,所以它的內容可以影響使用者的點擊率。
Thumbnail
 什麼是Meta Tags? Meta Tags 又稱為描述標籤或是元標籤,它的功能是用來標示一些網頁資訊給搜尋引擎了解,只會出現在頁面的代碼中。您可以透過「檢視網頁原始碼」
Thumbnail
 什麼是Meta Tags? Meta Tags 又稱為描述標籤或是元標籤,它的功能是用來標示一些網頁資訊給搜尋引擎了解,只會出現在頁面的代碼中。您可以透過「檢視網頁原始碼」
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News