【文思不藏私】SEO搜尋引擎優化~sitemap 篇

Vince Huang
May 10 · 5 min read
https://www.youtube.com/watch?v=d0XX2GajGWc

Sitemap 介紹

搜尋引擎的原理是透過『網路爬蟲』(Crawler)把一個網站上的網頁抓取後進行分析與索引。然而『網路爬蟲』一頁一頁的爬取過程中可能因爲執行效率或爬取時間的因素,部分網頁一直沒有出現在搜尋結果網頁(Search Engine Result Page)中。因此,這時候 Sitemap 就可以扮演很重要的角色,就如同出去旅行一樣,我們可以每到一個觀光景點後,才到『遊客服務中心』索取導覽地圖,這樣的行為就是『網路爬蟲』的動作。也可以安裝 Google Map 或紙本地圖,掌握所有資訊,這時候 Google Map 或紙本地圖就像是 sitemap 一樣提供我們全局的資訊。

廢話不多說,來看看 sitemap 的資料格式吧!

Sitemap 資料格式

kktv sitemap.xml

urlset

以 KKTV 為例,首先在 sitemap.xml 中第一個 tag 是 urlset,『xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9"』是最重要的部分,因為這份 sitemap.xml 中可能也會描述到 image, video,所以也定義了 xmlns:image, xmlns:video。

<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:xhtml=”http://www.w3.org/1999/xhtml" xmlns:image=”http://www.google.com/schemas/sitemap-image/1.1"xmlns:video="http://www.google.com/schemas/sitemap-video/1.1">

url

<url>
<loc>網頁完整網址</loc>
<image:image>
<image:loc>圖片完整網址</image:loc>
</image:image>
<video:video>
<video:thumbnail_loc>影片縮圖完整網址</video:thumbnail_loc>
<video:title>影片標題</video:title>
<video:player_loc allow_embed=”yes”>影片完整網址</video:player_loc><video:description>影片描述</video:description>
</video:video>
<changefreq>更新頻率</changefreq>
<lastmod>修改日期</lastmod>
</url>

一份 sitemap.xml 中主體是有一堆 url 所組成,其中包含

  1. 網頁完整網址:loc
  2. 圖片完整網址:image:loc
  3. 影片縮圖完整網址:video:thumbnail_loc
  4. 影片標題:video:title
  5. 影片完整網址:video:player_loc,allow_embed 可指定搜尋引擎是否能將影片嵌入至搜尋結果中。允許的值為 yes 或 no。
  6. 影片的片長(以秒為單位):video:duration
  7. 影片的到期日:video:expiration_date
  8. 修改日期:lastmod
  9. 優先級:priority。可填入0.0~1.0,越高代表這個網頁越重要。首頁通常為 1.0,然後依重要性逐漸降低。
  10. 更新頻率:changefreq

關於『更新頻率』是指『這個網址網頁』的更新頻率,並非以整個網站的更新頻率。更新頻率有幾種值可以填寫:

  1. always:表示頁面一直在變動。
  2. hourly:每小時會變動。
  3. daily:每天會變動。
  4. weekly:每周會變動。
  5. monthly:每月會變動。
  6. yearly:每年會變動。
  7. never:永不變動。
https://support.google.com/webmasters/answer/80471?hl=zh-Hant

sitemap 的限制

您可以提供多個 Sitemap 檔案,但每個 Sitemap 檔案不得超過 50,000 個 URL,且不得大於 50MB 。您可以視需要使用 gzip 壓縮 Sitemap 檔案以減少頻寬需求,但是解壓縮之後的 Sitemap 檔案不可超過 50MB。如果您想列出 50,000 個以上的 URL,您必須建立多個 Sitemap 檔案。

Sitemap 索引檔格式:

  • <sitemapindex> 開頭,以 </sitemapindex> 結尾。
  • 個 Sitemap 中包含一個 <sitemap> 項目。
  • 每個 <sitemap> 包含一個 <loc>
  • Sitemap 索引檔也可使用 <lastmod>

更多資訊請看【SEO搜尋引擎優化~筆記整理

【請用你的掌聲來投票與支持】
感謝你認真的讀完這篇文章,你的支持會是我持續寫作的動力
如果你還喜歡這篇文章請給我 1~4 個『掌聲』
如果這篇文章對你有幫助請給我 5 個以上『掌聲』
文思不藏私 Facebook 粉絲專頁
如果你對我這一系列文章有興趣歡迎『Follow』我或『分享』給你的朋友
也歡迎你將你的看法『回覆』給我
2018 書坑待辦清單
誰是文思?

【文思不藏私】

What I learned in Agile / Scrum?

Vince Huang

Written by

A Product Owner in software company, interests include agile/scrum, machine learning and mobile design. https://www.linkedin.com/in/kuoyuhuang/

【文思不藏私】

What I learned in Agile / Scrum?

Welcome to a place where words matter. On Medium, smart voices and original ideas take center stage - with no ads in sight. Watch
Follow all the topics you care about, and we’ll deliver the best stories for you to your homepage and inbox. Explore
Get unlimited access to the best stories on Medium — and support writers while you’re at it. Just $5/month. Upgrade