【文思不藏私】SEO搜尋引擎優化~sitemap 篇

Vince Huang
【文思不藏私】
5 min readMay 10, 2019
https://www.youtube.com/watch?v=d0XX2GajGWc

Sitemap 介紹

搜尋引擎的原理是透過『網路爬蟲』(Crawler)把一個網站上的網頁抓取後進行分析與索引。然而『網路爬蟲』一頁一頁的爬取過程中可能因爲執行效率或爬取時間的因素,部分網頁一直沒有出現在搜尋結果網頁(Search Engine Result Page)中。因此,這時候 Sitemap 就可以扮演很重要的角色,就如同出去旅行一樣,我們可以每到一個觀光景點後,才到『遊客服務中心』索取導覽地圖,這樣的行為就是『網路爬蟲』的動作。也可以安裝 Google Map 或紙本地圖,掌握所有資訊,這時候 Google Map 或紙本地圖就像是 sitemap 一樣提供我們全局的資訊。

廢話不多說,來看看 sitemap 的資料格式吧!

Sitemap 資料格式

kktv sitemap.xml

urlset

以 KKTV 為例,首先在 sitemap.xml 中第一個 tag 是 urlset,『xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9"』是最重要的部分,因為這份 sitemap.xml 中可能也會描述到 image, video,所以也定義了 xmlns:image, xmlns:video。

<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:xhtml=”http://www.w3.org/1999/xhtml" xmlns:image=”http://www.google.com/schemas/sitemap-image/1.1"xmlns:video="http://www.google.com/schemas/sitemap-video/1.1">

url

<url>
<loc>網頁完整網址</loc>
<image:image>
<image:loc>圖片完整網址</image:loc>
</image:image>
<video:video>
<video:thumbnail_loc>影片縮圖完整網址</video:thumbnail_loc>
<video:title>影片標題</video:title>
<video:player_loc allow_embed=”yes”>影片完整網址</video:player_loc><video:description>影片描述</video:description>
</video:video>
<changefreq>更新頻率</changefreq>
<lastmod>修改日期</lastmod>
</url>

一份 sitemap.xml 中主體是有一堆 url 所組成,其中包含

  1. 網頁完整網址:loc
  2. 圖片完整網址:image:loc
  3. 影片縮圖完整網址:video:thumbnail_loc
  4. 影片標題:video:title
  5. 影片完整網址:video:player_loc,allow_embed 可指定搜尋引擎是否能將影片嵌入至搜尋結果中。允許的值為 yes 或 no。
  6. 影片的片長(以秒為單位):video:duration
  7. 影片的到期日:video:expiration_date
  8. 修改日期:lastmod
  9. 優先級:priority。可填入0.0~1.0,越高代表這個網頁越重要。首頁通常為 1.0,然後依重要性逐漸降低。
  10. 更新頻率:changefreq

關於『更新頻率』是指『這個網址網頁』的更新頻率,並非以整個網站的更新頻率。更新頻率有幾種值可以填寫:

  1. always:表示頁面一直在變動。
  2. hourly:每小時會變動。
  3. daily:每天會變動。
  4. weekly:每周會變動。
  5. monthly:每月會變動。
  6. yearly:每年會變動。
  7. never:永不變動。
https://support.google.com/webmasters/answer/80471?hl=zh-Hant

sitemap 的限制

您可以提供多個 Sitemap 檔案,但每個 Sitemap 檔案不得超過 50,000 個 URL,且不得大於 50MB 。您可以視需要使用 gzip 壓縮 Sitemap 檔案以減少頻寬需求,但是解壓縮之後的 Sitemap 檔案不可超過 50MB。如果您想列出 50,000 個以上的 URL,您必須建立多個 Sitemap 檔案。

Sitemap 索引檔格式:

  • <sitemapindex> 開頭,以 </sitemapindex> 結尾。
  • 個 Sitemap 中包含一個 <sitemap> 項目。
  • 每個 <sitemap> 包含一個 <loc>
  • Sitemap 索引檔也可使用 <lastmod>

更多資訊請看【SEO搜尋引擎優化~筆記整理

【請用你的掌聲來投票與支持】
感謝你認真的讀完這篇文章,你的支持會是我持續寫作的動力
如果你還喜歡這篇文章請給我 1~4 個『掌聲』
如果這篇文章對你有幫助請給我 5 個以上『掌聲』
文思不藏私 Facebook 粉絲專頁
如果你對我這一系列文章有興趣歡迎『Follow』我或『分享』給你的朋友
也歡迎你將你的看法『回覆』給我
2018 書坑待辦清單
誰是文思?

--

--

Vince Huang
【文思不藏私】

A Product Owner in software company, interests include agile/scrum, machine learning and mobile design. https://www.linkedin.com/in/kuoyuhuang/