Tối ưu hóa sitemap là một trong những bước quan trọng khi thực hiện tối ưu hóa website với công cụ tìm kiếm. Sitemap sẽ giúp cho công cụ tìm kiếm thực hiện truy vẫn được tất cả các trang trên website cũng như cập nhật các điều chỉnh khi website được cập nhật hoặc thay đổi. Trong một hướng dẫn gần đây Google thông báo rằng việc tối ưu hóa sitemap xml sẽ tốt hơn sitemap dạng feed. Sau đây là một số thông tin chi tiết.
Sitemaps và Feed:
Sitemap có thể được cấu trúc dưới các định dạng như XML, RSS hoặc Atom. Điểm khác biệt giữa các định dạng này được hiểu cơ bản là: XML sẽ thông báo cho công cụ tìm kiếm cách thức truy vấn toàn bộ nội dung của website bao gồm toàn bộ các liên kết nội bộ của website, trong khi đó RSS/Atom feed chỉ thông báo cho công cụ tìm kiếm biết những thay đổi gần nhất của Website.
Để tối ưu hóa quá trình truy vấn, chúng ta nên sử dụng cùng lúc hai định dạng dạng XML sitemap và RSS/Atom Feed. Theo đó XML sẽ cho phép Google truy vấn tất cả các thông tin về website như cáu trúc website, nội dung hoặc các liên kết nội bộ (dĩ nhiên đối với các liên kết quan trọng bạn có thẻ chọn chế độ noindex để không cho phép Google truy vấn). RSS/Atom Feed sẽ thông báo cho Google những cập nhật mới nhất trên website bao gồm việc cập nhật nội dung, điều đó giúp cho bot Google luôn ghé thăm “nhà” bạn mỗi khi thực hiện đăng tải bài viết.
Ví dụ về sitemap:
<?xml version=”1.0″ encoding=”utf-8″?>
<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>
<url>
<loc>http://example.com/mypage</loc>
<lastmod>2011-06-27T19:34:00+01:00</lastmod>
<!– optional additional tags –>
</url>
<url>
…
</url>
</urlset>
Ví dụ về RSS feed:
<?xml version=”1.0″ encoding=”utf-8″?>
<rss>
<channel>
<!– other tags –>
<item>
<!– other tags –>
<link>http://example.com/mypage</link>
<pubDate>Mon, 27 Jun 2011 19:34:00 +0100</pubDate>
</item>
<item>
…
</item>
</channel>
</rss>
Ví dụ về Atom feed:
<?xml version=”1.0″ encoding=”utf-8″?>
<feed xmlns=”http://www.w3.org/2005/Atom”>
<!– other tags –>
<entry>
<link href=”http://example.com/mypage” />
<updated>2011-06-27T19:34:00+01:00</updated>
<!– other tags –>
</entry>
<entry>
…
</entry>
</feed>
Tối ưu hóa Sitemap
XML sitemaps
Định dạng xml sitemap bao gồm tất cả các liên kết (url) của website, do đó định dạng này thường có dung lượng rất lớn. Vì lý do dung lượng lớn nên định dạng này được cập nhật ít hơn. Để đảm bảo Google bot có thể cập nhật trạng thái thay đổi trên website, bạn nên thiết lập tính năng tự động cập nhật tối thiểu một lần/ngày.
RSS/Atom
Định dạng sitemap RSS Atom Feed được Google bot ưu ái cập nhật thường xuyên hơn vì dung lượng nhỏ hơn định dạng xml.
Do đó, bạn nên sử dụng Ping Optimizer để tối ưu hóa quá trình ping của website/blog. Ngoài ra hãy sử dụng thêm plugin PubSubHubbub để thông báo thời gian cập nhật thật với Google bot.
Hy vọng rằng thông tin này sẽ giúp ích bạn cải thiện quá trình index của blog/website.