学习谷歌SEO不可避免的会接触站点地图(Sitemap)这个配置文件,本篇文章就详细讲解下什么是站点地图、如何制作并向谷歌提交站点地图,以及该文件在谷歌SEO优化中的重要作用。
什么是站点地图(Sitemap)
站点地图是一个提供与网站中的页面、视频或其他文件有关的信息的文件。就好比商场中的导购系统一样,Google 等搜索引擎会读取此文件,以便于抓取工具浏览和更高效地爬取你的网站。如果没有站点地图,那层级越深的网站就很难被发现和收录。
站点地图的作用
- 为搜索引擎提供视频、图片、新闻等相关信息,有助于爬虫更加高效地抓取规模更大、更复杂的网站或更特殊的文件。
- 建站过程可避免出现孤岛页面,防止出现页面未被爬取到的情况。
- 网站内容更新后能及时被搜索引擎发现,并且索引最新版本的内容
注意:
- 站点地图可帮助搜索引擎发现网站上的网址,但并不保证 Google 能抓取站点地图中的所有内容并将其编入索引。
- 一些建站CMS,如:WordPress,Wix等,无需经过任何设置,建站系统本身可以生成站点地图并自动提交给谷歌的。但是为了方便SEO,我建议使用插件来设置,比如:WordPress 安装 Yoast SEO 插件,本文下方“创建站点地图”时会讲述。
站点地图的常见格式
谷歌官方指南中列出的站点地图格式有3种:
- XML站点地图
- RSS,mRSS 和 Atom 1.0
- 文本站点地图(HTML站点地图)
但在SEO优化实操中,其实常用的只有2种:XML站点地图和文本站点地图(HTML站点地图),下面我分别介绍下:
文本站点地图(HTML站点地图)
主要是面向网站用户的,就是一个简单的目录页面,用户可以非常清晰的了解整个网站的内容结构,点击链接可直接跳转至文章或者产品页面。
不过,此类型是有缺点的,就是仅限 HTML 和其他可编入索引的文本内容,像是图片、视频、新闻类型的网站我是不建议用的。
XML站点地图
我们平时说的SEO优化中的站点地图指的就是XML类型的。XML站点地图使用最为广泛,可以提供有关网址的最详细信息,包括但不限于:图频、视频、新闻、本地化页面等等。
当然,也有缺点,在大型网站或网址经常改变的网站上维护映射可能会比较复杂。不过,对于使用WordPress搭建的网站来说,一切都是通过插件自动化完成的,几乎没有难度了。
XML站点地图的组成形式
XML站点地图最常用,也最复杂,有些不太好理解,这里做一个简单的解析。
下面是一个简单的XML站点地图文件的内容,可以分成3部分:XML声明、URL组、URL。
补充:关于什么是URL,在《一篇教程搞懂外贸独立站如何正确选择域名(全攻略)》中有讲到过,不明白的可以看下这篇文章。
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://oyouoo.com/</loc>
<lastmod>2024-11-11T10:12:20+03:00</lastmod>
</url>
<url>
<loc>https://oyouoo.com/google-seo-tutorial/</loc>
<lastmod>2024-11-11T18:56:12+03:00</lastmod>
</url>
</urlset>
XML声明
<?xml version="1.0" encoding="UTF-8"?>
这段代码告诉了搜索引擎正在抓取的文件类型,同时也声明了 XML 的版本和所用的字符编码。
URL组
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
以 <urlset>
开始,以 </urlset>
结束,是一个URL组,其中包含了网站中所有的 URL ,同时也告诉了爬虫需要使用什么协议标准爬取URL。
URL
<url>
<loc>https://oyouoo.com/</loc>
<lastmod>2024-11-11T10:12:20+03:00</lastmod>
</url>
以 <url>
开始,以 </url>
结束,是 URL 的父标签,里面必须用 <loc>
强制指定网站完整的 URL 位置(绝对链接)。有的站点地图还会用到以下几个标签:
<lastmod>
:声明页面最后一次修改的时间。<priority>
:声明该URL相较于站内其他URL抓取的优先级,从 0.0 到 1.0 不等,数值越高,优先级越高。<changefreq>
:指明页面的更新的频率,告诉搜索引擎多久重新抓取一次URL。
这些是非强制指定的,谷歌官方指南上也讲了,Google 会忽略 <priority>
和 <changefreq>
值,所以这些可选的标签对 SEO 来说也并没有那么重要,可以根据需要自行选择。
站点地图文件解释起来是比较复杂的,以上内容也只是一点皮毛,不过对于小白来说是够用的,关于高级用法想深入学习的,可以看 Sitemaps XML format 官方文档。
常见的站点地图类型
图片站点地图
图片站点地图可以告知搜索引擎网站上的所有图片,若你搭建的网站是图片类型的,建议生成并提交次类型的。
图片类站点地图必须使用 <image:image>
和 <image:loc>
两个标记。
<image:image>
:包含单张图片的所有相关信息。每个<url>
标记最多可包含 1,000 个<image:image>
标记。<image:loc>
:图片的网址(绝对路径)。
下面是一个简单的图片站点地图的示例:
视频站点地图
视频站点地图可以告知搜索引擎有关在网站上的视频的更多信息,有助于了解网站视频的内容。
视频站点地图必选的标记有6个,可选标记有12个,详情可以看谷歌SEO官方指南中站点地图的部分。
以下为视频站点地图的示例:
新闻站点地图
新闻站点地图可以将新闻报道和其他相关信息告知搜索引擎,但此类站带你地图是有实效性的,但一般网站是接触不到新闻类的,所以就不赘述了,详情可以看谷歌SEO官方指南中站点地图的部分。
以下为新闻站点地图的示例:
如何查看并分析竞争对手的站点地图
查找站点地图的方式非常简单,只需要在域名后面输入“/sitemap.xml”
即可。
以Apple官方网站为例吧,我们来实战分析下:
打开Apple中国区官网,域名后面输入“/sitemap.xml”,回车,即可查看。
通过站点地图我们可以看到Apple网站的所有URL,了解域名和URL关系的话,可以很快分析出每个页面的主题,涉及的关键词是什么。还有的站点地图也可以查看到页面的最后修改时间,分类等等。
分析站点地图能大致把握该网站的内容结构和部分核心词的方向,可以作为我们搭建外贸网站时的参考。
站点地图的创建方法
下面介绍常用的3种创建站点地图的方法。
1. 使用建站程序的插件
如果你的网站时开源程序搭建的,一般都会用对应的插件,比如:WordPress,只需要下载安装 Yoast SEO 或者 Rank Math 即可自动生成站点地图文件,还不需要手动上传,具体操作步骤如下:
Step1 :打开WordPress后台 -> 安装插件 -> 搜索 Yoast SEO -> 点击安装。
Step2 :Yoast SEO -> 设置 -> 打开“XML站点地图”即可。
Step3 :在使用WP建站过程中会产生一些不希望搜索引擎收录的页面或者分类,可以通过禁用 “内容类型” 中的 “在搜索引擎中显示” 选项来排除。请根据网站正式上线前的情况,自己做取舍吧。
2. 使用Screaming Frog
如果你的网站是非开源程序搭建的,那就需要通过第三方工具,如:Screamming 生成站点地图文件,并且也得手动上传至网站服务器才可以,具体操作步骤如下:
Step1 :安装并打开 Screaming frog ,再上方输入网站域名,点击“start”,等待 Screaming frog 将所有的URL检测出来。
Step2 :点击上方 Sitemap -> XML Sitemap , 第一次生成的话全部选择默认即可,点击应用并等待文件生成。
默认设置一般不会出现太大的问题,不过还是建议手动打开站点地图文件检查是否有错误。
Step3 :确认站点地图没有问题后,需要手动上传至网站根目录,这里1Panel面板为例(其他VPS面板同理)来演示,需要将生成的站点地图上传至此目录下:
注意:免费版本的 Screaming Frog 只能抓取500个URL,也就是说,假如你的网站是大型的商城站,超过500个URL后,Screaming Frog 的免费版是抓取不到的,需要升级付费才可以抓取更多URL(当然,该软件也有破解版的,请自己尝试搜索来解决)。
3. 使用Chrome浏览器插件
此方法与第2种方法类似,需要下载Chrome浏览器插件,(梯子请自行解决)具体操作步骤如下:
Step1 :打开Chrome应用商店,搜索并安装 Sitemap Generator 插件
Step2 :打开你的网站 -> 点击右上角的 Sitemap Generator 插件按钮 -> 点击生成。
此插件会打开网站所有的页面,特别吃内存,爬取完成后会自动关闭所有标签页并下载 Sitemap.xml 文件,同样手动将该文件上传至网站根目录即可。
注意:
还有一些是提供免费站点地图生成的工具站,我个人不太建议使用这些,有些XML虽然生成了,但是包含了重定向URL、非规范化URL以及非 200 状态码的URL,这些页面属于“无用的、低质量”的页面,搜索引擎抓取并收录后,易导致页面权重被稀释从而使页面排名降低。
Screaming Frog 默认抓取的是200状态码,且URL是唯一的规范化页面,所以才建议选择默认设置。
如何将站点地图提交给谷歌搜索引擎
去对应的搜索引擎管理后台提交即可,谷歌SEO优化最常用的是Google Search Console 后台,下面是操作步骤:
打开GSC,点击左侧的“站点地图”,输入站点地图路径,点击提交。提交时已经有了域名,只需要输入站点地图的文件路径即可。
常见问题解答
这里汇总一些关于站点地图的常见问题,希望能解决你的部分问题,不会覆盖那么全,若是没有涉及到,欢迎联系我或者在下方留言。
关于站点地图的大小限制
谷歌官方指南中明确给出了站点地图的限制:无论采用哪种格式,单个站点地图的文件大小一律不得超过 50MB(未压缩),并且其中包含的网址数量不得超过 50,000 个,否则必须将站点地图拆分成多个较小的站点地图。
WordPress 安装 Yoast SEO 插件生成的XML站点地图就是拆分成多个较小的站点地图。
有站点地图的话,还需要内链吗?
首先站点地图和内链是两个不同的概念,两者本质是有区别的。
站点地图可以让搜索引擎的蜘蛛更高效的爬取网站页面,具体是否收录取决于搜索引擎对这个页面的质量评分。
内链虽然可以帮助搜索引擎发现页面,但更重要的作用是合理的分配页面权重,再配合“dofollow”和“nofollow”的使用可以控制页面权重的流动方向(内链高级用法),因此站点地图无法替代内链的重要作用。
网站的站点地图是必须的吗?
这就是上面所提到的,如果你的网站内链建设是合理的话,那可以选择不提交站点地图,爬虫可以通过内链发现网站中的所有页面。
但提交站点地图并不是一件特别困难的事,百利而无一害,为什么不选择提交呢?尤其是B2C电商站,页面过多的话,其实根本无法确定所有的页面是否都已经链接到的。
提交网站地图后,页面还显示“网址尚未被抓取/编入索引”怎么办?
新站提交站点地图后,搜索引擎总要有一个反应时间的,还需要评估整个页面的质量才能收录或索引,一般需要等待 3~5 天,若页面质量非常高的话,提交后的第二天就会被收录。
还有些页面不收录是因为页面质量特别差,需要针对性的做On-Page页面优化,然后手动提交给搜索引擎。
Priority优先级越高,排名会越高吗?
如果我将所有网页的优先级设为 1.0,相比其他人优先级为 0.8 的网页,我的这些网页是否会获得更高的排名(或者说,Google 是否会更快抓取它们)?
谷歌明确表示了不会参考 <priority>
值,所以其优先级不会对页面排名有任何影响。
这三种站点地图格式,最推荐的是哪一个?
首推XML格式的,使用WordPress搭建的各类网站只需要安装插件即可自动生成XML站点地图,这也是最简单的方式,对小白来说非常友好。
以上就是本篇文章的全部内容,站点地图也只是增加搜索引擎爬虫的抓取效率,并不能提高网站排名,还需要从其他方面对整个页面做优化。不过分析竞争对手的站点地图可以了解网站内容结构和核心关键词等等,也是SEO优化不可缺少的一环。对于外贸建站来说,创建、提交XML站点地图在操作上也几乎不需要任何基础。文章涉及到的这些也只是站点地图的一部分知识点,若是还有什么不理解的,欢迎联系我或者在本文下方留言!