有无法解决的问题时,我们会第一时间求助搜索引擎。那本篇文章就讲一下搜索引擎的原理以及我们常用的谷歌搜索引擎是如何工作的,这也是做谷歌SEO优化必须要了解的内容,是提高的外贸独立站 Google 关键词排名,并获得更多流量最基础的知识。
什么是搜索引擎
搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上采集信息,在对信息进行组织和处理后,为用户提供检索服务,将检索的相关信息展示给用户的系统。
以上内容摘选自百度百科。
讲人话:搜索引擎是用于查找和排名与用户搜索匹配的网站页面内容的工具。
举个栗子:假如我想知道世界上最高的大厦是哪个?
那就可以在搜索引擎(谷歌)的搜索框中输入:世界最高的大厦,回车后就会显示搜索结果(SERP),我们可以在给出的结果中找到准确的信息。
搜索引擎所给出的结果是非常个性化的,有的问题或关键词是可以直接给出准确的答案,但有的问题或关键词只能给出与之最相关的页面,这些网站页面是由用户自己生成的,需要我们进一步综合判断来解决我们的问题。
最受欢迎的搜索引擎是哪个?
每个国家或地区的搜索引擎都有所不同,就全球市场来说,谷歌是全球市场占有率最高的搜索引擎。
当然,某些特定国家,如:中国(大陆地区),常用的搜索引擎是百度;俄罗斯常用的搜索引擎为Yandex;日本常用的搜索引擎是2个:Google(日本)和 雅虎(日本)。
所以在做SEO的时候最好根据不同国家或地区的搜索引擎和常用习惯做针对性的优化。但是,由于谷歌是世界最大的搜索引擎,所以绝大多数 SEO 专业人员和站长都喜欢以谷歌SEO优化为主。
补充:谷歌 VS 百度 ,怎么选?
先看两张搜索结果的图片对比吧。同样是“Steam”关键词,谷歌优先给出的是正确的 Steam 官方网站,而百度给出的则是竞价排名的广告,信息搜索准确度不言而喻。
所以,摒弃百度,还是投入谷歌的怀抱吧!虽然需要点手段,但都做外贸了,我想那根本就不是问题。
搜索引擎的工作原理
搜索引擎是利用爬虫程序对网站页面进行爬取、收录、排名等一些列步骤,来完成整个搜索引擎的工作流程。
不同的搜索引擎的爬虫都有不同的名称
Google :googlebot
baidu :baiduspider
Bing :bingbot
注意:不同的搜索引擎的爬虫名称是有必要简单了解下的,这个涉及到我们后面技术SEO中如何使用 Robots.txt 文件禁止爬虫程序爬去特定页面的相关知识。
谷歌搜索引擎是如何工作的?
在谷歌SEO官方指南中,Google 搜索的工作流程分为 3 个阶段:
- 抓取:Google 会使用名为“抓取工具”的自动程序从互联网上发现各类网页,并下载其中的文本、图片和视频。
- 索引编制:Google 会分析网页上的文本、图片和视频文件,并将信息存储在大型数据库 Google 索引中。
- 呈现搜索结果:当用户在 Google 中搜索时,Google 会返回与用户查询相关的信息。
谷歌如何抓取网站页面
Crawling ,也就是爬取的意思。代表着爬虫发现了你的网站并对其进行爬取。Googlebot(抓取工具)会进入网站并爬取已知的URL信息,这个过程会不断的持续下去,使他们能够获取大量的信息。然后将已知的信息,如:文字,图片,视频等返回Google索引服务器为其建立索引。
现在网络上的新生网站和页面越来越多,爬虫也不一定会对每个页面都取爬取,爬虫对每个页面都有爬取预算,用完就会离开该网站。
谷歌如何建立索引编制
indexing,也就是建立索引或收录的意思,抓取网页后,谷歌会试着了解该页面的内容,包括处理和分析文字内容以及 Meta 标记和属性,例如 <title>
元素和 Alt 属性、图片、视频等。
经过一些列分析并且确定为规范化页面后,谷歌爬虫认可你的网站并将其纳入到索引库里。网站页面一旦被收录,就具备了参与搜索结果(SERP)的排名机会,但并不代表你的网页就有排名。
检查你的网页有没有收录有 2 种方法:
第一种方法是使用site运算符,Google搜索框中输入“site:yoururl.com”,特定URL或者域名均可,若输入site+域名的格式则可以查看所有已经被收录的页面。
第二种方法是使用谷歌官方的GSC工具,全称:Google Search Console tools ,将页面URL复制并粘贴至GSC上方搜索框中,回车。
已收录,示例:
未收录,示例:
谷歌如何对网页进行排名(呈现搜索结果)
Results ,也指页面排名。收录只是有排名机会,并不代表用户在搜索某一关键词的时候会在首页出现你的页面。这里会涉及到Google算法的排序,Google会把更符合用户搜索意图的页面以及综合外链质量、内容质量、内容相关性等上百种因素来决定页面的排名情况。
这里简单讨论几个常见的排名因素
关键词搜索意图
搜索意图代表着用户查询该关键词背后的原因。谷歌会判断关键词的搜索意图,并返回与意图一致的相关结果。
例如:我们搜索“如何使用电脑”,谷歌会给出所有关于电脑的使用的结果,且排名靠前的页面都是与“电脑使用技巧,如何使用电脑”的博客文章。
而搜索“购买电脑”关键词,则会给出所有关于“台式机、笔记本电脑”相关的电子商务网站。
关键词搜索意图是一个着重理解的概念,之后的教程中我再详细介绍。
内容相关性、质量及深度
搜索引擎只是计算机程序,它不会像人一样理解内容,但谷歌还是花费数亿资金搭建了这一套能在一定程度上理解内容的系统。
页面的标题、描述以及页面内容与用户查询的关键词相关性越高,该页面的排名就越靠前,也最能满足用户的需求、解决用户的痛点问题。
现在对内容质量的要求也越来越高了,即使你通过一些黑/灰SEO手段如:关键词堆砌 来提高页面内容的相关性也无法得到较高的排名,甚至极易被谷歌惩罚。
所以,身为站长或创作者,我们最基本的要求就是为用户创建实用、可靠、以用户为中心的内容,这也是谷歌提倡的“E-E-A-T”原则。内容质量上来了,其相关性和深度也就迎刃而解了。
外链权重及相关性
反向链接(外链)是一个网站页面链接到另一个网站页面的链接。Google表示,如果一个高权重的网站链接到另一个网站,那被连接到网站则证明是一个可信任的网站。
链接本身是带有权重的,你可以将外链看作是一种“投票“。当页面收到反向链接时,本质上时一个网站对另一个网站担保。从高权重的网站收到的“投票”数越多,你的网站页面信任度和权威性也就越高。
反向链接的数量、质量与网站自然流量是成正比的,但是链接质量要求是要远高于数量要求的,1条高质量的外链可以可抵10条普通质量的外链。
网站页面加载速度
没有人喜欢加载时间过长的网站,谷歌早已将页面加载速度列为排名因素了。
试想下,一个网站打开需要3秒,另一个网站打开需要0.5秒,那用户更喜欢哪个网站呢?一定是后者吧!长时间打不开的网站,用户早就点个关闭页面然后取寻找下一个页面了。
所以,网站的页面打开速度提升和优化也是在谷歌SEO优化的范围之内的。
谷歌官方提供了页面速度检测工具,page speed insights ,地址:https://pagespeed.web.dev/
你可以测试下网站页面速度如何,评分是否达到了谷歌的要求。
由于谷歌对页面排名的因素有上百种,后续我会出篇文章单独讲关于谷歌SEO的排名因素。
谷歌是如何展示个性化搜索结果的
因为用户在搜索时受关键词不同以及设备型号、浏览器、IP地址、语言、搜索历史等等各种因素的影响,谷歌为每个用户提供了个性化搜索结果。
也就是说每个人的搜索结果展现的方式和SERP中所看到的排名时有不同的。
例如,我将代理IP改为美西节点,并在搜索“本地餐厅”关键词时,谷歌会为你展示出以下结果:
谷歌会根据你搜索时的IP定位、语言、搜索时间等等为你提供相关的本地餐厅信息评分、地图信息、营业信息等结构化搜索结果。
之所以这么推荐,是因为你不太可能去美国东部,如纽约等地点,跨越整个美国去吃一顿晚餐吧;还有既然时中文关键词搜索的,那就给出一些中式餐厅的信息,保证我们能在海外也可以享受家乡的美食等等。
但当你的代理节点改变的话,那所给出的就是另外一番结果了。
这里也是做简单了解,后面也会出更加详细的,关于谷歌SERP的教程。
以上就是本篇文章关于搜索引擎原理和谷歌工作机制的全部内容了,搜索引擎的工作原理远比我讲的要复杂的多,因为考虑到一些初入SEO行业的小白,我也不方便讲太细,这里还挖了三个坑,我会一一填上。
身为站长或是SEO工作人员,理解搜索引擎的原理也只是做SEO的第一步。其实,SEO工作的本质就是帮助搜索引擎理解我们网站的页面,并降低爬虫对页面的抓取和索引难度,同时提供高质量的、能解决用户问题的内容。后续我会出更多的谷歌SEO优化教程来带大家更深入了解这一点。