探索基于 HTML 的服务端渲染与 SEO 的关系及搜索引擎工作原理
基于HTML的服务端渲染的问题,这里只是简单介绍了一下它的优点和缺点,这就涉及到SEO了,SEO的全称是Search Engine Optimise,也就是搜索引擎优化。
说到SEO,可能需要了解搜索引擎的原理,深层次的算法问题我无法解释清楚,所以只是简单说一下我对这个问题的理解。
发动机的工作原理
(官方解答)搜索引擎的工作原理是从互联网上抓取网页,建立索引数据库,并在索引数据库中进行搜索和排序。它的整个工作过程大致分为信息收集、信息分析、信息查询、用户界面四个部分。
信息采集是网络机器人扫描一定IP地址范围内的网站,通过链接遍历Web空间,收集网页信息的过程。为保证采集到的信息是最新的,网络机器人还会对曾经爬取过的网页进行重新访问;信息分析是通过分析程序对采集到的信息提取出索引项,用索引项表示文档并生成文档库的索引表,从而建立索引数据库的过程;信息查询是指当用户用关键词搜索信息时,搜索引擎会根据用户的查询条件从索引库中快速检索出文档,然后评估检索到的文档与查询条件的相关程度,最后根据相关度对搜索结果进行排序输出。
如果您可以用自己的图表解释这一点。
但如果你问:信息分析和索引的过程是怎样的?我也不知道。有些文献我找不到,即使找到了也读不懂。。。
为何服务器端渲染有利于 SEO?
首先我们要明白SEO并不是一种技术,而是一种针对搜索引擎的策略,它的目的是为了让搜索引擎爬虫能够更快更精准的爬取到我们开发的网站。
如果我们当中有人写过爬虫的话(我们先假设搜索引擎爬虫就是我们平时写的那种东西),那么我们就会知道我们的爬虫其实就是爬取网页中的标签内容,通过获取这些内容来进行分析。假设我们的网站是前后端分离开发的,界面需要用js去请求接口,接口返回之后才显示整个界面。那么我们的爬虫就无法获取到我们想要的内容了。
有了服务渲染,服务端就会在把整个界面填满数据后直接返回界面,一来就不需要客户端请求的过程了,二来直接返回整个界面,这必然能让爬虫更快更精准的爬取到自己想要的信息。
所以就有了这样的结论:服务端渲染有利于SEO。
那么我们来谈谈服务器对 SEO 的影响。
网站优化推广团队分析,网站访问量越大,服务器的负荷就越大,因此网站经历了几次服务器变更,因为服务器的变更,如果处理不好,对SEO流量都会有不同程度的影响。为了避免遇到服务器变更等问题不知道如何处理,我查找了资料,结合自己的一些经验,讲一下服务器对SEO的影响,以及SEO应该如何应对服务器变更。
服务器对 SEO 的影响
1. 服务器配置会影响网站速度
服务器配置低会影响网站打开速度,网站打开速度慢会影响搜索引擎蜘蛛抓取速度,单位时间内抓取量比较小,不利于收录,下面就简单介绍一下关于服务器配置的几个知识点。
①带宽:带宽越大,网速越快,想想家里4M网络和50M网络的区别,你瞬间就明白了。
②单/双/多线:如果你针对的是本地用户,可以选择单线服务器,但双线服务器一般比单线服务器好。双线服务器=电信网通双线接入。北方大部分人用网通,南方大部分人用电信。如果你的用户遍布南北,选择双线服务器会更合适。
③内存:服务器内存的大小会影响运行速度,就像电脑或者手机的内存一样,容量大的内存肯定比容量小的内存运行速度快。
扩展问题:
如何测试服务器速度?
① 通过输入URL,可以查看速度。
②点击开始->运行->CMD->ping URL
2、服务器稳定性对搜索引擎蜘蛛爬行频率的影响
如果服务器经常宕机,就会影响搜索引擎蜘蛛访问网站的频率。比如你开了一家面包店,一周有3天关门,那么一周就会有3次被拒之门外。作为顾客,你还会去吗?同样的道理,如果蜘蛛每次访问你的网站都有一次宕机,那么访问频率当然也会随之降低。随着访问频率的降低,无论你有多少优质内容都是没用的。因为如果没有蜘蛛来,也就没有所谓的抓取。
3. 正确的服务器设置至关重要
新来的维护员告诉我,最近有个搜索引擎蜘蛛来得特别频繁,给服务器造成了很大的压力,应该封掉它的IP。我一看,倒吸一口凉气——原来是百度蜘蛛的IP!我瞪了他一眼,说:封了,你还做生意干什么?你还需要流量吗?
与SEO相关的服务器设置有:
阅读之前,请先了解以下术语:
UA阻断:服务器通过User-Agent来识别访客,当网站返回异常页面(如403、500)或者从指定UA访问时重定向到其他页面,即视为UA阻断。
IP封锁:IP封锁是指限制网络出口IP地址,禁止该IP段的用户访问内容。UA封锁则是对已经被服务器通过UA(User Agent)识别的用户进行重定向。
Http 状态代码:状态代码(也称为错误代码)是指服务器收到的每个请求(网页点击)分配的 3 位代码。大多数有效的网页点击的状态代码为 200(“OK”)。“页面未找到”错误将生成 404 错误。
看完讲解之后,我们来学习如何设置服务器以有利于SEO。
UA屏蔽:主要利用Robots。在Robots文件中,不要误将搜索引擎UA屏蔽,否则会影响抓取。如果不知道Robots是什么,可以百度搜索。
文章评论