接触年少多金香港餐饮大亨,聊SEO及有趣香港人口音
最近认识了一位出身优渥的香港餐饮界翘楚,本以为他体型会较为丰腴,没想到他相貌堂堂,实在令人羡慕,更让人恼火的是他居然还非常勤奋,最初的交流是在他结束一天的工作从深圳返回香港之后,通常要到晚上十一点才能开始,通过对话我了解到,香港的网络使用方式与西方国家颇为相似,许多人都有使用Google的习惯没想到他掌管的每家餐饮企业都设有专属的网页,并且非常用心地维护着。这位富豪联系到我,缘于对手凭借卓越的搜索引擎优化,访问量是他十倍之多。早些时候他也接触过一些SEO服务公司,但成效都不理想。香港地方的语言特色颇为独特,有个人提及从前与SEO搭档时,担任编辑职务的粤语者,其称谓的两个字发音与“骗子”相似,他当时立刻感到心惊,继而觉得此事颇为滑稽,心想:“这种说法其实相当恰当”。然而,细究起来,也让人感到些许难过,因为行业内部的良莠不齐,以及过分追求速成的心态,确实容易让人产生SEO毫无价值、尽是欺诈的误解,从而连那些认真经营的正规公司与个人也跟着蒙受牵连。
摸清了老板的期望之后,我对数个平台的搜索引擎优化进行了检查评估,最明显的弊端在于系统基于WordPress搭建,导致前端效率、代码压缩等细节处理都相当欠缺。特别是网页中JavaScript的应用,该技术在提升搜索排名方面的作用近年来愈发关键。如今制作网页,无论是采用异步加载方式,抑或是增强页面互动性,几乎都离不开JavaScript脚本的支持。然而,如果JavaScript脚本运用不合理,就会对搜索引擎优化产生极为严重的后果。
搜索引擎怎样处理JS
谷歌检索流程大致如下,针对常规HTML文档进行信息采集时:
1. Google bot 下载HTML 档
谷歌爬虫从网页源代码中获取网址,接着迅速访问这些网址
3. Google bot 下载CSS 档案
谷歌爬虫把获取到的资料传送到谷歌的索引器那里去
5.Google 的Indexer 检索页面
爬取JavaScript 所产生的网站内容时:
1.Google bot 下载HTML 档
谷歌爬虫在网页源代码里寻不到路径,是由于JavaScript脚本未被启动执行
谷歌爬虫会获取CSS和JavaScript文件
谷歌爬虫借助渲染器,该组件属于索引器范畴,负责分析、转换并运行JavaScript代码
5.WRS 从外部API、资料库获取资料(data)
6.Indexer 可以索引内容
谷歌探测到新的网址,随后将它纳入待抓取列表,这就完成了常规谷歌机器人获取网页内容的第二阶段流程。
重要链接不要用JS
网络信息检索程序通过追踪网址来搜集内容。倘若核心网址必须借助JavaScript代码才能访问或呈现数据,检索系统或许无法获取。并非网址不能运用JavaScript技术,实际上,多数站点在公共页脚区域会采用该技术,但关键且希望被索引的页面,仍需具备基础格式的网址供检索程序访问。
慎用按需加载、瀑布流
图片会根据需要才加载,文字内容也是这样处理,这是许多网站常采用的手法,这样做确实能在某些方面加快网页的打开速度。不过要留意,如果用JavaScript来执行这种按需加载,就必须依赖用户的某些行为才能触发,比如点一下“加载更多”的按钮,或者往下拖动页面,但搜索引擎的爬虫并不会去执行这些操作,因此它们可能无法看到那些按需加载出来的内容。加载额外页面内容或其它页面清单都可能引发抓取、检索障碍。很多网站采用瀑布流布局展示列表,这是用户已经适应的方式,其成因在于模仿社交媒体的呈现模式。然而,社交媒体平台常常主动阻拦搜索引擎,避免其进行内容收录。要让网站内容获得全面收录,最好不要采用瀑布式布局,如果必须使用这种布局方式,需要额外设置可供搜索引擎识别的导航路径。
网页打开和响应速度
运用JS容易导致网页加载和交互变慢。虽然获取JS文件本身问题不大,但浏览器处理JS时可能非常消耗机器性能。某些JS代码运行时间会持续数秒,容易形成脚本卡顿,这种状况对使用者来说感受很差。因此,应当尽量移除运行时间较长的JS,执行时间超过1-2秒的脚本必须仔细评估。同时,最好将JS代码合并,以降低脚本总数。该富豪的网页要加载数十个JavaScript文件,其中包含大量外部来源的代码,网页加载速度是影响搜索引擎排序的关键指标,而由此产生的很差感受,也可能导致网站在优化过程中的位置下降。
服务器端渲染
在条件具备的情况下,可以考虑让JS在服务器端执行渲染工作,尽管这样做会提升技术复杂度,同时导致服务器响应时间略微延长,但服务器的处理能力肯定强于客户端设备,并且配合缓存技术的运用,整体运行速度将远快于浏览器直接执行JS并渲染界面。
允许爬虫抓取
在网站地图文件中,应允许搜索引擎访问相关内容,具体操作是添加下列内容:
User-Agent: Googlebot
Allow: .js
大品牌网页上JavaScript 之内容未被索引的情况:
Nike 官方站点采用 JavaScript 渲染的部分内容,有五分之一无法被搜索引擎收录,这种情况比较常见
H&M 官方网站上,由JavaScript生成的部分内容,有超过半数没有被搜索引擎收录,这种情况比较普遍
Yoox网站通过JavaScript生成的信息,有高达92%的部分没有被搜索引擎收录,这种情况比较常见
Yoox 是一家国际知名的在线零售平台,每月能够吸引高达1400万的访问量,然而该网站采用JavaScript动态生成的内容中,竟有高达92%的部分无法被Google搜索引擎收录,这种情况充分说明了对搜索引擎优化可能造成的严重后果,以及由此带来的巨大潜在损失。然而,也存在一些网站,它们能妥善处理JavaScript生成的内容,另有一些网站,则能让JavaScript生成的内容实现完全或接近完全的索引收录。因此,只要运用合适的技术手段,JavaScript与搜索引擎优化是可以和谐共存的。
文章评论