百度第三代点击排名统计系统剖析,快排深度原理及百度谷歌差异
这是码迷SEO的第42篇原创
今日介绍百度最新版点击排序统计机制,同时探讨百度快速排序的深层运作逻辑。
自2019年10月至今,百度对快排的整治从未放松,码迷注意到采用采集与快排结合方式的网站全部被影响,超过七十天仍未恢复。
可以说百度这次对快排并非导致你的快排失效,而是转化为惩罚机制了。
为了核实该推测,该爱好者特别准备了一份快速排序的代码,对其进行了仔细的探究。
百度、谷歌的算法不断更新,因此,既有的策略方法难免会失去作用。
没有任何算法是一成不变的,也没有任何算法是绝对停滞的。
但是百度在变与不变之中,它的思想、方针、策略,都按照用户感受这个准则持续进行调整和改进。
百度与谷歌的不同
在明白点击统计排序系统之前,码迷向来如此,从线上案例现象归纳SEO法则,从SEO法则研究百度搜索算法核心,从百度搜索算法核心研究切实可行的SEO方法。
我们以“SEO优化”和“SEO 优化”这两个搜索词为例,它们之间仅有一个空格不同,来观察百度搜索结果的区别。
如图所示,区区一个字符的差异,却导致多数搜索结果截然不同。
按照道理来讲,这两个词应该结果是一致的才对.
码迷向百度方面进行了咨询,百度技术人员承认其算法表现相当糟糕,码迷觉得这或许就是百度系统存在缺陷的体现。
我们再来看看谷歌,根据下图,可以观察到谷歌针对“SEO优化”和“SEO 优化”这两个搜索词所展示的结果,仅广告部分有所不同,其余内容几乎完全相同。
对“SEO优化”和“SEO 优化”这两个搜索词进行观察,发现前者被点击的次数远超后者,而后者获得的点击量相对较低,这种现象造成了百度上两个页面之间显著的排名差别。
与谷歌不同,谷歌不会将点击数据直接用于排序算法,因此其搜索结果更加稳定,不容易受到点击行为的影响。
不同平台搜索到的内容有别,这反映了各自系统运作逻辑有别。
这个算法差异,就是点击,就是百度的点击统计系统。
一、百度点击排名系统的构成
百度点击运作机制,业内人士主张规范表述为百度点击数据评估体系,该体系由四个核心环节构成,分别是数据获取、数据核算、数据评级以及数据防伪,整体运作流程十分周密且高效。
首先,点击收集模块
百度统计点击,核心统计搜索结果的点击量,所述点击量等于点击网址次数加上点击文本次数。
也就是说,点击标题、点击描述摘要,都算点击。
其次,点击统计模块
百度点击统计指的是什么,百度会从数据记录里调取某个时间段的鼠标点击记录。
鼠标点击记录里包含用户身份信息,所点链接地址,以及点击链接的时刻,根据搜索结果的链接地址和鼠标点击记录,计算搜索结果链接地址被点击的频次。
部分时段能够按照要求设定,例如每日、每七日或每三十日等,这三个项目十分关键。
重点1:用户标识
在某个重要的集会上,李彦宏也发表了看法:国人比较乐于接受新事物,甘愿牺牲个人信息来换取生活上的便利。
什么是用户标识,简单说就是用户类型、IP类型、终端类型。
百度对使用者、网络地址、设备类型进行极为精细的区分,无论是短期访问者还是正式注册者,有时仅通过一个网络地址就能识别出具体个人。
百度真的是这么干的。
当前流通的许多快速排序系统,几乎全部依赖随机生成的cookie来模拟用户,依据百度的判断,这些用户都属于短期且临时的性质。
一个网站的用户全都是临时短期用户来的,百度信你个鬼啊。
重点2:周期性统计
另一个关键之处在于周期性统计,大家有留意到吗,先前一天内达成100次点击,和五天内完成100次点击,其结果并无区别。
重点3:每次点击均有日志
你今天使用快速排名方法没有被百度检测到,不代表明天百度就完全无法察觉,因为你的网站所有点击数据都会被百度记录在日志系统中,而且这些日志数据只会被整理归档,很少会被彻底删除。
当百度认为你的网站存在异常操作时,可以调取过往的详细记录进行审查。如果发现可疑情况,通过检查历史数据就能得出结论。
其次,点击反作弊模块
该部分内容在《》文献中已有详尽阐述,关键专利为《CN2.5 用于处理点击行为数据的方法和装置》,相关资料可前往码迷SEO的QQ群获取,码迷方面在此不再赘述。
码迷表示,快速排序的反作弊系统是2019年年中才启用的新系统,百度算法工程师确实投入了大量精力,才研发出针对快速排序点击的反制措施。
但是,百度这个反作弊系统并没有完全消除点击作弊现象,它本质上只是一种补充审核的算法。
主要有以下2个流程
流程1:点击数据聚类
在网站实施刷快排点击行为后,百度并不会立刻察觉,而是要等到一段时间(据码迷估计大约是七日上下),当设备特征、用户浏览轨迹以及网址经由人工智能分析,产生关联模式之时。
流程2:作弊识别判定
你网站用户的群体特征,同百度事先设定好的好几个“非作弊数据组”、“作弊数据组”进行对照,一旦对上某个作弊组,麻烦就来了。
最后,点击排序模块
点击排序,就是算各个搜索结果的权重值,百度也给出了公式哦。
不过一些人说看不懂就不想看了。
应当仔细研读这个公式,我们只关注其中的因子,至于内部运算的细节,那并非关键所在。
能够明白,点选分数同使用者鼠标点选频次为正关联,同整个网络该关键词点选频次为负关联。
也就是说,你相比其他对手,进行搜索指令的频次更多,所使用的核心词被选中的比例更大,因此你在评分体系中的点击得分就会更优。
那么,怎样才能迅速获得排名,部分学员沉迷速排却得不偿失,这涉及三个层面的因素。
此篇为SVIP会员专属文章,目前仅展示部分内容,若需阅读全部,请升级至SVIP会员身份
本篇首发于,同步发布于公众号”码迷SEO“。
本平台可帮你识别五种网页常见问题,包括原创内容未获排名、关键词分布欠佳、页面核心内容分散、邻近词汇量不够以及邻近词汇分布不均,加入QQ群734299959可免费获取软件试用,以便获取更多信息。
文章评论