nofollow影响的是啥?不能瞎搞哈?的基础知识
我们先从上一张图开始:
上图相信大家都很熟悉,基本都看过。 但很多人好奇这东西是怎么做到的? 有没有非常先进的技术?
今天翻一本小书的时候偶然看到的。 我只是花了半个小时研究了一下,发现原理其实很简单,SEO的基础知识都用上了。
上面的截图显示了三种不同的操作方法,这里一一说明。
先看第一名,点进去看看。 发现这一点就是简单的构造一个搜索链接就可以达到收录和推广的目的。
但你不能只是建造这个东西。 你得让百度蜘蛛发现并收录吧? 该怎么办? 发送外部链接,到各大平台留言,通过消息发送外部链接。 比如下图是简书上的一条留言:
奥利有什么问题吗? 虽然简书nofollow这些消息链接,但并不影响百度的链接发现。 由此我们也可以得出一个结论,nofollow似乎对百度的抓取没有太大影响? 那么nofollow有什么影响呢?
这个标签的意义是告诉搜索引擎这个链接不是作者本人编辑的,所以这个链接不是信任票。 搜索引擎看到此标签可能会降低或完全删除链接的投票权重。
因此,当你在网站中添加nofollow时,你应该考虑清楚添加它的目的是什么? 别乱来。
排名第二的有点意思,我们来看一下:
我们发现点击进入页面是正常的。 首先,有了先例之后,我开始怀疑这个链接是否被操纵了? 例如,有两组不同的链接,但可以访问同一个页面。 一旦有了想法,就开始验证它。 返回首页,点击其他新闻,看看正常的新闻页面是什么样子的。
您是否注意到 URL 的结构有所不同? 当然,这个是最新的。 上一个是 2016 年的,没有 HTTPS。 这意味着 URL 可能已被修改。 并且原来的一组 URL 仍然可以访问。 于是我就修改了一下,发现确实有效。
不过,这并不能验证为什么要改标题,因为这种方法目前还是相当流行的。 其他各大网站也都“成功”。 看起来像快照劫持,但快照劫持需要入侵服务器并修改文件响应。 按理说,像搜狐、新浪这样的大型网站应该不会那么容易被黑客入侵,而且数量也不大。 看看下面的图片:
都是比较知名的网站,只是换了个标题。 目前初步怀疑是外部链接锚文本+301跳转导致的。 细节不是很清楚。 有知道的可以私信告诉我。
我们来看看第三种方式,假关键词标签页。
都是网易标签。 打开它们看看:
404来了,看到了一长串数字。 我头疼。 为了学习的目的,我会继续深入钻研,看看能不能发现什么。 我们先来看看普通的标签页是什么样子的。 直接找子栏目列表页看一下:
这些是关键词。 向上移动鼠标,您将在左下角看到它们的链接。 这里整理出来贴出来给大家看看:
# 刘涛
http://ent.163.com/keywords/5/1/52186d9b/1.html
# 鬓边不是海棠红
http://ent.163.com/keywords/9/1/9b138fb94e0d662f6d7768e07ea2/1.html
# 清平乐
https://ent.163.com/keywords/6/0/6e055e734e50/1.html
# 塞上风云记
https://ent.163.com/keywords/5/5/585e4e0a98ce4e918bb0/1.html
正如你所看到的,链接模式是这样的:
https://ent.163.com/keywords/{加密ID1]}/{加密ID3]}/{加密ID}/1.html
我们可以总结一下网易标签链接构成的特点:
1、关键字后面的两个数字目录是加密关键字,第一个和第三个字符。
2、加密关键字的长度与关键字的字数成正比
下一步就是研究它的加密算法。 一般来说,要了解加密算法,首先要了解字符串的长度和特征,这里不再赘述。 看到加密后都是小写数字和字母,而且字母只出现了a/b/c/d/e/f,结合加密后的长度验证,得出这是一个简单的16位加密:
可以看出,1个汉字对应4个数字的加密,所以这是16进制加密。 十六进制占用4个字节,所以刚刚好。 但这些汉字是如何转换成数字的呢? 如果熟悉编码的话,就会知道一个汉字有4个数字,这就是Unicode编码的十六进制表达。 只需轻松切换即可。 这里补充一下,由于字母转成unicode编码的十六进制,结果是两位数,所以需要等宽对齐到4位。
一旦有了想法,就该验证它并开始编写代码:
验证成功后,封装成一个函数,方便调用:
def crypto_tag(tag_name):
if not isinstance(tag_name, str):
return ""
cpt_str = ""
for t in tag_name:
cpt_str += f"{ord(t):04x}"
return cpt_str
就是这么简单。 然后批量生成关键字链接并用它们发送外部链接即可:
真是太棒了。 不得不说,黑帽子的制作技巧实在是太棒了。 我不禁佩服他们。
文章评论