研究的方法有两种:正推和逆推0303
研究方法有两种:正向研究方法和逆向研究方法。
03
积极推荐
前向预测就是假设一堆条件,逐一测试,看是否能达到预期的结果。比如快速队列的开发,多是前推,需要大量的测试。
逆向推理是分析现有的结果并找到其中的共同模式,这需要大量的观察。
只是研究一下百度SEO排名规则,正向推广的门槛极高。
例如,很早以前,我抓取了1000个单词(同根词)的搜索结果,并下载了每个单词的760个结果对应的所有网页。 最后我记得不到40万篇文章,接近50%的搜索结果都是重复的。
然后我把这些网页导入到xunsearch(一个开源搜索引擎,不是说这个好,只是我当时只知道这个,并不知道elasticsearch的存在),建立了倒排索引。
同时我还整理了默认词库,让这些行业词的分词更加准确。
我的意见是:
第一步:同时在xunsearch和baidu中搜索一个词。 通过调整xunsearch搜索参数,调整出与百度非常接近的结果。 例如,排名前 10 的文档大部分是相同的,但顺序略有不同。
步骤2:我将修改我的网页内容,将其推送到xunsearch以更新索引,然后再次使用xunsearch进行搜索。 如果能找到前10名,则在线网页将按照此修改上线。 如果没有出现,则修改其他地方,直到出现在Top 10中。
理想很丰满,现实很骨感。
无论如何,第一步还没有迈出。 毕竟商业搜索引擎和开源搜索引擎在很多方面都有所不同。
但这只能代表百度,因为研究其他搜索入口的排名规则要容易得多,比如微信搜一搜、知乎、小红书。 首先,这些平台不存在包容性问题。 如果内容不违反规则,则予以收录。 其次,影响排名的因素比百度少很多。
不管怎样,我被逼着就放弃了。
04
向后
说一下我们当时做的逆向推理的想法。 相对而言,逆向推理比正向推理要麻烦很多。
长尾关键词
很久很久以前,我在建网站群的时候,当时开发的并不是一个可以携带无限个关键词的通用解析程序。 库中有多少个单词,这个程序就会生成相应数量的页面,或者二级域名。
这意味着,如果库中充满了一堆无法在首页排名的关键词,就会浪费系统资源。 毕竟新域名的收录是有限的,自然希望收录的页面是排名概率较高的页面。
流量词在搜索结果中显示时具有四个特征:
第一种可能是这个词竞争性很大,或者是比较敏感的词,比如医疗、保健,所以百度故意将其分流到一些信任度较高的大网站上。
第二种可能是这个词被禁止了,但是百度还没有发现,或者有可能这个词还没有被很多人发现。这个可以根据搜索结果的标题是否完全命中关键词来判断。 如果命中就是前者,如果没有命中就是后者。
第三种是该词为禁用词,已被百度发现并删除。
第四种是普通词语,比如不流行的小说、漫画的名字。
清理排名第一的关键词的方法是找到第一类和第三类词,然后将其删除。
因此,在搜索关键词时,比如爱站导出的竞品网站关键词,都会按照上述方法对关键词进行清洗,清洗后再上线。 相同数量的域名,可实现多25%的流量。
以上就是研究出现在首页概率较高的长尾词的问题。 再来说说核心词的排名。
独立核心词排名
以前有一种刷字的方法。 例如,如果核心词是“SEO”,那么创建的新词会同时被刷,例如“SEO流量经销商”,标题也会更改为这个词。
“适当的刷量比例&延长时间”之后,“SEO”和“SEO流量商”就会关联起来。 “SEO流量商”是“SEO”的搜索意图之一
这样,“SEO流量商”在首页排名后,就会增加“SEO”的点击量,这样核心词“SEO”出现在首页的概率就比直接硬排在首页的概率要高。点概率。
所以之前,当SEO这个词被拉到百度指数或者百度搜索框里的时候,总是出现一些蹩脚的词。
判断网页与核心词的真实相关性(不包括点击权重)
当然,这也不是绝对的,还取决于百度认为网页本身与核心词的相关程度。
比如很多采用快速排名的网站,网页比较杂乱,可以说对SEO不友好。 排名主要基于点击权重而不是相关性。 如果快速排名出现波动,很容易被骗。
为了识别这种情况,您可以在搜索词后添加不相关的符号,例如“华为薪资”。
对于用户的查询,搜索引擎首先会纠正分词和召回中的错误。 纠错过程包括去除杂乱的符号然后进行排序。
但是,“华为工资”。 这个词的排名没有点击权重因素,因为没有人点击这个词。 同时,这个符号对核心词“华为薪资”的相关性排名影响很低,因为每个文档都有一大堆句号。
那么如果你看一下“华为薪资”的排名。 和“华为薪资”,几乎是一样的。 但对比“seo”的搜索结果。 而“seo”,就很奇怪了。
或者,也可以将主题词分开搜索,例如“华为薪资 华为薪资”,或者输入两次“华为薪资 华为薪资”
海量核心词排名
但如果核心词很多怎么办?
例如,某些类型的词根,例如:
很久很久以前,我所做的是:
1)将这些单词全部扔进百度搜索框,并按顺序提取下拉框中的单词
2)计算每个后缀出现的频率
3)选择出现频率最高且标题完全命中关键词搜索结果且搜索结果很少的词缀,作为网页标题的补充
例如,对于{city}公司,标题仅显示“{XX}公司”,这有点浪费,因为有人搜索这个词:
但我们不可能把所有的后缀都加上去,那么问题来了:应该加上哪个后缀才更有可能同时对“{XX}公司”和“{XX}公司{后缀}”进行排名?
全国300多个县级市中,60%+的城市下拉框中都会有“排名”。 事实上,“目录”和“黄页”出现的频率相当高,与“排名”类似,但这两个词缀确实出现的人太多了,即搜索结果标题中完整命中的数量比较多,所以最后用的是“排行榜”,即标题是:“北京公司排行榜”
如此一来,几乎所有二三线城市都上涨了。
一线城市未列出,因为搜索需求太丰富,如:代理、抽奖、转让……
我觉得我在这篇文章的结尾偏离了主题。
GoGo闯入方庄
文章评论