寻找伪原创工具的seo人员并没有真正理解原创
前言
从宏观的角度思考内容,制定内容的标准框架,从而打造内容生产的“流水线”。
问题
如果在关键词挖掘工具中随机展开一批“seo原创”长尾词,可以发现“伪”这个词占据了总词数的50%以上。
可以发现,很多人并不真正理解搜索引擎认为什么是“原创”。
大多数刚开始寻找“优质伪原创”工具的SEOer。 不过,即使伪原创可行,目前市面上也基本没有好用的工具。
网站SEO需要大量的新鲜内容,海量的长尾关键词流量需要大量的“优质内容”来承载。 如何凭空“变”内容,是考验SEO人员能力的重要标准之一。
看法
在谈具体的SEO原创策略之前,我们先明确几点。
1:为什么说很多寻找伪原创工具的SEO人员并不真正懂原创?
首先,“内容”不仅仅指文章,还包括图片、视频、音频、文件。 这些都是内容,所以原创内容并不意味着发表别人没有读过的整篇文章。
以照片为主题
专注于视频
专注于音频
以文档文件为主体
其次,我们一般认为原创的主要对象是页面上的“主要内容”,但实际上“主要内容”不一定是具体的内容(文字、图片、音频、视频),它可以是组合体信息:
包含大量信息的列表页面
最后,在搜索引擎眼中,“原创”背后的目标应该是“有价值的新页面”,它包括页面的各个角落和各种元素,而不仅仅是页面的“主要内容”。
2:比大量同质页面更伤害用户的是废话文章
我们可能会在搜索结果中看到一些高度同质的排名页面:
topN 都一样
甚至它们的“标题”和“主要内容”也基本相同,都是从多个网站收集的结果。
但这对搜索引擎和用户影响不大,因为只要你有需要的东西,搜索引擎可以根据策略选择收录或丢弃,收录后还可以选择隐藏或显示。
但如果再进一步搜索,往往会看到大量的“废话文章”:
由人工智能撰写
我们可以想象用户的搜索体验,这是搜索引擎需要尽量避免的。
因为用户“换搜索引擎”的行为是所有互联网产品中成本最低的行为。
日常生活中,我们搜索百度、谷歌时,可以评价AI写的“伪原创”、“同义词替换”、甚至“无意义文章”的比例。 我们可以自己估计频率。 频率应该很低。
3:如果你的努力没有被列入或排名靠前,不要感到委屈。
原创性是搜索引擎的手段,但不是目的。 搜索引擎的目的是正确连接人和信息。
用户并不关心对他们有利的内容是否是该站长专有的。 如果内容不能满足用户的搜索需求,用户第一个骂的人不是站长而是搜索引擎。
因此,搜索引擎不负责原创性,只负责用户需求。
其次,很多事情没有办法要求原创性:
制作一个“天气预报”网站:
天气预报 - 来源 2345
如果数据和别人的不一样,不用担心,一定是我们错了。 这个东西的数据源大家都是一样的。
《贝多芬N号交响曲总谱》:
贝多芬第九交响曲
用户正在寻找的是贝多芬写的文案。 搜索引擎总不能为了原创就要求我们写一段话吧?
如果我有一首我自己编的音乐,说是贝多芬交响曲,搜索引擎会给我一个更好的排名,因为我是原创的,然后把正确的乐谱推回来怎么办? 这合适吗?
最后,我们必须考虑饱和度和天气预报。 这些对于每个人来说都是一样的。 只要有几个权威的可以给用户展示的就可以了。 为什么搜索引擎会收录这么多提供相同服务的网站? 即使包含在内,也不一定要排名。
其他一切也是如此。 当某种类型的内容搜索引擎的数据库中已经有足够的数据来处理用户搜索时,就不需要包含太多相同的网站。 有些事情基本上都有标准答案,新的问题也是如此。 内容。
4:即使不是原创也没关系。 仅仅因为它不是原创并不意味着它是错误的。
你做一个乐谱网站,我也做一个乐谱网站。 几位著名艺术家的作品分数都是一样的。 为什么你把它当作原创来发表,而我把它当作合集来发表?
歌词、图片、音乐等等也是如此!
所以,抄袭也没关系,只要整合资源,在满足用户需求的同时,还能提供其他附加值。
5:关于原创
这几年我时常听到这样的说法。 我觉得没有什么原创的概念,更谈不上测试。
对此,我首先对技术非常怀疑。 毕竟想要算出一个“度”,需要大量的样本,而且数据是科学的。
其次,搜索引擎不可能计算出这样的内容价值。 原创性60%的文章比原创性55%的文章高吗?
ps:有兴趣的朋友可以了解一下几种搜索引擎网页去重算法。
综上所述,在为搜索引擎创建内容时,应将内容视为可检索的有价值的资源。 基于此,关于“创造原创”问题的思考就变得非常广阔。
因此,我们当前的方向应该是:在正确认识搜索引擎原创性的基础上,创造大量“具有检索价值的新页面”。
战略
以下方法仅是我个人以往的经验。 这些方法根据不同的行业有其适用性。 仅供参考,发散思维!
策略一:挖掘具有可变属性的同质需求
这个东西有点抽象,不太好描述。 让我举一个例子:
福建XX大学简介
从这个关键字我们可以看到“福建XX大学”,它是一个变量,从中我们可以想到:
XX大学简介
那么全国有多少所大学、学院、学院,甚至高中、职业学院呢? 我们可以列出有多少个同质需求,因为如果有人搜索A学校的资料,必然有人会搜索B学校的资料。当达到一定程度时,必然会出现模式。
由于用户正在搜索大学简介,因此我们可以创建一个有针对性的页面。
首先,我们需要知道了解一所大学需要哪些信息。 如果你不知道,你可以看看那些大学的官方网站,也可以分析竞品网站和关键词挖掘。
这只是一个例子,所以我们不会深入讨论。 我们可能知道学校具有以下属性:
名称、简介、专业、师资、场地、报名手册等等,甚至每个学校都有自己的更新、信息、评价。
然后我们可以为每个学校创建一个这样的页面:
学校主题原型
我随机画了一个原型。 我们实际上可以看到,这是一个“标准”页面,是按照一定的标准进行格式化的。 其中的每个块都是一个变量,并根据具体学校而变化。
这样看起来像主页的页面实际上只是一个页面。 其特点是:
有多少所学校就有多少这样的页面。 我们只需要要求相关人员收集数据,对产品提出要求,让技术按照规则进行展示即可。
这样的页面能说是抄袭吗? 显然不是,有什么价值吗? 当然有,而且不存在刻意“伪原创”的情况。
相信有的朋友读完本文后会发现,生活中类似的需求还有很多,比如:公司
XXXX网络科技有限公司
当我们在百度中搜索这个词时,我们可以看到“天眼查”、“七查查”、“七信宝”、“爱七查查”等常见网站。 页面大概是这样的:
XX公司
然而,在百度推出“爱其查”之后,其他同类产品的排名较低。
一个公司就像一所学校一样,有很多属性。 当这些属性整合在一起时,就成为一个页面,可以根据不同的公司创建不同的页面。
毕竟,这是一种对象。 随着时间的推移,越来越多的名词会人为地出现。 这数千个名词会与其他固定词缀组合在一起,形成同质需求,形成海量的长尾流量。 。
我们要做的就是挖掘出这种流量(如果有的话),然后创建有针对性的“格式化”页面。 此类页面将始终有可以更新的新内容。
几年前我接手一个网站,发现一个竞品有这样一个占流量比例很大的页面。 我们按照同样的方法,首页上大概有几万个目标词。 这个部分每天都会带来 3,000 多个 IP(我猜是这样)。
此类流量的特点是长尾、内容容易生产、个体竞争度低、体量大。 有这种流量的网站有很多,比如58、赶集网等。
城市+社区名称+房源信息
这样可以组合很多长尾词。 你可以想象全国有多少个社区名称。
如果我们行业不存在这样的流量,那么可以考虑第二种方案。
策略二:根据搜索词批量创建页面
这是优酷的官方网站地址。 在百度上搜索一下,你会看到:
搜索结果-爱站
而这个页面其实就是爱站上搜索目标域名“综合权重”的页面:
综合重量
该页面的唯一地址是:
是固定的,后面的部分就是我们检索的目标域名。 这里其实就是爱站搜索框当前的搜索词。
它的标题也是固定格式的:
综合查询_优酷-这个世界很酷_爱战网
域名和标题是变量。
换句话说,这实际上是一个搜索结果页面。 用户在百度搜索的具体网址就是爱站的长尾流量词。
那么同样的事情:域名有几千万个以上?
有多少个域名,爱站就能拥有多少个这样的页面。 无需等待用户搜索,也无需等待百度找到并抓取。 爱站的流量管理员只需要让技术导出现有数据库中存在的页面的副本即可。 域名,则:
批量与此链接结合,通过站点地图或界面直接将这些链接提交给百度。 好处是:
每次找到域名,爱站就会添加一个新页面。 该页面展示了爱占自家产品设计的网站的各种信息。 原则上:每个页面都是原创的,而且都是自动化的。
但不要看网站。 一般只有站长自己检查,更不用说其他几个人了。 这数以万计的网站本身就是一组可怕的长尾流量。 很多腰部以下的网站,只要你搜索一下,就能在首页找到。 到了爱情站的身影。
而且,爱站网产品中还有很多其他的搜索框,也是同样的形式。 也就是说,爱站本身根本不生产任何文章,而是依靠数据库中的数据,以各种形式组合成数千页。 。
从效率上来说,这种策略自然会对那些辛勤耕耘的原创网站造成降维打击。 没有人规定信息的形式一定是文章。
但存在一个问题,就是爱站上很多搜索都是以URL作为“搜索词”,根据具体目标URL的相关数据呈现搜索结果,准确且单一。
那么就会出现一种情况:爱站数据库本身肯定已经包含了这个URL,才可以查询到结果数据。 否则,该页面不应该存在(您甚至可以想要存在)。
这样的话,虽然网址有几千万,但是你没有的数据也不能乱用,所以理论上是有限制的(理论上,其实爱站或者5118等工具的现有数据是非常巨大)。
这导致了另一种形式:
爱站的这种精确而单一的搜索形式对应着另一种形式:模糊而复杂,这是百度等搜索引擎的典型特征。
他们不使用目标 URL,而是使用短文本作为搜索词。 可以将短文本切词并与目标数据进行模糊匹配。 呈现的结果通常不止一个。
这里我们以5118的长尾词挖掘工具为例:
5118长尾词挖掘
以下链接是此页面的链接:
和以前一样,上一段是固定格式的。 “b125xxxxxx”段落是相应的搜索词。 在数据库中,它们可能是 ID 或编码字符串。 这不重要。 简而言之,它们与搜索词具有一一对应的关系。
我们来看看下面的搜索结果:
长尾词搜索结果
首先,有多个项目。 如果你搜索,你可能会匹配到一项,你可能会匹配到几十万项,甚至可能会找到0项。 (请注意,虽然是0条,但原则上也可以是一页,只要你愿意。)。
其次,它是模糊的。 它不像爱站查询URL那样是非0或1的结果,这意味着很有可能找到一些结果。
然后我们将此处的搜索词替换为上面的 URL。 原理其实是一样的:能找到多少个长尾词,就可以批量生成多少个“长尾词搜索结果页”。 这些都是一页一页的原始页面。 然后将这些页面链接提交给百度。
ps:有些网站的搜索结果数据可能是使用ajax加载的,所以搜索引擎会看不到。
未来流量能否提升取决于长尾关键词搜索量和排名竞争,但这样做之后,5118网站在第三方站长工具平台的“权重值”极有可能快速提升。
重量
因为这些站长工具平台统计流量的方式是根据单词的搜索量和具体排名位置来计算预估流量和权重值,所以我们将这些批量生成的页面提交给百度并被收录后,那些排名极低的页面搜索量 一般可以查看长尾词的排名(就是虽然可能没人搜,但是你搜的时候就会看到)。
当一次性添加这么多长尾词排名时,这些工具在批量查询时会发现,在更新“权重值”和“预估流量”时,计算结果会因为这些新数据而被拉高,虽然真实的流量可能没有那么多。
ps:以前有这个套路。 自己编个词,花50块钱给它买个百度索引,继续看下去索引就增加了。 但没有人与它竞争这个词,所以它必须排在第一。 爱情通过网站等工具进行统计后,通过将这两个数据结合起来,相信该网站会获得大量的搜索流量,然后权重值就会增加,然后向人们展示谁不懂就卖高价。
我们想象一下:5118是一个全行业的长尾词挖掘平台,也是一个拥有数亿长尾词数据的平台。 换句话说,任何词都可以作为这个搜索页面的流量词,并且它没有任何产品或商业含义。 任何单词都有很大概率可以在这个工具中搜索到相似的单词。
只要他们愿意,他们就可以根据不同的长尾词生成各种页面,并在几分钟内提交给百度。 规模可以是百万,也可以是千万,一下子就会有这么多的原创页面。
当然,5118还是有产品伦理的。 他们不一定会这样做,而且如果这样做,他们也不一定会使用所有垃圾邮件词。 然而,一些专门处理垃圾邮件网站组的网站可能不一定这样做。
大批量采集目标领域的各种文章作为底层数据,大量挖掘目标领域的各种长尾词,然后用长尾词搜索这些文章来匹配一堆页面来争夺流量。
总的来说:我猜5118长尾词挖掘版块的页面搜索流量占整个网站的比例应该是比较高的。
最后,对于搜索结果为0的页面,如果我们还想展示给用户(其实这就是很多网站消耗流量的原因,有大量页面根本没有结果),作为SEO人员,怎么办?我们应该考虑采取什么策略来应对它? 这个问题就留给大家思考一下。
现在,如果我们的网站不提供搜索引擎怎么办?
策略 3:聚合页面
很多人可能听说过聚合页面。 其中一些称为主题页或选项卡页,其含义相似。
所谓聚合页面,是为了防止一些基础薄弱的朋友看不懂。 下面简单解释一下逻辑:
假设我们的网站数据库中有一批减肥相关的文章数据。 既然文章有标题,我们此时就挖出了一个关键词:减肥健美操教程
然后把这个词存入数据库,搜索文章,可以找到:
聚合原型
这样的页面聚合了很多关于“减肥健美操教程”这个长尾词的相关内容。 由于是通过搜索匹配得到的,所以这些数据标题都会命中目标长尾词的根词缀。 这与上面的策略2相同。 结果其实是一样的。
这样的以目标长尾词为主关键词、内容相关度高的主题页在参与排名时会相对具有竞争力。
有时由于技术原因或产业结构,我们的网站不一定向用户提供搜索框。 这种情况下就没有办法通过上面的方式添加新页面了。
但本质上,搜索无非是在前端提供一个搜索框,并在后台向前端返回数据。 所以即使没有搜索框,我们也可以在后台完成,然后显示结果页面。 效果其实是一样的。
SEO人员只需挖掘长尾词,规划页面结构,然后提交给产品技术生成,最后提交链接给搜索引擎。
其实我们在搜索的时候经常会看到聚合页面。 有技术的朋友会发现,典型的有:csdn、脚本之家、腾讯云社区、阿里云社区。 这些是一些烦人的网站。
csdn
这是他们的聚合页面:
Tags,标签的意思,是聚合页面的链接目录,后面的一串字符串是关键字编码。
我们可以从爱站看到标签目录的排名数据:
爱情站-csdn
这只是爱站收集到的排名靠前的数据。 还有很多没有收集到。 这些词都在首页,大大小小的长尾词贡献着各种流量。
csdn有大量技术相关的文章,技术关键词都是非常复杂的组合,所以他们可以挖掘很多长尾词,生成很多这样的页面。 可以看到它的标题只对应长尾词,只是为了给它最大的权重来竞争。
但说实话,此类页面的价值值得商榷。 可以说,这些都是为搜索引擎做的页面。 很难说用户是否能从这些页面中找到目标内容。
CSDN还不错,但腾讯云社区和阿里云社区(一下子找不到)就更恶心了,经常出现不相关的结果,而且整个页面只有一个长尾词,这是故意做的。
当你因为一些技术问题而在百度、谷歌上苦苦寻找结果时(无能为力,不用想),他们时不时就会出来跟你凑热闹,点击后什么反应也没有在上面。
接下来,如果您的网站没有那么多数据量怎么办?
策略四:媒体转移或二次创作
这其实很容易理解。 更改内容媒体。 不过,有一点就是要注意版权风险,尽量不要做出会侵犯他人的内容,给自己带来法律风险。
并不是每个行业都有海量数据和可以操作的结构化数据。 当我们在数据量上没有优势的时候,我们就要考虑如何适当地重新创造一些现有的行业数据,形成新的有价值的数据。 数据。
有的朋友看到这个觉得这是假原创!
可以这样理解,但它不同于常规的替换单词和段落的操作,而是为现有数据添加不同的或更多的价值。
这次之所以写这篇文章,是因为看到了一位叫“刘小派”的老师,他也是业内的资深玩家。 他在盛彩分享了一个SEO原创内容制作策略。
挺有趣的,你会觉得他分享的方式很科学,比如:
利用国外各大网站的官方api接口获取海量数据、通过相关协议对数据进行优化(比如无商业限制)、利用GitHub的新技术将多媒体文件转化形成新的内容等。
这些方法都是健康、科学的方法,同时也避免了法律问题。 相对来说,早年我们做类似的操作时,比较粗糙,没有想那么多。
以下是一些传播思想的建议方法,即所谓的媒体传输:
视频内容 -> 文本,反之亦然
音频内容 -> 文本,反之亦然
图像->文本,反之亦然
文档->文本,反之亦然
翻译:国内外文本翻译
这些是一些较常见的。 之所以可以这样做是因为:从技术层面来说,很难分析它是否是原创的,因为机器甚至可能无法正确识别多媒体文件的所有信息。
这不仅仅是一个搬家的问题,抛开版权问题,这实际上是一个内容优化的过程。
例如,视频可能看起来比文字更容易,但对于渴望查找信息的人来说,毫无疑问,文字内容更容易快速获取他们需要的信息。
一堆难以理解的文字,用图片+注释的形式或许能更好的表达。 俗话说,一图胜千言。
我们并不总是对阅读大量书籍并以音频形式表达它们感兴趣。 这就是像喜马拉雅这样的应用程序出现的地方。
至于在看不懂英文的情况下需要将其翻译成中文,很多时候是比较直观和迫切的。 只要能够解决或者避免版权问题,这样的操作就有价值、有意义。
我们还可以在过程中添加一些元素,让内容表达更有价值。 例如,对于一篇难以理解的文章,我们在转成视频时可以在适当的地方添加更多的解释或理解。 对于段落混乱的文章,我们可以将其打包成独特的文档供其他人下载等。
csdn-文档下载
上图是csdn的付费文档下载页面。 这么大的页面中,只有这一小部分是主要内容,这才是这个页面的核心价值。
问题是:搜索引擎不可能知道文档的内容是什么。 对于搜索引擎来说,这就像一个资源下载页面。 是原创的吗? 很难说,至少我不能确定它是假的。
最大的问题是:很多人认为页面上的信息越丰富,就越有价值。 事实上,情况并非如此。 信息的价值是相对的,信息的价值与其大小无关。 就像战争时期,一句话只有几个字,却可以卖到上亿。 本质上,信息的价值取决于是否需要它。
对于搜索引擎来说,就是把人和信息正确连接起来。 无论信息的形式、大小或长度如何,只要是它所需要的,就是好信息。
所以对于有需要的用户来说:这仍然是一个高质量的页面,所以有多少文档就有多少页面。
媒体传输应该是很多人都会做的事情,但在做的过程中,往往做得简单粗暴,没有考虑平台规则和用户体验,也没有做任何适当的优化。
顺便也说说收藏吧:
收藏其实无所谓。 对于这件事,在搜索引擎面前,或多或少有着“窃钩者,窃国之贼,主君”的含义。 采集一点点数据无非就是一个采集站。
但是当你收集的数据量已经是行业顶尖的时候,你基本上有了这个行业的数据,也基本上可以有合适的内容来满足涉及到的需求,那么意义就不同了,搜索引擎就得考虑一下。 你的价值在于你能稳定、全面地贡献内容。
这就是脚本之家、个人图书馆和大量文档站点等存在的原因。
即使我们知道自己是一个采集网站,除了特殊算法之外,一般搜索引擎不会针对我们。 没有人知道其他网站什么时候会随时无法访问,我们可以替换它们。 无论如何,不会损害搜索引擎的用户。 经验。
当然,如果我们在收集过程中能够更好地结构化数据,更好地链接相关资源那就更好了。
二次创作其实也是类似的。 比如赚钱的刘小派老师就举了一些例子:
对图片进行一些风格变换、抠图、添加描述标签等。
例如,我认为:
优化视频质量、调整不同风格的音频色调、优化图像大小和质量、对文档进行一些格式处理等,或者这些操作的组合。
最后,所有媒体传输或二次创作都必须基于机器自动化,这样才能看到规模经济。
策略五:花钱
在正确理解了行业内容并对网站的变现方式有了正确的方向之后,那么付费制作原创内容可能是最正确的方式。
无论如何,在当前的环境下,搜索引擎能够收录的优质原创始终很少。 如果一个网站能够持续产出原创,那么只需要配合一些基本的SEO优化方法,就应该能够带来不错的效果。 流动。
重点是:想想现在搜索引擎比较缺乏的内容,这需要一些统计分析。
花钱制作原创作品的成本其实并没有想象中的那么高。 毕竟只是原创作品。 我们不需要写高考论文。 市面上的作家千字应该不会太便宜。
相对于网站后期能够带来的价值来说,这笔投入其实是一次性投入,后期会慢慢抵消。
延长
梳理完一些常见的内容制作策略之后,就到了付诸实践的时候了。
带着这些想法,在下一篇文章中,我将简单演示一个批量制作短视频的案例。 这个案例是因为很多人已经看到抖音上有很多人做的很好的账号,所以我就用自己的尝试这个方法来生成视频。
这个演示旨在给大家一个参考,了解如何理解内容、什么样的整合是有效的、以及如何借用工具。
ps:根据写作情况,可以考虑付费。
最后,有些朋友可能是公司的SEO人员。 上面讨论的一些方法可能感觉不能用。 这是因为受公司业务和产品框架的限制,很多SEO人员无法擅自进行更改。
毕竟老板总会给你一句话,让你凭空成为第一,然后什么都不提供。
然而,没有办法解决这个问题。 为什么SEO在公司慢慢消失了? 很多时候是因为各种限制。 以上策略都比较针对你所运营的网站,你可以根据自己的喜好进行测试。
另外,我想用这些策略来纠正,但没有方向。 很多时候,可能是我收集的数据不够多,没有发现目标行业的特殊流量。
最终分析,我们必须找到产生独特内容的方法,同时我们必须了解哪些内容从技术或平台的角度来看是独特的,哪些内容可以合理地相同。
文章评论