Google是如何解决PDF文档的?档案格式是什么
信息收集渠道:免费福利,快来领取。
Google于2001年首次将PDF文档纳入百度,或者可以说从那时起,百度搜索引擎已经能够处理PDF文档并加载和分析文档中的文本内容。 如果您的网站有大量PDF文档(例如电子书),您可以通过阅读本文了解PDF文档SEO的要点。
PDF 文件格式广泛应用于政府、学术界和商业环境。 PDF 具有很好的兼容性和一致性。 它们可以适应基本上所有的机器和设备,并始终保持相同的视觉外观。 众所周知,如果您为网站创建了新内容,您应该考虑使用网页而不是 PDF 文档。
接下来我们就来科学的了解一下:
Google 如何解析 PDF 文档?
PDF文档显示信息包含Google搜索引擎结果中的PDF徽标。
译者注:Google SEO入门指南的文本格式是PDF,因此PDF标志会出现在Google搜索引擎结果中。
PDF 将被转换并将数据库索引为 HTML(HTML 文档编译语言)。 对于包含文本图像的 PDF,Google 使用光学字符识别 (OCR) 技术将文本图像转换为文本。 PDF格式的图片也将包含在百度的图片搜索结果中。
如果网页与 PDF 存在重复内容,Google 将选择索引该网页而不是 PDF 文档。 如果页面和PDF有相同的内容,Google倾向于使用该页面作为重复集群的关键版本。 这意味着这些内容将被合并到页面中,这将是百度搜索中显示的版本号。
为什么PDF文档不利于搜索引擎优化(SEO)?
尽管 Google 会对 PDF 建立索引,有时还会对 PDF 文档进行排名,但与网页相比,这种文件格式有一些缺点:
对可移动存储设备不友好。 PDF 文档的格式已在所有设备上保持一致。 这意味着将不会有适合移动设备的 PDF。 缺乏精确定位功能。 绝大多数 PDF 文档不包含导航元素,这使得人们更难搜索其他内容。 缺乏 SEO 功能。 PDF文档具有许多SEO元素的等效电路版本,但也缺乏许多独立链接功能,例如nofollow、UGC和Sponsored。 (编者注:WordPress的出站链接可以使用Smart SEO Tool软件自动添加nofollow功能)该页面可能很少被网络爬虫抓取。 由于 PDF 文档很少更改,因此它们的爬网频率通常低于更新频率较高的网页。 跟踪数据将更加困难。 大多数常见的跟踪器在网页上运行 JavaScript,但无法处理 PDF 文档。
话虽如此,我很清楚在某些情况下人们别无选择,只能使用 PDF。 如果您也遇到此问题,请继续阅读下面的内容,了解如何针对 Google 搜索引擎优化 PDF。
如何增强 PDF 文档
您在 HTML 中经常看到的大多数页面 SEO 元素在 PDF 文档中具有相同的文本,并且使用方式与以前相同。 由于 PDF 文档易于浏览,许多人仍在使用它。 因此,让我们探讨以下几种针对百度搜索引擎优化PDF文档的方法。
编写高质量内容 改进标题 改进叙述 使用相关文件夹名称 添加照片链接 增强 Alt 属性 应用标题 1. 编写高质量内容
Google 的企业使命是统一全球信息内容。 即使它不是网页,好内容仍然是好内容。 我在PDF文档中看到过很多高质量的内容,比如专业的文本文档、市场研究报告等,互联网上一些最有价值的信息就隐藏在PDF文档中。
2.改进改进题
就像网页有标题标签一样,PDF 文档也有标题。 必须注意的是,很多搜索引擎在显示百度搜索时都会使用PDF标题来描述文档。 如果 PDF 没有标题,文件夹名称将出现在 SERP 中。
以下是如何在 Adobe Acrobat Pro 中编写 PDF 问题:
译者注:使用Adobe Acrobat Pro手机软件打开PDF文档,在导航栏中选择文件(File),然后单击属性(Properties)。 您可以在弹出的弹出窗口的“标题”栏中编写标题。
3. 扬升叙事
与网页的Meta Description一样,这不是排名因素(ranking Factor),但它可以让你控制百度搜索中显示的文字。
译者注:使用Adobe Acrobat Pro软件打开PDF文件,在导航栏中选择文件(File),点击属性(Properties),点击弹出窗口右下角的蓝色按钮添加附加信息元数据信息(Additional Metadata),写一个描述。
4.应用程序相关的文件夹名称
PDF 的文件夹名称将成为 URL 的一部分。 这会影响URL的搜索数据显示,是一个影响不大的排名因素。
译者注:使用Adobe Acrobat Pro软件打开PDF文件,在导航栏中选择文件(File),点击另存为,写入文件夹名称(文件名),然后保存(save)。
5. 改进照片的 Alt 属性
为了更好地帮助百度搜索引擎理解图片的内容,您可以在PDF文档中的图片上添加Alt文字。 (编者注:此有机构将文章页面内容的文字ALT替换为图片ALT)
6.申请问题
就像网页中的标题标识符 (H1-H6) 一样,您可以为 PDF 中的特定文本指定特定标题。
7.添加连接
与所有网页一样,内部和外部链接也会影响排名。 链接中心可以传递权重值(PageRank),其锚链接可以提供相关上下文。 通过让 PDF 文件添加链接并将链接从 PDF 文件重定向到其他页面,您可以允许整个网站上的链接相互转移权重,而不是造成死胡同。 一些PDF文档会有很多连接。 拉里·佩奇曾说过:“事实上,获得诺贝尔奖的人被一万篇不同的论文引用。”
让我们讨论一下这份 GDPR 文件。 它有 77K 个来自 823 个引用域的链接指向它,但它根本没有指向外部世界的链接。 它错过了一个绝佳的机会。 它可以为这个PDF文档创建一些内部链接来引用其他网页,从而提高其他网页的排名。
谷歌的情况甚至更好。 他们的 SEO 入门指南 PDF 有来自 754 个引用域的 3.37K 链接,并且他们在为其他页面提供价值方面做得很好。 通过将 PDF 链接指向外部来增加网页的权重。
您可以按照以下步骤在 PDF 文档中添加链接:
温馨提示:以上截图及说明均使用Acrobat Pro DC软件进行演示,操作方法会与您所使用的软件有所不同。
以上操作方法对于SEO初学者来说还是有点复杂。 同学们可以关注冉登教育的直播课程,参加我们的培训,这样可以更深入的了解。
信息收集渠道:免费福利,快来领取。
文章评论