AI 和 SEO 的结合:是福还是祸?

2021-01-21 10:55:18 浏览数 (1)

作者 | Vik Bogdanov

翻译 | Katie,责编 | 晋兆雨

头图 | 付费下载于视觉中国

自成立以来,搜索引擎已经从基本搜索代理变成了基于人工智能(AI)和机器学习(ML)的复杂算法。这些创新技术从两个完全相反的角度影响搜索引擎优化(SEO)空间。

一方面,由于新的基于AI的排名算法能够对元数据执行非常深入的扫描,因此,推广网站并将其推向SERP的顶部变得更具挑战性。另一方面,由于搜索结果的整体质量已显着提高,因此现在更难使用不同的技巧和黑帽操作来操纵它们(尽管仍然有可能在下面向你展示)。

总而言之,人工智能从根本上改变了SEO的方法。让我们深入探讨如何在搜索引擎营销中使用AI,以及精通技术的营销人员如何使用AI更好地实现其目标并改善关键绩效指标。

什么是“ AI技术”?

人工智能技术按照模仿人类行为和能力的能力进行分类。利用这些特征,所有AI技术(现有技术和假设技术)都可以分为三种类型:

1)人工智能(ANI)或较弱AI。

它提供的能力范围很窄。这些系统只能接受训练以执行特定任务。例如Google的Rankbrain,Apple的Siri或Amazon的Alexa。

2)人工智能(AGI)或强大的人工智能。

它反映了人类的能力,具有多种功能,能够解决许多问题并从经验中学习。

3)人工超级智能(ASI)或假想的AI。

它应该超越人类的智力。

到目前为止,ANI是唯一已被人类成功实现的AI类型。

为什么需要机器学习?

机器学习是AI的应用程序,无需明确编程即可自动从经验中学习和改进。ML的出现是对不断增长的数据量进行分析的结果,因此底层算法不会改变,但是用于选择特定答案的代码的内部权重和偏差会发生变化。当然,这不是那么简单。

数据科学家经常将用于实现ML的技术称为算法。算法是一系列分步操作,通常是计算,它们可以在有限的步骤中解决特定的问题。在机器学习中,算法使用一系列有限步骤通过从数据中学习来解决问题。

尽管ML算法是学习的,但是通常很难找到术语“学习”的确切含义,因为有不同的方法可以从数据中提取信息,具体取决于ML算法的构建方式。通常,学习过程需要大量数据,这些数据在给定特定输入的情况下即可提供预期的响应。每个输入/输出对都是一个示例,其他示例使该算法更易于学习。这是因为每个输入/输出对都对应于定义问题区域的行,聚类或其他统计视图。

ML是优化模型的过程,它是数据本身的数学通用表示形式,即使它收到以前从未见过的输入,也可以使其预测或以其他方式确定适当的响应。模型提供的答案越准确,模型从所提供的输入中学习的越好。该算法将模型拟合到数据,并且该拟合过程正在学习中。

机器学习的原理

机器学习的中心思想是,你可以使用算法事先不知道的数学函数来表示现实,但是在查看一些数据后(总是以输入和输出成对的形式)可以猜出它。你可以根据未知的数学函数来表达现实及其所有复杂性,机器学习算法可以找到这些未知数学函数并将其用作内部数学函数的修改。也就是说,每种机器学习算法都基于可修改的数学函数。

根据预期结果和输入数据的类型,你可以根据学习风格对算法进行分类。你选择的样式取决于你拥有的数据类型和预期结果。

使用四种学习风格来创建算法:

监督学习–算法尝试对目标预测输出与输入函数之间的关系和依赖性进行建模,以便我们可以根据从先前数据集中学习到的关系来预测新数据的输出。

无监督学习-使用无标签数据训练计算机。学习数据中的模式后,计算机可以教你一些新知识。在我们不知道要在数据中查找什么的情况下,这些算法特别有用。

半监督学习-在许多实际情况下,标签的成本非常高,因为它需要熟练的专业人员。因此,在没有标签的情况下,半指导算法是构建模型的最佳选择。这些方法利用了这样的思想,即即使未标记的数据组的成员身份是未知的,数据也会携带有关该组参数的重要信息。

强化学习-这种方法利用与环境互动过程中收集到的观察结果来采取行动,以最大程度地提高回报或最小化风险。强化学习算法(称为代理)从环境中连续不断地学习。在此过程中,代理从他在环境中的经验中学习,直到探究所有可能的状态为止。

话虽这么说,AI通过允许系统根据某些概念(如cat示例)分析数千个示例(图像,声音文件,文本等)来识别模式并学习隐式规则,从而绕开了经典方法的错误)

每天,我们必须处理的信息量呈指数级增长。对我们情绪状态的压力也是如此。因此,机器学习已成为人类自动化日常工作,节省时间并提高生产率的必要条件。

人工智能如何在搜索引擎算法中使用?

现在,当我们弄清楚了AI算法如何工作以及一般为何需要它们时,让我们继续进行SEO及其如何利用AI技术。

机器学习的进步推动了基于AI的SEO的发展。尽管自2003年以来一直在探索这一领域,但十年后的第一个重大成就是在2013年推出了Word2vec,这是一种“自然语言处理(NLP)技术,它使用神经网络模型从大型语料库中学习单词联想文字。

两年后的2015年,Google使用Word2vec数据库来构建和启动RankBrain,并将其作为Hummingbird算法的一部分。

RankBrain是一个由AI驱动的自我学习系统,它使Google能够加快关键字类别的验证速度,从而为用户提供与其搜索查询最相关的内容。RankBrain“知道”如何理解文本的含义,如何找到单词之间的联系,学习不熟悉的单词和短语以及如何专门适应请求的国家和语言。

所有这些都使自然搜索结果更加相关。

Google代表指出,与内容质量和链接一样,该算法是现代搜索排名中的第三个重要因素。

好吧,蛋糕上的樱桃是2019年发布的Google BERT算法

BERT(来自变压器的双向编码器表示)也是基于神经网络的NLP学习系统。与其他模型不同,BERT旨在深入了解自然语音。

换句话说,给定上下文的每个细节,BERT应当使机器人能够理解句子中单词的含义。Google使用BERT来更好地了解用户查询,并为他们提供真正相关的结果。

在SEO中使用AI的示例

内容创作

AI已经被广泛用于创建内容。一些内容和SEO专业人员为此使用OpenAI GPT-2模型。

GPT-2

GPT-2是一个基于变压器的大型语言模型,具有15亿个参数,在800万个网页的数据集中进行了训练,其简单目标是预测下一个单词以匹配上下文。

图片来源:GitHub

他们说,由该转换器编写的文本与由人编写的文本几乎没有区别。我决定仔细检查。

作为内容营销商,我的目标之一是提高雇主的品牌知名度和思想领导力,并通过顶级媒体和边缘媒体上的来宾和幽灵出版物发表口碑。为了这个目标,我找到了一家位于英国的优秀媒体来提交我的来宾出版物。

但是,每篇提交的文章都会由真正的人工编辑阅读。如果他们在内容中找不到任何价值,则不会发布。

我已经使用此转换器创建了一篇文章,并将其提交给编辑器以供批准。令我惊讶的是,编辑们接受了它,但不明白是由机器人编写了文字。

通常,你可以安全地应用GPT-2模型来创建不同语言的文章和评论。

GPT-2生成的文本示例

如何使用GPT-2模型

转到托管工作GPT-2模型的https://inferkit.com。查找所需文本的来源。复制一小段(两到三个句子)文本,将其粘贴到表单中,然后单击“完整文本”按钮。GPT-2将创建三到五个文本段落。如果通过人工智能创建的结果不适合你,请再次单击“完整文本”按钮。

如果生成的文本符合你的期望,请进行复制。然后将由GPT-2编写的最后一段粘贴到转换器窗体中,然后再次单击“完整文本”按钮。GPT-2将继续撰写你的文章。

GPT-3

OpenAI最近发布了第三代开源语言预测模型GPT-3,该模型允许计算机生成与示例样本大致相同的长度和语法结构的随机句子。

Github用户Manuel Araoz在他对GPT-3的早期实验中发现,将预测的GPT-3提案发布在bitcointalk.org论坛上时,引起了论坛其他参与者的积极关注,包括有关该系统的建议必须很聪明(和/或讽刺),并且他在他们的信息中发现了微妙的模式。他认为,通过将GPT-3结果重新发布在其他留言板,博客和社交网络上,可以获得类似的结果。

5月的每一天,他都在bitcointalk.org上发布了一篇完全由GPT-3模型生成的有趣的技术文章。当用户与他的帖子互动时,GPT-3模型会创建回复,甚至可以预测下一条评论。

根据Araoz的说法,每当他以自己的身份发布到论坛时,人们经常提到他们认为他必须是一个“机器人”,才能发布得如此迅速,准确,和/或与他人说相同的话。

那个实验使他相信GPT-3是迄今为止他所看到的主要技术进步之一。

如何在SEO中使用GPT-3

如果内容营销产生了你业务业绩的50%或更多,那么可能值得扩展你的技能以成为更精通AI的营销商。

你可以将GPT-3模型用于以下任务:

  • 大规模创建简短内容(例如,产品目录页面上的页脚内容,工具提示等);
  • 创建元描述,旧内容的ALT标签以及其他缺少的SEO元素
  • 创建常绿的内容-如果你的行业具有始终如一的常绿主题(例如定义问题,标准流程等),则GPT-3可以生成简短的大纲并提供工作草案以进行详细阐述和完善。

消除日常任务

通过使用预构建的模型来教学机器,可以将AI用于最小化日常流程。在我的实践中,我遇到了以下完全或部分由AI自动化的SEO任务。

  • 语义聚类;
  • 表达的选择;
  • 通过确定问题的类型和相关的登陆页面对请求类型进行分类;
  • 基于屏幕截图对网站页面进行分类;
  • 反向链接获取的自动化,
  • 检测并修复薄内容,例如门口页面,低质量的会员页面或仅包含很少或没有内容的页面;
  • 内容计划分析。

同样,使用独特的算法,内容营销人员可以更有效地创建和分析其内容计划。

不久前,我请我前雇主的技术团队构建一种机器学习算法,该算法将使我们的营销团队能够“过滤”出文章,以在我们自己的,付费的和赚钱的媒体中发表。这样一来,我们就可以准确地预测哪个主题最适合Google排名因素,哪个文章将变得常绿,或者哪个项目最有可能获得Google的精选摘要。这称为“瘦内容方法”。

声音搜索

在任何现代SEO专业人员的清单中都可以找到的一项新技能是,了解如何优化语音查询的内容。得益于Alexa,Siri,Cortana等AI虚拟助手的普及,语音搜索正变得越来越流行。

实际上,有35%的互联网用户已经使用他们的虚拟助手进行购物,Gartner预测,到2021年,所有网络浏览会话中的30%将在屏幕外完成。人们使用语音搜索与自己喜欢的品牌和在Internet上搜索产品和业务。

图片来源:dialogtech.com

如果你希望品牌保持竞争力,或者需要改善广告系列的效果,则需要紧跟这一趋势并优化语音搜索的内容。为了满足算法并获得较高的排名,你应该使用搜索引擎所使用的相同工具和策略。这就是为什么在使内容更易于搜索引擎和语音搜索查询访问时,Moz或Yooast之类的工具非常有用的原因。

你可以应用AI的任务很多。这一切都取决于你要做什么以及需要定期处理多少数据。始终存在盈利能力的问题。

由于从原则上讲还没有创建AI,因此我们只能使用弱目标或狭窄目标的“模拟”,例如决策树上的梯度增强。

使用神经网络的例子很多,分别是:

  • 基于用户行为的推荐系统;
  • 确定搜索引擎中LSI单词的算法;
  • 聊天机器人进行语言分析等

使用Deepfake技术处理SEO结果

Deepfake是合成媒体,其中现有图像或视频中的人被他人替换。尽管内容伪造并不是什么新鲜事,但Deepfake仍使用强大的机器学习和人工智能技术来操纵或创建具有很高欺骗潜力的视觉和音频内容。

精通SEO的宣传人员可以通过多种方式传播虚假信息并破坏搜索结果,包括:

模棱两可–使用AI机器人故意将错误的地址或电话号码充斥于竞争对手所在的互联网;

Google Bombing(又称Googlewashing)-通过大量链接使网站在SERP上针对无关,不相关或偏离主题的搜索词排名很高的做法;

302劫持-使用AI机器人配置从一个站点到另一个站点的临时重定向,这允许重定向页面开始对目标网页的关键字进行排名。

例如,在3月发生在英国的神经毒剂袭击和4月发生在叙利亚的化学武器袭击之后,俄罗斯政府的宣传机构RT和Sputnik的文章出现在Google搜索的首页上。同样,YouTube(由Google拥有)具有一种算法,该算法将用户花在观看内容上的时间划分优先级,以此作为确定哪些内容首先出现在搜索结果中的关键指标。

这种算法偏好会导致顶部出现虚假,极端和不可靠的信息,这意味着该内容会被更频繁地查看,并被用户认为更可靠。

“来自SEO操纵行业的收入估计为数十亿美元。”——布鲁金斯大学

AI驱动的SEO工具

如果你是一名SEO专家,希望利用AI提供的新机会,那么现在应该开始熟悉有用的工具。

Clearscope是基于AI的内容优化平台。该工具已付款。对于任何关键字,该工具都会分析表现最出色的自然成分,并使用Watson AI按重要性顺序为你提供所有相关术语的细分。

另一个使用AI技术的SEO创业公司是frase.io。与Clearscope一样,它的主要工作是为你的内容收集信息并对其进行优化。该服务是付费的,但是有免费的测试选项。

BigML是具有免费订阅计划的机器学习工具。我将其用于各种研究。总而言之,我强烈推荐它。你将需要三件事:

  • 清楚地了解自己在做什么和想要得到什么,
  • 数据集
  • 机器学习的基础知识(你可以阅读BigML博客)。

Diib是基于AI的工具,“可立即与Google Analytics(分析)同步,并使用高级算法和AI为你提供易于使用的流量增长计划。”只需60秒即可在60秒内扫描你的网站,并生成有关改善SEO,页面加载速度,安全性和总体用户体验的指南。他们的PRO订阅费用为29,99美元,其中包括完整的增长计划,社交媒体分析,支持和其他高级功能。但是,你可以在功能有限的情况下免费试用。

与其他显示仪表板和图表的工具不同,Diib用通俗易懂的语言与你交谈,并描述性地解释了增加有机流量和改善其他关键SEO KPI所需采取的所有步骤。

善用AI最佳化网站的秘诀

1)使用GPT-2和GPT-3模型来创建高质量的搜索引擎优化内容(社交媒体的缩写形式和meta以及长期和长期战略意义上的常绿形式)。

2)使用Google的Cloud Vision优化图像,检测情绪,理解文字等。

3)请注意每页内容的质量,讲故事的逻辑以及使用单词的上下文。目前,检查是否符合上下文是最困难且最耗时的任务,因为很少有工具为此使用国家字库。

最佳解决方案之一是Sketchengine。它使用了源自维基百科文本的语料库。顺便说一下,Google BERT也接受了维基百科文本的培训。

4)从优化关键字页面(包括文本搜索查询及其密度)到优化内容的本质,即:

  • 完整性
  • 丰富的短语,
  • 潜在语义索引(LSI),
  • 设置主题的主题关键字,
  • 搜索结果中的突出显示(例如精选片段)等。

总结

在SEO中使用人工智能的话题仍然存在争议,对此有很多不同的看法。

但是,否认基于AI的技术会影响搜索优化空间是没有道理的。发布了新的搜索引擎算法和工具,使专家可以适应自动化关键字研究和内容编写过程,简化和改善反向链接配置文件以及总体上的用户体验。另一方面,deepfake等AI技术会通过使用不公平的竞争做法并散布有关你品牌的虚假信息,从而大大降低SEO的质量并操纵搜索结果

无论你是白帽子还是白帽子的SEO专家(黑帽子的SEO专家通常是早期技术采用者,并且首先尝试新事物)–如果你还没有利用AI,请考虑尽快采取行动以保持竞争力,做出明智的决定,并以相关,有用和高质量的搜索结果使目标受众满意。

*本文仅代表作者个人观点,不代表AI科技大本营任何立场。 原文链接: https://hackernoon.com/ai-and-seo-a-marriage-made-in-heaven-or-hell-eh3w31y9 本文由AI科技大本营翻译,转载请注明出处

0 人点赞