原文: https://moz.com/blog/machine-learning-101
对于在数字世界中工作的任何人来说,机器学习的重要性在不断增长,但它常常感觉像是一个难以落地的主题。今天这篇文章就会介绍机器学习和SEO能碰撞出哪些火花?
今天我们来聊聊机器学习的那些事,就像你们中许多人所知道的那样,我非常热衷并且喜欢谈论这个话题。 希望今天的文章能激发您中的一些人进一步探索它,因为它确实是值得研究且功能强大的一个学科。
什么是机器学习?
概括地说,机器学习实际上是AI的一个子集,有人会说我们还没有真正接触到人工智能。 但这只是整个AI的一个方面。
传统编程模式
最好的理解方法是与传统编程相比。 因此,传统编程需要将数据和程序输入计算机,然后输出,无论是网页还是在线构建的计算器,都需要遵循这个模式
机器学习
使用机器学习时,您要做的就是将数据和所需的输出放入计算机中,然后得到一个程序,也称为机器学习模型。 因此,它和传统编程模式不同,但效果非常好。 机器学习有两种主要类型:
1.监督学习,基本上就是在这里输入标有训练数据的模型,
2.无监督学习,您可以在其中馈入程序数据,并让它在数据点之间创建聚类或关联
监督学习更为普遍。 包括分类,线性回归和图像识别之类的东西。 这样的事情都很常见。 如果您从机器学习的角度考虑问题,那么可以将所有这些数据放入模型中,数据是机器学习的最大部分。 很多人会认为,如果机器学习是一种媒介,那么数据将成为燃料。
这是非常重要的一点,因为除非您拥有正确的数据类型来提供模型,否则您将无法获得所需的期望结果。
机器学习模型示例
因此,让我们看一个例子。 如果您想建立一个预测房价的机器学习模型,则可能拥有所有这些信息。
您可以输入当前价格,这些房屋的平方英尺,土地,浴室数量,卧室数量。 它会一直持续下去。 这些也称为features。 因此,当您输入所有这些数据时,模型将要尝试做的事情是,它将试图理解这些信息之间的关联,并提出一个最能预测未来房价的模型。
这些机器学习模型中最基本的是线性回归。 因此,如果您考虑在可能仅输入价格和平方英尺的位置输入数据,则可以看到这样的数据。
您会看到,随着平方英尺的增加,价格也随之增加。 随着时间的流逝,模型将开始在数据中寻找最平滑的线,以在将来获得最准确的预测。
您不希望它适合每个数据点,并有一条看起来像这样的线(也称为过度拟合),因为它不适用于新数据点。 您不希望模型对您的数据集如此计算,以至于将来无法准确预测。
一种看待损失的方法是通过损失函数。 这可能会更深入,但这就是您如何测量线条的适合程度。 让我们来看看。
SEO中有哪些机器学习的可能性?
那么SEO中有哪些可能性? 我们如何在SEO领域中利用机器学习?
自动化描述信息
自动化元描述
因此,人们已经有几种方法可以做到这一点。 您可以通过查看页面内容并使用机器模型来汇总文本来自动执行元描述。 可以实现分析页面主题,并将其缩减为一个符合长度规定的描述。 太不可思议了。
自动化标题
您可以对标题进行类似的操作,尽管我不建议您对主要页面进行此操作。 这不是完美的。 但是,如果您有一个庞大的网站,拥有成千上万的页面,它将带您进入中间。 通过这些大型网站开始在这个领域中玩耍真的很有趣。
自动化图片的Alt标签
自动化图片的Alt代码
您还可以自动为图像替换alt标签。 我们看到这些模型真的非常善于理解图像中的内容。
自动化301重定向
301重定向后,Paul Shapiro( Paul Shapiro )拥有了令人难以置信的写作,并且基本上已经对此进行了处理。
自动化内容创建
内容创建,如果这使某些人感到恐惧,或者如果您怀疑这些模型当前是否可以创建不错的内容,那么我将向您挑战一下“与Transformer交流”。( https://talktotransformer.com/ )
它是由Elon Musk创建的OpenAI的简化版本。 对于仅来自缩减模型的内容而言,这真是令人难以置信,令人有些恐惧。 因此,这肯定在将来甚至今天都是可能的。
自动化产品/页面建议
因此,这只会变得更好。 想象一下,我们专门为访问我们网站的独特用户提供内容和用户体验,高度个性化的内容,高度个性化的体验。 前进中的确令人兴奋。
资源
Google Codelabs Google Codelabs是我的最爱之一,因为它会逐步指导您。 因此,如果您访问Google Codelabs,通过TensorFlow过滤或通过机器学习进行过滤,则可以在其中看到可能的示例。 您可能会在Colab笔记本或Jupyter笔记本上自行进行任何机器学习。
Kaggle.com .Kaggle.com是数据科学竞赛的第一资源。 因此,您将真正了解示例,人们今天如何使用机器学习。 您会看到类似TSA的事情,即为数据科学团队提供了超过100万美元的资金,他们可以提出一种模型来预测安全镜头的潜在威胁。
这些东西很快变得非常有趣。 在这个空间中具有多样性和包容性也非常重要,以避免将来出现真正危险的模型。 所以这是绝对要考虑的事情。
TensorFlow是一个很好的资源。 这就是Google推出的产品,也是他们许多机器学习模型的基础。 他们有一个非常出色的JavaScript平台,您可以使用它。
Andrew Ng has an incredible machine learning course.
吴恩达(Andrew Ng)开设了一门令人难以置信的机器学习课程。 我强烈建议您检查一下。
那么Algorithmia就像是模型的一站式商店。 因此,如果您不希望专心于机器学习,而只想说一个汇总器模型或特定类型的模型,则可能会在那里找到一个并进行即插即用。
因此,这非常有趣且有趣。 最后一件事是机器学习模型仅与数据一样好。 我不能这么表达。 因此,很多机器学习和数据科学家都进行了数据清理和解析,这是该领域的大部分工作。
重要的是要意识到这一点。 机器学习101就这样了。非常感谢您的加入,我希望很快能再次与大家见面。 谢谢。