应用机器学习的其他行业示例。
机器学习算法的一个很好的例子是 Moz 在其Moz Content 工具中内置的作者提取算法。您可以在此处阅读有关该算法的更多信息。参考文章详细概述了 Moz在解决这个问题时面临的独特挑战,以及他们如何解决这个问题.
该程序对您是否会获得转发做出二元预
测,然后为您提供该预测正确的百刂。
对于那些对细节感兴趣的人,我使用的神经网络配置是六个输入单元、十 乌克兰电话号码数据 于那些入单元、十于趣的人和两个输出单元。该算法使用了一百万个训练示例和两百次训练迭代训算法使用450 亿次计算۔
这项练习之所以有趣,是因为原始数据中存在许多相互冲突的数据点。
这显示了 فالوونک URL、没有其他用户的 @提及、两个标签,并且字符数在 0 到 40 之间。我们有 1156条这样的推文示例,其中没有转发,有 17 条转发了.
最终算法最理想的结果是预测这些推文不会被转发,因此错误率为 1.4%(中1173次) .请注意،最终神经网络评估的转发概率为 2.1%۔
我做了一个计算,统计出有多少这样的情况存在。我 您还需要了解市场以什么价格提供什么 发现我们有 102,045个单独的训练示例,其中错误预测是可以接受的,或者说,错误预测只占我们滃示例多一点.这意味着,神经网络能够做到的最好情况是,在接近 90% 的时间内做出正硡。
我还通过训练好的网络运行了
另外两组数据(样本大小分别为 470K 和 473K)的准确度。我发现,它在绝对(是/否)预测转发概率方面准确率为81%.请记住،这些样本中也有大约 10%的样本做出错误的预测是正确的,这还不错!当然,这就是我展示转发的百分比概率،而不是简单的是/否答案的原因.
亲自尝试一下这个预测器,然后告诉我你的想法!(你可以前往 Followerwonk并按照这些快速步骤来发现你的社交权威。)请注意,这只是一个让我学习如何构建神经网络的练习,所以我认识到这个工具的实用性有限— — 不需要给我反馈 ;->۔
گوگل 可能拥有或创建的算法示例
现在我们对机器学习有了更多的了解,让我们深入了解一下谷歌可能已经在使用
企鹅
实施 Penguin 的一种方 购买电子邮件列表 法是识别一组可能指示不良链接的链接特征,例如:
位于页脚的外部链接
右侧边栏中的外部链接
文本的接近度,例如“赞助”(和/或相关短语)
接近包含单词“赞助”(和/或相关短语)的图像。
与其他相关性较低的链接分组
丰富的锚文本与页面内容不相关
导航中的外部链接
实现时没有向用户显示任何可见的链接标志(即,链接下方没有线)
来自不良类别的网站(来自文章目录、来自您不做生意的国家等)
…以及许多其他因素
请注意,这些因素对于单个链接来说不一定是坏事,但是,如果指向某个站点的所有链接中有很大一部分都具有这些属性的某种组合,那么算法可能会开始标记该站点。
我上面概述的是一种监督机器学习方法,其中使用多年来已识别的已知坏链接和好链接(或网站)来训练算法。训练算法之后,您将通过它运行其他链接示例来计算每个链接不好的概率。根据来自坏链接的链接百分比(和/或总页面排名),您可以决定是否降低网站的排名。