前谷歌员工:谷歌“利用点击排名”

跨境快讯 2024-02-01 09:09:28 woniu
2
导读:这是否意味着点击次数是直接排名因素?不会。事实上,BERT 和 MUM 正在降低用户数据的重要性。


“几乎每个人都知道我们在排名中使用点击次数。这就是争论:“如果每个人都知道,你为什么要试图掩盖这个问题?”

这句话出自埃里克·雷曼 (Eric Lehman) 之口,他是一名在 Google 工作了 17 年的前员工,曾担任搜索质量和排名方面的软件工程师。他于 11 月离开谷歌。

雷曼兄弟上周三作证,作为正在进行的美国诉谷歌反垄断审判的一部分。

如果您还没有听过这句话,那么期待听到它。很多。

但。这并不是雷曼要说的全部。他表示,谷歌的机器学习系统 BERT 和 MUM 正变得比用户数据更重要。

“从一个方向来看,拥有更多的用户数据会更好,但新技术和后来的系统可以使用更少的用户数据。据Law360报道,雷曼说道:“这种情况变化得很快。 ”
据《财富》杂志报道,根据雷曼在 2018 年写的一封电子邮件,雷曼相信谷歌将更多地依赖机器学习来评估文本而不是用户数据:

“大量的用户反馈可以在很大程度上被原始文本的无监督学习所取代,”他写道。
用户数据与训练数据。当谈到 BERT 时,“用户数据”与“训练数据”也存在混淆。据报道,大型科技公司正在接受审判:

“司法部弹劾雷曼兄弟证词的尝试似乎也适得其反。在回答司法部关于谷歌使用 BERT 是否因其用户数据而在竞争中具有优势的问题时,雷曼证实,谷歌相对于竞争对手“使用 BERT 的最大优势”是谷歌发明了 BERT。随后,司法部举办了一个题为“向桑达尔介绍的要点”的展览。此次展览的其中一条要点如下(根据我的笔记):“任何竞争对手都可以使用 BERT 或类似技术。” 幸运的是,我们的训练数据让我们领先一步。通过充分利用 BERT 的训练数据并将其提供给我们的用户,我们有机会保持并扩大我们的领先优势……”

如果“训练数据”意味着某种用户数据,这可能是对雷曼兄弟的有效弹劾。但在司法部结束重新直接审查后,梅塔法官询问雷曼“训练数据”指的是什么。雷曼解释说这与用户搜索数据不同。”

与谷歌竞争是什么感觉?
敏感话题。美国司法部律师艾琳·默多克-帕克还询问雷曼兄弟关于“敏感主题”幻灯片中的一张幻灯片,该幻灯片指示员工“不要讨论搜索中点击的使用……”

根据 Big Tech on Trial 的报道(来自 X),雷曼表示“我们尽量避免确认我们在搜索结果排名中使用了用户数据。”

记者X 的帖子称:“我对此没有得到很好的说明,但我认为原因与不希望人们认为 SEO 可以用来操纵搜索结果有关。”
谷歌=骗子?自从发现这一证词后,SEO 们很快就使用雷曼兄弟的引述作为确凿的证据,证明 Google 25 年来一直在使用点击次数或点击率方面撒谎。

谷歌是否使用点击的问题是上周在奥斯汀举行的 Pubcon Pro 上与谷歌的 Gary Illyes 进行的 AMA期间提出的第一个问题。Illyes 的回答是“从技术上讲,是的”,因为谷歌将历史搜索数据用于其机器学习算法RankBrain。

从技术上讲,“是”,翻译自 Google 员工的说法,意思是“是”。RankBrain 接受了用户搜索数据的训练。

我们之所以知道这一点,是因为 Illyes 已经在《我是 Google 阳光与幸福与趋势首席分析师 Gary Illyes》中告诉了我们这一点。2018 年 Reddit 上的AMA 。他说 RankBrain:

“使用历史搜索数据来预测用户最有可能点击以前未见过的查询的内容。”
从 2016 年开始,RankBrain 被用于所有搜索,影响了“很多”搜索。

那么 Google 搜索如何使用点击次数呢?谷歌跟踪搜索中的每次点击这一事实并不意味着点击必然被用作直接排名因素。换句话说,如果网站 A 获得 100 次点击,网站 B 获得 101 次点击,则网站 B 会自动跳转到位置 1。

就像谷歌雇佣人员(质量评估者)来评估其搜索结果的质量一样,谷歌表示他们使用点击数据来评估实验和个性化。

“……我们选取一部分用户,并对他们强制进行实验、排名和/或用户体验。假设 1% 的用户获得更新或启动候选版本,其余用户获得当前部署的版本(基础版本)。我们运行实验一段时间,有时是几周,然后我们比较实验和基础之间的一些指标。指标之一是两者之间结果的点击次数有何不同。

– Gary Illyes,我是 Gary Illyes,谷歌阳光和幸福与趋势分析师首席分析师。阿玛。
在 2017 年的一次采访中,Illyes 表示点击是一个“非常嘈杂的信号”:

“一般来说,点击是一个非常嘈杂的信号。我尝试从点击数据中进行观察。这就像一个棘手的结。因为有很多人正在抓取结果并尝试获取排名数据,并且无论出于何种原因,他们也决定自动点击内容。链接。这简直是​​一团糟。

当我们进行对照实验时,显然我们必须查看点击数据。在我们发起排名更改之前,通常我们所做的是隔离 1% 的用户,并为他们提供修改后的搜索结果,通过新的排名算法或算法的一部分进行修改,然后看看他们对新结果的喜欢程度。在这些情况下,我们确实会寻找长点击、短点击等。但总的来说,正如我所说,这是一团糟。”

–让我为你谷歌一下 – 加里·伊利斯 (Gary Illyes) 访谈
以下是 Illyes 与 Search Engine Land 联合创始人 Danny Sullivan(现供职于 Google)2015 年的一次交流:

沙利文:好的。点击率怎么样?我们知道您会衡量正在发生的点击次数。这是算法的一部分吗?

Illyes: 所以……我们以几种不同的方式使用……点击。我们使用点击的主要内容是评估和实验。这是两个主要的事情。有很多人试图在点击中引入噪音。兰德·菲什金就是其中之一。直接在排名中使用这些点击,会很漂亮......

沙利文: 兰德只是点击一些东西来搞砸事情吗?

Illyes: 我认为他正在做的是雇用人们进行点击、填充、实验等。直接在排名中使用点击对于这种噪音没有太大意义。

沙利文: 但是你用过它 吗?

伊利斯: 好的,是的。在某些情况下。好吧,让我给你举个例子。在某些情况下,直接使用点击是有意义的。例如,如果您有个性化结果,并且您搜索“苹果”,那么当您第一次搜索“苹果”时,我们很可能会为您提供一个消歧框。你指的是公司还是水果?如果您过去点击过苹果公司,我们知道您很可能对苹果公司感兴趣。当您第二次点击 Apple 公司时,我们更加确信这就是您正在寻找的产品。

如果您是一名程序员,经过几次搜索后,您的搜索将由编程语言结果主导。Sullivan: 所以你用它来实现个性化?Illyes: 是的,确实如此,[点击率]与个性化有关,如果您想通过随机点击内容来搞乱自己的搜索结果,那就继续吧。

– Google 搜索 SMX 2015 的 AMA:Danny Sullivan 和 Gary Illyes
为什么我们关心。Google 使用点击次数吗?显然,是的。但同样,可能不是一个直接的排名信号(尽管我不能100%肯定地说这一点,因为我不在谷歌工作或无法访问该算法)。我知道点击声很吵而且很容易操纵。对于许多网站/查询来说,根本没有足够的数据来评估以使其成为谷歌有用的排名信号。
原文链接:https://searchengineland.com/former-googler-google-using-clicks-in-rankings-432401

版权声明: woniu 发表于 2024-02-01 09:09:28。
转载请注明: 前谷歌员工:谷歌“利用点击排名” | 跨境湾

相关文章