如何看待百度搜索关键词增加 -robin或者 -李彦宏,就出现无广告正常内容?
作者:卡卷网发布时间:2025-01-12 18:21浏览数量:79次评论数量:0次
笑死我了,什么word embedding技巧。
这个技巧不仅能把广告去掉,而且还能把和百度相关的(例如百度经验,百家号等百度系产品)搜索结果去掉
给不懂word embedding的朋友简单科普下。所谓Word embedding,其实就是把词映射为向量,你可以把向量看作是词在坐标系中的位置。word embedding具体能做啥?这里举个例子
假设 “国王” 的词向量为[0.2,0.3,0.4],“男人” 的词向量为[0.1,0.2,0.3],“女人” 的词向量为[0.15,0.25,0.35],那么把国王的向量-男人的向量+女人的向量,也就是[0.2,0.3,0.4]-[0.1,0.2,0.3]+[0.15,0.25,0.35],得到的结果[0.25, 0.35, 0.45]在词向量空间中寻找与最相似的单词时,得到的可能是 「王后」。这种运算在一定程度上模拟了语义的转换,从 「男性统治者(国王)」减去 「男性」 的语义,再加上 「女性」 的语义,得到 「女性统治者(王后)」 的语义,通过词向量的运算,就可以算出,国王 - 男人 + 女人 = 王后。
不知道百度搜索对输入框有没进行词向量运算,但测试了下,「-李彦宏」确实是有效的。
例如你搜「公开课ppt模板」,百度文库霸占你半屏。
但是「-李彦宏」后,百度文库就消失了。
例如Steam下载,第一条内容是跳转到百度乐玩平台
但是「-李彦宏」后,百度乐玩的结果就没有了(虽然总体结果也没好哪里去)
个人猜测,是因为在互联网语料上,李彦宏和百度这两个词经常一起出现,导致他们的词向量距离很接近,当你「-李彦宏」时,实现了和「-百度」相似的效果
补充:
直接说这是word embedding确实会误导读者。其实我想说的是,这个技巧能实现像word embedding类似的结果,事实上多数搜索引擎都能使用这个技巧,在查询后减去部分结果,只是有意思的是,减去李彦宏几乎等于减去百度的效果。
免责声明:本文由卡卷网编辑并发布,但不代表本站的观点和立场,只提供分享给大家。
相关推荐

你 发表评论:
欢迎