百度相关搜索的原理详解

2011.09.05 16:54

更多

我们都知道百度是程序,是机器,不可能像人类一样的思维去判断很多事物,百度算法里面存在分词和切词,但是不可能判断出这个词产生以后是好是坏,机器只会匹配词语判断两个词是否相关。搜索引擎也是我们人类开发出来的,很多思维模式跟人一样,会抓住简单的思维想法。

先给大家举个简单的例子:打开百度搜素引擎,搜索“400”的时候出现的地址是:
http://www.baidu.com/s?wd=400&spt=query&rsv_bp=0&ie=utf-8&tn=baiduhome_pg&inputT=1391

我们可以把以上搜索结果的地址当做第一次搜索,在这个页面不关闭的情况下继续进行第二次搜索“400电话”出现的地址是:
http://www.baidu.com/s?tn=maxthon2&ch=3&bs=400&f=8&wd=400%B5%E7%BB%B0&inputT=2448

解释:当我们进行第二次搜索的时候百度是根据我们发送的请求显示出结果的,也就是在搜索“400”的同时找不到自己想要的信息在进行第二次搜索“400电话”。也就是说第二次搜索的时候是第一次发送请求之后在把“400”进行发送。如果单纯重新打开页面搜索“400电话”就是不一样的地址显示,因为它只发送一次请求,没有经过“400”这次发送。这样的一个过程之后,百度会认为后者是前者的相关关键词,一个简单的思维模式却被百度给抓住了,这个简单的思维模式是我们搜索所想不到的,但是却无形之中被百度利用了。