百度搜索引擎排名规则(百度搜索的结果是按什么排序)

我们向搜索引擎提交一个查询,搜索引擎会从先到后列出大量的结果,排序的不同带来的经济效应也不同,我们想要的就是让自己的搜索结果靠前,最好是能得到NO.1。那么这些搜索结果排序的标准是什么呢?

还是看看百度搜索研发部以求医为例谈搜索引擎排序算法的基础原理。

比如,如果我牙疼,应该去看怎样的医生呢?假设只有三种选择:

A医生,既治眼病,又治胃病;

B医生,既治牙病,又治胃病,还治眼病;

C医生,专治牙病。

A医生肯定不在考虑之列,B医生和C医生之间,貌视更应该选择C医生,因为他更专注,更适合我的病情。假如再加一个条件:B医生经验丰富,有二十年从医经历,医术高明,而C医生只有五年从医经验,这个问题就不那么容易判断了,是优先选择更加专注的C医生,还是优先选择医术更加高明的B医生,的确成了一个需要仔细权衡的问题。

至少,我们得到了一个结论,择医需要考虑两个条件:医生的专长与病情的适配程度、医生的医术。大家肯定觉得这个结论理所当然,而且可以很自然地联想到,搜索引擎排序不也是这样吗,既要考虑网页内容与用户搜索查询的匹配程度,又要考虑网页本身的质量。

但是,怎么把这两种因素结合起来,得到一个,而不是两个或多个排序标准呢?简单的加减乘除是不够严谨的,最好能跟数学这样坚实的学科联系起来。人类在古代就能建造出高楼,但要建造出高达数百米的摩天大厦,如果没有建筑力学、材料力学这样坚实的学科作为后盾,则是非常非常困难的。同理,搜索引擎算法要处理上亿的网页,也需要更为牢固的理论基础。

求医,病人会优先选择诊断准确、治疗效果好的医生。而对于搜索引擎来说,一般按网页满足用户需求的概率从大到小排序。如果用q表示用户给出了一个特定的搜索查询,用d表示一个特定的网页满足了用户的需求,那么排序的依据可以用一个条件概率来表示:

这个简单的条件概率,将搜索引擎排序算法与概率论这门坚实的学科联系了起来。可以看到,搜索引擎的排序标准,是由三个部分组成的:搜索查询本身的属性P(q)、网页本身的属性P(d)、两者的匹配关系P(q|d)。对于同一次查询来说,所有网页对应的P(q)都是一样的,因此排序时可以不考虑,即

搜索引擎为了提高响应用户搜索查询的性能,需要事先对所有待查询的网页做预处理。预处理时,搜索引擎预处理只知道网页,还不知道用户查询,因此需要倒过来计算,即分析每个网页能满足哪些需求,该网页分了多大比例来满足该需求,即得到公式右边的第一项P(q|d),这相当于医生的专注程度。

比如,一个网页专门介绍牙病,另一个网页既介绍牙病又介绍胃病,那么对于“牙疼”这个查询来说,前一个网页的P(q|d)值就会更高一些。

公式右边的第二项P(d),是一个网页满足用户需求的概率,它反映了网页本身的好坏,与查询无关。假如要向一个陌生人推荐网页(我们并不知道他需要什么),那么P(d)就相当于某个特定的网页被推荐的概率。在传统的信息检索模型中,这个不太被重视,之前都试图只根据查询与文档的匹配关系来得到排序的权重。而实际上,这个与查询无关的量是非常重要的。

假如我们用网页被访问的频次来估计它满足用户需求的概率,可以看出对于两个不同的网页,这个量有着极其巨大的差异:有的网页每天只被访问一两次,而有的网页每天被访问成千上万次,这对于排序非常重要。

总而言之,这个公式模型告诉了我们网页与查询的匹配程度,和网页本身的好坏都是参与排序排名的重要因素。

怎么样?文章中的内容在现在是不是有很多都似曾相似,是不是在互联网上看到很多文章都和这类似?其实很多内容都是从这里衍生出去的。比如搜索引擎的综合得分排序、比如关键词与网页内容的相关度、比如网页本身好坏对排序影响等等。

一个最简单的例子,著名的搜索引擎排序算法pagerank算法,其实就是为了弥补传统算法对P(d)值(页面本身好坏判断)的不足而产生的,Pagerank是对网页好坏判断的一个不错的标准。而现在的网页点击量、停留时间、跳出率、页面访问速度等都是对网页满足用户需求概率的预估,这一个因素越来越重要。

前不久百度发布的《百度搜索引擎网页质量白皮书》你再看看,其实也是大篇幅的在谈谈网页本身好坏这一点。随着用户时代来临,用户投票越来越影响搜索排名,而用户主要衡量的除了需求满足外就是网页本身质量。所以,网页本身质量不管对于用户还是搜索引擎,在排序上都变得越来越重要。

一句话,很多时候需要透过现象去看本质,而你看透这个本质后,再看其他现象,一切都那么明了。

欢迎关注木木SEO博客,微信公众号:mumuseo。如果你觉得这篇文章有价值,请分享给你的朋友,如果你觉得没有价值,没有关系,请给以指导,这是一次改变的机会。也欢迎交流QQ&微信号809472503

(0)

相关推荐

  • 国内最好用的搜索引擎(好用搜索引擎排名)

    今天一起来了解下一些常见的搜索引擎.目前国内主流的5大搜索引擎有百度.谷歌.360.神马及搜狗搜索.        1.用户通过百度搜索引擎可以搜到世界上zui新zui全的中文信息,它拥有全球zui大 ...

  • 百度地图是如何获取实时路况信息的(高德地图是怎么做到显示实时路况的)

    目前国内导航软件前两名还是高德和百度,高德本身就是专业的地图导航起家,百度导航是随着百度搜索引擎功能成长起来的,现在腾讯也跟着做导航,相对来讲占比比较低.大家还是更加喜欢用高德或者百度导航,在国内能把 ...

  • 网站ssl证书有什么用(没有ssl证书会怎样)

    网络劫持被攻击时常有发生,打开正确的网站被跳转到另一个网站真的非常不安全!那该如何是好呢?SSL证书来帮忙!安装SSL证书可以保证网站的信息从用户浏览器到服务器之间是高强度加密传输的,可以防止信息被窃 ...

  • 新手怎么做电商运营(短视频电商运营模式)

    前言:        百度有百度的算法.微信有微信的算法.淘宝也有淘宝的算法,算法是任何平台必不可少的机制.科普:1. 算法是什么:简单通俗的讲,算法就是一套评判机制.这套机制对平台的所有用户都有效, ...

  • 知乎推广运营(知乎怎么推广引流)

    大部分想做知乎推广的朋友,对知乎平台的推广方式不了解,四川九州营联小编跟大家做一下科普,把知乎的常见推广方式和适用人群做一些介绍,让大家找到合适的推广方式,做出适合自己产品的营销方案.知乎营销推广方式 ...

  • 微信上的搜一搜怎么不能用了(微信搜一搜在哪里打开)

    前两天更新了两篇关于微信搜一搜的文章:微信搜一搜月活跃用户超过7亿,会是下一个流量入口吗?微信搜一搜排名规则是什么?吃透为你带来源源不断的流量结果有读者问我,他怎么没搜一搜呢?微信搜一搜入口在哪里?针 ...

  • 文件夹图标怎么改?详细步骤分享

    在我们打开电脑的时候恐怕最常见的就是文件夹了吧,因为文件夹的方便性,所以文件夹图标大都一个模样,只要名称不同,但是有时候看着一整个屏幕的同一种样式的文件夹会觉得很无趣,甚至有些厌烦了,有时候想要把他们 ...

  • u盘pe启动盘制作教程

    [导读]现在是一个计算机使用相对比较频繁的时代,不管我们是在办公或者是在学习,也不管我们是在网上购物或者是在各种的娱乐,都会使用到计算机.正因为计算机使用的时间和频率比较多,因此计算机出现问题的可能性 ...

  • 本地ip地址查询方法?和宽带地址查询有什么区别?

    现在各行各业都会用到电脑,而且每个家庭中也会有至少一台电脑,有的还会有笔记本或者ipad等等,那怎么查看本地的地址呢?有什么查询方法呢?本地IP地址和宽带的地址是一样的吗?有什么区别呢?今天我们就为您 ...