不少SEO-er都应该了解搜索引擎工作原理繁多复杂,大致一般分为三大步奏:爬行和抓取,建立索引和排名。当然SEO-er优化网站,目的在于提高关键词排名,增加产品曝光率。为此SEO-er们更加看重排名这一环节,笔者在此对搜索引擎工作原理之排名做个小小的经验之谈。
搜索引擎面对的用户大部分是通过键入关键词返回一个列表页面,这个结构页面是大量的搜索索引库而建立起来的。当然这里这个页面是指自然搜索结果。那么搜索引擎是如何完成排名这以环节的呢?我们无妨看看整体思维图。
一、对提交的搜索请求分析
搜索用户在搜索引擎上键入关键词,提交搜索请求,一步一步找到匹配的网页显示出来。当我们键入关键词提交(按下回车)给搜索引擎时,搜索引擎便会对这次搜索请求进行详细分析。
1、中文分词
中文分词是各大搜索引擎中重要的环节,中文分词能够更加明确掌握搜索请求的重点所在,时期更好地页面展示给搜索用户。
百度中文分词常见的以下三种:
a、基于字符串匹配
在基于字符串匹配中正向最大匹配法、逆向最大匹配法、最少切分这三种又比较常见。
正向最大匹配法:利用关键词查询的时候,在百度排名第一位的是以标题和搜索的长尾词相符合,说明在网站条件相当的情况下,先显示标题匹配的网页。
逆向最大匹配法:刚刚是正向最大匹配法相反的规则,即从右往左反向进行拆分和组合。
最少切分:最小切分就是将一个个词组切分为最细化,甚者会一个字出现。
b、理解分词方法
理解分词方法:搜索引擎模拟人的思维,对其语句的理解进行分词技术。通过对存储的词语和语句的整合,进行分词理解。其基本思想就是在分词的同时进行句法、语义分析,利用句法信息和语义信息来处理歧义现象。它通常包括三个部分:分词子系统、句法语义子系统、总控部分。在总控部分的协调下,分词子系统可以获得有关词、句子等的句法和语义信息来对分词歧义进行判断,即它模拟了人对句子的理解过程。
c、统计分词方法
评论