毅新SEO

可能系顺德最好嘅SEO网站

中文分词-搜索引擎原理第五讲

中文分词的意义

分词是搜索引擎的重要技术,国内网站一般处理的都是中文,所以中文分词在国内SEO中尤为重要。 由于汉字的博大精深,搜索引擎也希望将人能理解的词或词组让程序也能识别,这就是中文分词技术。

中文分词的方法

分词技术对于我们的SEO工作有着重大的意义,不管是我们的关键词布局还是链接架构,都跟分词有莫大的关联。目前搜索引擎分词的方法主要通过字典匹配和统计两种方法:

基于字典匹配的分词方法

这种方法首先得有一个超大的字典,也就是分词索引库,然后按照一定的规则将待分词的字符串与分词库中的词进行匹配,若找到某个词语,则匹配成功,这种匹配有分以下四种方式:

正向最大匹配法

由左到右的方向

逆向最大匹配法

由右到左的方向

最少切分

使每一句中切出的词数最小

双向最大匹配法

进行由左到右、由右到左两次扫描

基于统计的分词

方法

虽然分词字典解决了很多问题,但还是远远不够的,搜索引擎还要具备不断的发现新的词语的能力,通过计算词语相邻出现的概率来确定是否是一个单独的词语。所以,掌握的上下文越多,对句子的理解就越准确,分词也越精确。举个例子说,“搜索引擎优化”,在字典中匹配出来可能是:搜索/引擎/优化、搜/索引/擎/优化,但经过后期的概率计算,发现“搜索引擎优化”在上下文相邻出现的次数非常多,那么基于统计就会将这个词语也加入进分词索引库。

中文分词举例

参见本站标题”毅新顺德SEO博客—分享SEO技巧与网站优化推广经验心得”,可匹配出:SEO博客、SEO技巧、网站优化和网站推广等核心关键词,加上”毅新”个人品牌和”顺德”地方名称两个副词,能组合出适合本站定位,吸引目标客户群的目标关键词。在网站关键词布局时,只要增加核心关键词频率即可,不用刻意堆砌像”顺德seo博客”和”顺德网站优化”这样的关键词。

zp8497586rq

除非注明,本站文章均属原创。如转载本篇文章,请注明:转载自顺德SEO

本文地址: 中文分词-搜索引擎原理第五讲

你可能感兴趣的文章

点赞
  1. 佛山SEO说道:

    在网站关键词布局时,只要增加核心关键词频率即可,不用刻意堆砌像”顺德seo博客”和”顺德网站优化”这样的关键词。