
之所以要写百度搜索引擎优化的相关内容主要是那天听了某位同学的话比较有感触,她说的第一句是“蚊子再小也是块肉”,第二句话是“它山之石可以攻玉”!Jack老师的这个教程网站一开始的初衷是讲外贸建站和谷歌SEO优化,但考虑到国内的同学们的产品供应链上下游都集中在国内,所以就想到了来讲一讲中文内容社区最大的搜索引擎—百度的相关SEO优化内容。虽然我也一直在不断吐槽百度的各种糟点,但不可否认的是百度是当下而且在往后相当长的一段时间内都会担当起中文内容搜索领英的龙头老大,这不仅仅是它本身因素决定的,更多的是整个搜索生态环境和特定的高层战略意识形态所决定的!有时候吐槽百度,可能并不是因为它不够好,而是用过谷歌等更好的搜索引擎之后,对比之下才发现,百度搜索引擎要走的路还很长。这就好比是你去大城市尝过大厨的手艺之后会回家说母亲烧的家常菜不香,但事实上家常菜才是最养胃的!言归正传,我们来讲百度搜索引擎的基本原理和工作流程。
此处内容已经被作者隐藏,请输入验证码查看内容请关注本站微信公众号,回复“外贸建站”,获取验证码。在微信里搜索“JACK SEO”或者“JACK 外贸建站”或者微信扫描右侧二维码都可以关注本站微信公众号。
一.百度搜索引擎工作原理
我们首先引用百度对其自身工作原理的官方描述:互联网信息爆发式增长,如何有效的获取并利用这些信息是搜索引擎工作中的首要环节。数据抓取系统作为整个搜索系统中的上游,主要负责互联网信息的搜集、保存、更新环节,它像蜘蛛一样在网络间爬来爬去,因此通常会被叫做 “spider”。例如我们常用的几家通用搜索引擎蜘蛛被称为:Baiduspdier、Googlebot、Sogou Web Spider 等。上面这段话,简单的概括就是说,百度派出了蜘蛛通过超链接的形式抓取新内容!这句话看起来很简单,但是背后却包含了包括链接存储系统、链接选取系统、dns 解析服务系统、抓取调度系统、网页分析系统、链接提取系统、链接分析系统、网页存储系统等多个环境并发交互运作的一个整体过程。也就是说百度本身并不生产内容而是做内容的搬运工(咦,怎么和农夫山泉大自然的搬运工套路这么相似?!类似的还有马云的淘宝,王兴的美团…有钱人的脑子思考模式都差不多的吗?)需要注意的是互联网上的很多信息都是不太健康的,所以百度搜索引擎在抓取和处理这些内容的时候就会开始引入一系列处理机制,接下来我们就看看有哪些处理机制会影响百度蜘蛛对内容的抓取