如何了解搜索引擎的排名原理,以下为从事多年优化来的一些个人观点和大家分享下:
要做SEO优化,首先要了解什么是搜索引擎?
搜索引擎是一种搜索工具,如百度、360、谷歌、soso、必应、雅虎等都是搜索引擎的一种,是供网民搜索信息或查询产品等一些信息的一种工具,如想知道搜索引擎的名词解释,可以在百度
上查看专业的介绍,在这里不再具体说明,只需要了解就可以了。
另一方面搜索引擎是用什么抓取网站内容的呢?答案就是人们常说的搜索引擎蜘蛛,什么是搜索引擎蜘蛛呢?搜索引擎蜘蛛是搜索引擎的一种程序,是一套信息抓取系统程序。
我们常见的蜘蛛有好多种,有百度蜘蛛(baiduspider)谷歌蜘蛛(Gllglebot)、360蜘蛛(360Spider)、搜狗蜘蛛(Sogou News Spider )等搜索引擎都有自己的蜘蛛。了解如何抓取,找到其中的
规律。
了解什么是SEO,SEO优化就是指搜索引擎优化(Search Engine Optimization),也叫网站优化。
搜索引擎优化不容易,几百万甚至上千万的竞争对手里面,我们的目标不是前几百名,而是要争取前十名,甚至是第一名。这对网站seo初学者来说好多人都在想处理快速的学好,如何快速的
让搜索引擎抓取,这里是有规律可寻的,这样的收录方式,会在以后中分享。
了解了SEO就需要了解什么是关键词?关键词就是指参与排名的每一个词组。网站seo的优化也是关键词的排名优化。关键词优化的直接体现,就是网站标题(由关键词组成)的排名;从另一个方
面来说每个标题的排名,也就是标题所含页面的排名,每个页面的都是有参与排名的机会的,因此,网站排名的最小单位,也就是页面。
如何了解搜索引擎的抓取收录原理,以下分为四个流程:1、抓取,也就是网站内容让搜索引擎收录,有快照。
2、过滤,搜索引擎索引程序把蜘蛛抓取的页面文件分解、分析,并以巨大表格的形式存入数据库,这个过程就是索引(index)。在索引数据库中,网页文字内容,关键词出现的位置、字体
、颜色、加粗、斜体等相关信息都有相应记录。
搜索引擎索引数据库存储巨量数据,主流搜索引擎通常都存有几十亿级别的网页。 3、存储索引库 4、展示排序
搜索引擎的抓取收录流程图
蜘蛛抓取——网站页面——存放在临时索引库——排名情况(从索引库调取)
注解:
临时索引库并不是存放所有蜘蛛抓取的网站页面,
他会根据蜘蛛抓取页面的质量进行筛选,过滤一些质量差的页面,
再将质量好的页面,根据页面质量的好坏进行排序,
最终才是我们看到的排名情况
有人也许会问为什么我的网站没有被收录呢
主要原因之一就是网站页面质量较差,从而被搜索引擎过滤掉了,所以才没有被百度收录。
(一)搜索引擎抓取:
1、爬虫SPider顺着网页中的超链接,在互联网中发现、搜集网页信息
2、蜘蛛的抓取方式
1)深度抓取(竖着抓取,先抓取完一个栏目的内容页,然再换个栏目以同样的方式抓取)
2)广度抓取(横着抓取,先抓取完每个栏目也,再抓取每个栏目页下面的内容页)
3、不利于蜘蛛识别的内容
js代码,iframe框架代码机构,图片(添加alt属性辅助识别),flash(视频前后加文字辅助搜索引擎识别),需要登录之后才能获取的页面信息,嵌套table等
网站结构:首页——栏目页——内容详情页
(二)搜索引擎过滤
过滤低质量的内容页面
什么是低质量的内容页面呢
1、采集,内容价值低,多数内容在搜索引擎中生复出现。
2、内容和标题没有连贯性。
3、网站内容不丰富,没有及时的定期更新内容,内容不充足。
(三)搜索引擎存储索引库
对蜘蛛抓取的内容,经过筛选后,将内容存储在一个临时的数据索引库中。
(四)搜索引擎展示排序
将存储索引库的内容,根据质量的高低进行排序,然后调用出来展现给用户。
1、检索器根据用户输入的查询关键词,在索引库中快速检索文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并将查询结果展示出来反馈给用户。
2、当我们在搜索引擎看到的只是一结果,搜索根据各种算法进行排序,将质量最好的十个结果放在第一页
网站seo优化的平时要注意的一些问题:
1、网站有收录的页面不要随意删除或者移动位置
2、展现结果需要一定的时间(2个月之内是正常的)
3、内容的丰富度,保持一天最少一篇原创文章。
4、要吸引蜘蛛过来抓取,要通过要百度站长工具提交没有收录的页面网址,去一些大型的网站发些外链。
5、随时查看蜘蛛的跟踪,网站IIS日志和网站的数据统计。 通过以上的几个方面,网站的排名会提升很快,下面分享下我用这样的方式做上排名的网站截图,以下排名收录为206年6月3日截取.
|