导读:我们知道,当搜索引擎第一次知道一个网站时,它通常会根据页面内容来检查网站的主题相关性。一般来说,这个判断过程可能是:对所有页面内容进行中文分词后,对特定的关键词标签进行分类,进行数据分析。
在做SEO的过程中,这期间220到116的百度蜘蛛是否会访问,似乎成了SEO从业者的热门话题。很多SEO从业者都在绞尽脑汁提高搜索引擎的抓取频率,大概率收录页面内容。
但是有时候我们运营一个新站,很多SEO从业者都想保持每天输出文章的内容,保持较高的每日更新频率,从而提高百度蜘蛛的抓取频率。这个想法是好的,但是我们是否有更完善的解决方案可能需要进一步分析。
跟进SEO诊断的经验,蝙蝠侠IT,将通过以下内容进行说明:
1频率
可持续的内容输出总会吸引高频的抓取,这是毋庸置疑的事情。长期以来,每个搜索引擎优化器都采用这种策略来保持高频率的网站访问,从而提高网站页面的包含率。
但是有一个微妙的细节,就是抓取频率的数量级:我们认为每个网站页面的抓取都有一个数量级。一个新的网站,已经有10-100页了,一定要有一个初始的抓取量级。
这种频率通常会影响后续访问的次数。最近我们也做了一些基础测试,发现新站内容丰富的站点比新站内容相对空洞的站点高很多,如下图所示:
这是一个初始内容约150篇文章的网站。基本上我们可以看到搜索引擎给出的爬行频率还是比较高的。
2结构
在SEO运营过程中,我们发现网站结构设计往往也是高频爬行的重要影响因素。通常,我们认为:
(1)页面随机内容
一般来说,除了链接提交的策略,我们希望整个网站页面显示更多的整个网站的内容。所以有时候,我们可能需要充分利用随机内容,大大填充页面的主要内容和相关侧边栏。
首先,我们可以不断提高页面呈现的概率。
第二,我们可以保持页面不断变化,从而吸引搜索引擎频繁访问,发现新的页面。
②页面目录结构
在SEO的过程中,我们总会听到一些概念,比如:泛目录,往往与蜘蛛池有关,主要是为了获取大量的搜索引擎蜘蛛,从而提高目标URL地址的抓取概率。
这就不可避免地让我们想到,为什么一些特定的目录结构会吸引更多的蜘蛛,如果试图吸引大量的蜘蛛,我们真的需要大量的域名吗?
我们一直认为并不是这样,所以有时间的时候就在思考如何利用单个域名最大限度的得到高频抓取。我们发现常规URL地址往往是最容易抓取的主要特征,包括:页面URL的ID,页面URL的目录。
如果你的ID是按照逻辑顺序生成的,它特别容易吸引搜索引擎按顺序爬行,比如:/a/1.html,/a/2.html,/a/3.html,/a/*.html。
如果你的目录是简洁的比如:/a/1.html,/b/2.html,/c/.3.html,同样会吸引对方高频次的抓取。
因此,良好的目录结构,有效的页面展现策略,往往是获得搜索引擎爬虫偏爱的特质。
③主题
我们知道,当搜索引擎第一次知道一个网站时,它通常会根据页面内容来检查网站的主题相关性。一般来说,这个判断过程可能是:对所有页面内容进行中文分词后,对特定的关键词标签进行分类,进行数据分析。如果你在某个行业的话题标签比例比较高,整个网站的属性可能会更清晰。
基于这个因素,我们认为新站的丰富内容是决定整个站垂直度的重要因素。
所以我们建议新网站尽量在丰富了整个网站的内容之后再提交,可能会比较空洞,然后按照一定的输出频率提交比较有效。
总结:SEO衡量:新站上线,理论上内容丰富的站可能在初始抓取频率的数量级上更占优势,后期根据具体频率输出,可能更受搜索引擎关注。
Comments | NOTHING