石家庄网跃科技:石家庄网站建设 || 石家庄网络公司 | 新闻
  • Messager:
  • info@wyvip.cn
  • www.wyvip.cn
  • Telephone:
  • 186 3306 1993
  • +86.0311-88895853
  • Address:
  • 石家庄市长安区嘉和广场2号楼15层
您们的意见,是我们前进路上的指路标。

2015,感谢一路有您!

网跃科技,期待您的加入...,相约2015-永久

那些我们应该全力避免的蜘蛛陷阱

有一些网站设计技术对搜索引擎来说很不友好,不利于蜘蛛爬行和抓取,这些技术被称为蜘蛛陷阱。下面我们就来一起看看那些应该全力避免的蜘蛛陷阱。

1.Flash
在网页的某一小部分使用Flash增强视觉效果是很正常的,比如用Flash做成的广告图标等。这种Flash和图片是一样的,只是HTML代码中的很小一部分,页面上还有其他以文字为主的内容,所以对搜索引擎抓取和收录没有影响。例如帆布工场(http://www.canvasworks.cn)刚开始老板就以视觉效果角度出发非要是flash页面,经过我给老板努力地解释最终还是放弃了Flash,其实HTML页面设计的好也是同样可以达到一定的视觉效果的。
但是有的网站整个首页就是一个大的Flash文件,这就构成了蜘蛛陷阱。搜索引擎抓取的HTML代码只有一个连向Flash文件的链接,没有其他文字内容。这种网站整个就是一个Flash的网站,可能视觉效果做得精彩异常,可惜搜索引擎看不到,不能索引出任何文字信息,也就无法判断相关性。
有的网站喜欢在首页放一个Flash动画片头(Flash Intro),用户访问网站看完片头后被转向真正的HTML版本的文字网站首页。搜索引擎不能读取Flash,一般没有办法从Flash Intro跟踪到HTML版本页面。
近几年搜索引擎不停尝试读取Flash文件,尤其是里面的文字内容和链接,也取得了一定进展。站长可以使用SWFObject和sIFR等技术使Flash文件更易于被搜索引擎读取。不过的我的观点是,与其费尽去研究怎么让搜索引擎读取Flash文件,不如做成普通的HTML版本的网站。
整个网站就是一个大的Flash文件,从SEO角度来说是万万不能的,如果Flash效果是必须的,至少也需要在首页加上一个通往HTML版本的链接。这个链接应该是在Flash文件之外的HTML代码中,搜索引擎跟踪这个链接可以抓取后面的HTML版本页面。
2.Session ID
有些网站使用Session ID(会话ID)跟踪用户访问,每个用户访问网站时都会生成独特唯一的Session ID,加在URL中。搜索引擎的每一次访问也会被当成一个新的用户,URL中会加上一个不同Session ID,这样搜索引擎蜘蛛每次来访问时所得到的同一个页面的URL将不一样,后面带着一个不一样的Session ID。这也是最常见的蜘蛛陷阱之一。在这里建议跟踪用户访问应该使用cookies而不要生成Session ID。或者程序判断访问者是搜索引擎还是普通用户,如果是搜索引擎指数则不生成Session ID。跟踪搜索引擎蜘蛛的访问是没有什么意义的,蜘蛛既不会填表也不会把商品放入购物车。
3.各种跳转
我们都是知道搜索引擎针对301转向还是比较友好的,但是搜索引擎对于除301之外的跳转就没有那么友好了。如302跳转、JavaScript跳转、Flash跳转、Meta Refresh跳转。所以在这里建议大家如果必须跳转那么301转向是搜索引擎推荐的、用于网址更改的转向,301转向可以把页面权重从就网址转移到新网址。其他转向方式都对蜘蛛爬行不利。
4.框架结构
使用框架机构设计页面,在网站诞生初期曾经很流行,因为对网站的页面更新维护有一定的方便性。不过现在的网站已经很少使用框架了。不利于搜索引擎抓取是框架越来越不流行的重要原因之一。对搜索引擎来说,访问一个使用框架的网址所抓取的HTML只包含调用其他HTML文件的代码,并不是包含任何文字信息,搜索引擎根本无法判断这个网址的内容是什么。虽然蜘蛛可以跟踪框架中所调用的其他HTML文件,但是这些文件经常是不完整的页面,比如没有导航只是正文。搜索引擎也无法判断框架中页面内容应该属于主框架,还是属于框架调用文件。
5.动态URL
动态URL指的是数据库驱动的网站所生成的、带有问号、等号及参数的网址。一般来说动态URL不利于搜索引擎蜘蛛爬行,应该尽量避免。
6.JavaScript链接
由于JavaScript可以创造出很多吸引人的视觉效果,有些网站喜欢使用JavaScript脚本生成导航系统。这也是比较严重的蜘蛛陷阱之一。虽然搜索引擎都在常识解析JS脚本,。不过我们不能寄希望于搜索引擎自己去客服困难,而要让搜索引擎跟踪爬行链接的工作尽量简单。
据我观察,虽然有的搜索引擎在技术上可以获得JavaScript脚本中包含的链接,甚至可以执行脚本并跟踪链接,但是对一些权重比较低的网站,搜索引擎觉得没有必要,不会费那个劲。所以网站上的链接必须使用最简单标准的HTML链接,尤其是导航系统。用CSS做导航系统一样可以实现很多的视觉效果。另外JavaScript链接在SEO 中也是哟这特殊的用途,那就是站长不希望被收录的页面,不希望传递权重的链接,可以使用JavaScript脚本阻挡搜索引擎爬行。

有一些网站设计技术对搜索引擎来说很不友好,不利于蜘蛛爬行和抓取,这些技术被称为蜘蛛陷阱。下面我们就来一起看看那些应该全力避免的蜘蛛陷阱。

1.Flash
在网页的某一小部分使用Flash增强视觉效果是很正常的,比如用Flash做成的广告图标等。这种Flash和图片是一样的,只是HTML代码中的很小一部分,页面上还有其他以文字为主的内容,所以对搜索引擎抓取和收录没有影响。例如帆布工场(http://www.canvasworks.cn)刚开始老板就以视觉效果角度出发非要是flash页面,经过我给老板努力地解释最终还是放弃了Flash,其实HTML页面设计的好也是同样可以达到一定的视觉效果的。
但是有的网站整个首页就是一个大的Flash文件,这就构成了蜘蛛陷阱。搜索引擎抓取的HTML代码只有一个连向Flash文件的链接,没有其他文字内容。这种网站整个就是一个Flash的网站,可能视觉效果做得精彩异常,可惜搜索引擎看不到,不能索引出任何文字信息,也就无法判断相关性。
有的网站喜欢在首页放一个Flash动画片头(Flash Intro),用户访问网站看完片头后被转向真正的HTML版本的文字网站首页。搜索引擎不能读取Flash,一般没有办法从Flash Intro跟踪到HTML版本页面。
近几年搜索引擎不停尝试读取Flash文件,尤其是里面的文字内容和链接,也取得了一定进展。站长可以使用SWFObject和sIFR等技术使Flash文件更易于被搜索引擎读取。不过的我的观点是,与其费尽去研究怎么让搜索引擎读取Flash文件,不如做成普通的HTML版本的网站。
整个网站就是一个大的Flash文件,从SEO角度来说是万万不能的,如果Flash效果是必须的,至少也需要在首页加上一个通往HTML版本的链接。这个链接应该是在Flash文件之外的HTML代码中,搜索引擎跟踪这个链接可以抓取后面的HTML版本页面。
2.Session ID
有些网站使用Session ID(会话ID)跟踪用户访问,每个用户访问网站时都会生成独特唯一的Session ID,加在URL中。搜索引擎的每一次访问也会被当成一个新的用户,URL中会加上一个不同Session ID,这样搜索引擎蜘蛛每次来访问时所得到的同一个页面的URL将不一样,后面带着一个不一样的Session ID。这也是最常见的蜘蛛陷阱之一。在这里建议跟踪用户访问应该使用cookies而不要生成Session ID。或者程序判断访问者是搜索引擎还是普通用户,如果是搜索引擎指数则不生成Session ID。跟踪搜索引擎蜘蛛的访问是没有什么意义的,蜘蛛既不会填表也不会把商品放入购物车。
3.各种跳转
我们都是知道搜索引擎针对301转向还是比较友好的,但是搜索引擎对于除301之外的跳转就没有那么友好了。如302跳转、JavaScript跳转、Flash跳转、Meta Refresh跳转。所以在这里建议大家如果必须跳转那么301转向是搜索引擎推荐的、用于网址更改的转向,301转向可以把页面权重从就网址转移到新网址。其他转向方式都对蜘蛛爬行不利。
4.框架结构
使用框架机构设计页面,在网站诞生初期曾经很流行,因为对网站的页面更新维护有一定的方便性。不过现在的网站已经很少使用框架了。不利于搜索引擎抓取是框架越来越不流行的重要原因之一。对搜索引擎来说,访问一个使用框架的网址所抓取的HTML只包含调用其他HTML文件的代码,并不是包含任何文字信息,搜索引擎根本无法判断这个网址的内容是什么。虽然蜘蛛可以跟踪框架中所调用的其他HTML文件,但是这些文件经常是不完整的页面,比如没有导航只是正文。搜索引擎也无法判断框架中页面内容应该属于主框架,还是属于框架调用文件。
5.动态URL
动态URL指的是数据库驱动的网站所生成的、带有问号、等号及参数的网址。一般来说动态URL不利于搜索引擎蜘蛛爬行,应该尽量避免。
6.JavaScript链接
由于JavaScript可以创造出很多吸引人的视觉效果,有些网站喜欢使用JavaScript脚本生成导航系统。这也是比较严重的蜘蛛陷阱之一。虽然搜索引擎都在常识解析JS脚本,。不过我们不能寄希望于搜索引擎自己去客服困难,而要让搜索引擎跟踪爬行链接的工作尽量简单。
据我观察,虽然有的搜索引擎在技术上可以获得JavaScript脚本中包含的链接,甚至可以执行脚本并跟踪链接,但是对一些权重比较低的网站,搜索引擎觉得没有必要,不会费那个劲。所以网站上的链接必须使用最简单标准的HTML链接,尤其是导航系统。用CSS做导航系统一样可以实现很多的视觉效果。另外JavaScript链接在SEO 中也是哟这特殊的用途,那就是站长不希望被收录的页面,不希望传递权重的链接,可以使用JavaScript脚本阻挡搜索引擎爬行。

0311 - 88895853

Address:

石家庄市长安区嘉和广场2号楼15层

www.wyvip.cn / info@wyvip.cn

ATTENTION

网跃微信公众平台
轻松秒读,快捷进入!

©2005-2017 WYVIP 网跃科技. All Right Reserved. 冀ICP备12008384号