简易说,贴子强调一个比较严重并且实际的SEO难题:许多 网址,尤其是B2C,商品标准过滤系统软件(如挑选商品的知名品牌、价钱、规格、特性、主要参数等)会造成很多失效URL,往往称之为失效仅仅从SEO角度观察的,这种URL并不可以造成SEO功效,反而有负面信息功效,因此 这种URL不收录为好,缘故包含:

很多过滤标准页面內容反复或极其相近(很多拷贝內容将使网址总体品质降低)
很多过滤标准页面沒有相匹配商品,页面无內容(如挑选“一百元下列42寸LED电视机”这类的)
绝大多数过滤标准页面沒有排行工作能力(排行工作能力比归类页面低得多)却消耗一定权重
这种过滤标准页面也不是商品页面收录的必需安全通道(商品页面应当有其他内部链接协助爬行和收录)
爬行很多过滤标准页面巨大消耗搜索引擎蜘蛛爬行時间,导致有效页面收录机遇降低(过滤标准页面组成起來是大量的)
简易说,贴子强调一个比较严重并且实际的SEO难题:许多 网址,尤其是B2C,商品标准过滤系统软件(如挑选商品的知名品牌、价钱、规格、特性、主要参数等)会造成很多失效URL,往往称之为失效仅仅从SEO角度观察的,这种URL并不可以造成SEO功效,反而有负面信息功效,因此 这种URL不收录为好,缘故包含:

很多过滤标准页面內容反复或极其相近(很多拷贝內容将使网址总体品质降低)
很多过滤标准页面沒有相匹配商品,页面无內容(如挑选“一百元下列42寸LED电视机”这类的)
绝大多数过滤标准页面沒有排行工作能力(排行工作能力比归类页面低得多)却消耗一定权重
这种过滤标准页面也不是商品页面收录的必需安全通道(商品页面应当有其他内部链接协助爬行和收录)
爬行很多过滤标准页面巨大消耗搜索引擎蜘蛛爬行時间,导致有效页面收录机遇降低(过滤标准页面组成起來是大量的)
那麼如何尽可能使这种URL不被爬行和数据库索引、收录呢?但是遗憾,我现阶段搞不懂极致的解决方案。明确提出2个方式,我认为都没法极致处理。

第一个方式,是将不愿收录的URL维持为动态性URL,乃至有意越动态性越好,以阻拦被爬行和收录。可是,搜索引擎如今都能爬行、收录动态性URL,并且技术性上愈来愈并不是难题。尽管主要参数多到一定水平的确不利收录,但4、五个主要参数一般 还能够收录。我们无法确定必须是多少主要参数才可以阻拦收录,因此 不可以作为一个靠谱的方式。并且这种URL接受内部链接,又没什么排行工作能力,依然会消耗一定权重。

第二个方式,robots严禁收录。一样,URL接受了内部链接也就接受了权重,robots文件严禁爬行这种URL,因此 接受的权重不可以传送出来(搜索引擎不爬行就不清楚有哪些导出链接),页面变成权重只进不出的超级黑洞。

连向这种URL的连接相互配合nofollow也有缺憾,和robots严禁相近,nofollow在Google的实际效果是这种URL沒有接受权重,权重却都没有被分派到其他连接上,因此 权重一样消耗了。百度搜索据悉适用nofollow,但权重怎么处理不明。

将这种URL连接放到Flash、JS里都没有用,搜索引擎早已能够爬行Flash、JS里的连接,并且可能之后愈来愈善于爬。许多 SEO忽视了的一点是,JS中的连接不但能被爬,也可以传送权重,和一切正常联接一样。

还可以将过滤标准连接制成AJAX方式,客户点一下后不容易浏览一个新的URL,還是在原先URL上,URL后边加了#,不容易被当做不一样URL。和JS难题一样,搜索引擎已经积极主动试着爬行、爬取AJAX里的內容,这一方式都不商业保险。

还一个方式是在页面head一部分加noindex follow标识,意即本页面不必数据库索引,但追踪页面上的连接。那样能够处理拷贝內容难题,也解决了权重超级黑洞难题(权重是能够伴随着导出链接传入其他页面的),不可以处理的是消耗搜索引擎蜘蛛爬行时间问题,这种页面還是要被搜索引擎蜘蛛爬行爬取的(随后才可以见到页面html里的noindex follow标识),对一些网址而言,过滤页面总数极大,爬行了这种页面,搜索引擎蜘蛛就没充足時间爬有效页面了。

再一个能够考虑到的方式是掩藏页面(cloaking),也就是用程序流程检验来访者,是搜索引擎搜索引擎蜘蛛得话回到的页面摘掉这种过滤标准连接,是客户得话才回到一切正常的有过滤标准的页面。这是一个较为理想化的解决方案,唯一的难题是,很有可能被作为舞弊。搜索引擎常跟SEO讲的分辨是不是舞弊的最大标准是:要是没有搜索引擎,你是否会那么做?也就是说,某类方式是不是仅仅为了更好地搜索引擎而选用?显而易见,用cloaking掩藏不愿被爬行的URL是为搜索引擎做的,并不是为客户做的。尽管这类状况下的cloaking目地是幸福的,沒有故意的,但风险性是存有的,大胆的可使用

还一个方式是应用canonical标识,较大 难题是百度搜索是不是适用不明,并且canonical标识是对搜索引擎的提议,并不是命令,换句话说这一标识搜索引擎很有可能不遵循,相当于不起作用。此外,canonical标识的原意是特定规范性网站地址,过滤标准页面是不是可用有一些有疑问,终究,这种页面上的內容常常是不一样的。

现阶段比较好的方式之一是iframe robots严禁。将过滤一部分编码放入iframe,相当于启用其他文档內容,对搜索引擎而言,这些內容不属于当今页面,也即掩藏了內容。但不属于当今页面并不等于不会有,搜索引擎是能够发觉iframe中的內容和连接的,還是很有可能爬行这种URL,因此 加robots严禁爬行。iframe中的內容依然会有一些权重外流,但由于iframe里的连接并不是从当今页面分离权重,而仅仅从启用的哪个文档分离,因此 权重外流是较为少的。除开排版设计、电脑浏览器兼容模式这类的头痛难题,iframe方式的一个潜在性难题是被觉得舞弊的风险性。如今搜索引擎一般不觉得iframe是舞弊,许多 广告宣传便是放到iframe中,但掩藏一堆连接和掩藏广告宣传有一些细微的差别。返回搜索引擎分辨舞弊的总正常情况下,不好说这不是专业为搜索引擎做的。还记得Matt Cutts说过,Google之后很有可能更改解决iframe的方法,她们還是期待在同一个页面上见到单用户能见到的全部內容。

总而言之,对这一实际、比较严重的难题,我现阶段沒有自身感觉极致的回答。自然,不可以极致处理并不是就不可以活了,不一样网址SEO关键不一样,实际难题深入分析,选用所述方式中的一种或几类应当能够处理关键难题。

而最为较大 的难题还并不是所述这种,只是有时你要让这种过滤页面被爬行和收录,这才算是餐具的逐渐。之后再探讨。

一是将不愿收录的URL维持为动态性URL,乃至有意越动态性越好,以阻拦被爬行和收录。可是,搜索引擎如今都能爬行、收录动态性URL,并且技术性上愈来愈并不是难题。尽管主要参数多到一定水平的确不利收录,但4、五个主要参数一般 还能够收录。我们无法确定必须是多少主要参数才可以阻拦收录,因此 不可以作为一个靠谱的方式。并且这种URL接受内部链接,又没什么排行工作能力,依然会消耗一定权重。

第二个方式,robots严禁收录。一样,URL接受了内部链接也就接受了权重,robots文件严禁爬行这种URL,因此 接受的权重不可以传送出来(搜索引擎不爬行就不清楚有哪些导出链接),页面变成权重只进不出的超级黑洞。

连向这种URL的连接相互配合nofollow也有缺憾,和robots严禁相近,nofollow在Google的实际效果是这种URL沒有接受权重,权重却都没有被分派到其他连接上,因此 权重一样消耗了。百度搜索据悉适用nofollow,但权重怎么处理不明。

将这种URL连接放到Flash、JS里都没有用,搜索引擎早已能够爬行Flash、JS里的连接,并且可能之后愈来愈善于爬。许多 SEO忽视了的一点是,JS中的连接不但能被爬,也可以传送权重,和一切正常联接一样。

还可以将过滤标准连接制成AJAX方式,客户点一下后不容易浏览一个新的URL,還是在原先URL上,URL后边加了#,不容易被当做不一样URL。和JS难题一样,搜索引擎已经积极主动试着爬行、爬取AJAX里的內容,这一方式都不商业保险。

还一个方式是在页面head一部分加noindex follow标识,意即本页面不必数据库索引,但追踪页面上的连接。那样能够处理拷贝內容难题,也解决了权重超级黑洞难题(权重是能够伴随着导出链接传入其他页面的),不可以处理的是消耗搜索引擎蜘蛛爬行时间问题,这种页面還是要被搜索引擎蜘蛛爬行爬取的(随后才可以见到页面html里的noindex follow标识),对一些网址而言,过滤页面总数极大,爬行了这种页面,搜索引擎蜘蛛就没充足時间爬有效页面了。

再一个能够考虑到的方式是掩藏页面(cloaking),也就是用程序流程检验来访者,是搜索引擎搜索引擎蜘蛛得话回到的页面摘掉这种过滤标准连接,是客户得话才回到一切正常的有过滤标准的页面。这是一个较为理想化的解决方案,唯一的难题是,很有可能被作为舞弊。搜索引擎常跟SEO讲的分辨是不是舞弊的最大标准是:要是没有搜索引擎,你是否会那么做?也就是说,某类方式是不是仅仅为了更好地搜索引擎而选用?显而易见,用cloaking掩藏不愿被爬行的URL是为搜索引擎做的,并不是为客户做的。尽管这类状况下的cloaking目地是幸福的,沒有故意的,但风险性是存有的,大胆的可使用。

还一个方式是应用canonical标识,较大 难题是百度搜索是不是适用不明,并且canonical标识是对搜索引擎的提议,并不是命令,换句话说这一标识搜索引擎很有可能不遵循,相当于不起作用。此外,canonical标识的原意是特定规范性网站地址,过滤标准页面是不是可用有一些有疑问,终究,这种页面上的內容常常是不一样的。

现阶段比较好的方式之一是iframe robots严禁。将过滤一部分编码放入iframe,相当于启用其他文档內容,对搜索引擎而言,这些內容不属于当今页面,也即掩藏了內容。但不属于当今页面并不等于不会有,搜索引擎是能够发觉iframe中的內容和连接的,還是很有可能爬行这种URL,因此 加robots严禁爬行。iframe中的內容依然会有一些权重外流,但由于iframe里的连接并不是从当今页面分离权重,而仅仅从启用的哪个文档分离,因此 权重外流是较为少的。除开排版设计、电脑浏览器兼容模式这类的头痛难题,iframe方式的一个潜在性难题是被觉得舞弊的风险性。如今搜索引擎一般不觉得iframe是舞弊,许多 广告宣传便是放到iframe中,但掩藏一堆连接和掩藏广告宣传有一些细微的差别。返回搜索引擎分辨舞弊的总正常情况下,不好说这不是专业为搜索引擎做的。还记得Matt Cutts说过,Google之后很有可能更改解决iframe的方法,她们還是期待在同一个页面上见到单用户能见到的全部內容。

总而言之,对这一实际、比较严重的难题,我现阶段沒有自身感觉极致的回答。自然,不可以极致处理并不是就不可以活了,不一样网址SEO关键不一样,实际难题深入分析,选用所述方式中的一种或几类应当能够处理关键难题。

而最为较大 的难题还并不是所述这种,只是有时你要让这种过滤页面被爬行和收录,这才算是餐具的逐渐。之后再探讨。

热搜词

中文域名 无法访问2013性价比最高的机箱中国万网代理至强l5520和5420哪个好域名没有注册的建网站 域名网站备案注意网站备案太麻烦中国电信监控机房职责dns可以将网站域名解析国外虚拟主机 两个网站wdcp备份的数据库在哪阿里云和新网知道人名和公司 怎么找邮箱全能网站服务器应用服务器的全称是什么价格最低的企业邮箱4006电话是免费的吗主机的安装过程主服务器和分服务器免费ftp网站首页url只能填写域名中的一个购物网站用香港空间中文域名反解iis 网站打不开获得网站后台地址一个网站需要哪些备案可以不可以将域名于空间 换个绑定的空间主机屋后台的使用方法织梦网站转移服务器中国移动企业短信群发平台smscname和a记录的区别上传网站程序100M的云主机 宽带 空间数据中心服务商台湾中华电信机房自己的主机做服务器网站如何备案网站 代理太原南中环附近电信隐藏跳转的地址阿里云的域名绑定域名保护的意义台湾数据中心施工公司网站新备案不能访问域名解析的主要过程网站安全狗iis版 php网站空间 按流量计费怎么攻打别人的外挂服务器域名的状态url转发的好处万网用户中心cdn 中的cname解析企业数据中心西部数码的dns数据中心机房油机免费dns的弊端中国最早的域名数据中心联盟官网上海做服务器的公司下列属于域名的是网站二级目录怎么设置网址后缀网站域名放国外网站备案需要关站视频网站要多大虚拟主机国外的ftp工业和信息化部网站备案查询成都中立数据科技有限公司招聘阿里云服务器和万网好用的美国主机中国电信 联通 cdn广东省网站备案域名购买哪个网站好云主机和vps哪个好用sae 网站备案独享互联的空间怎么样数据中心 分布idc的垃圾服务器网站备案初审网站到公安局备案url转发条数中国电信机房交换机类型中国 域名列表买空间哪个网站好建立个人站点的软件易名中国 dnspodwindows php curl扩展url转发是什么意思工信部 网站备案 上传电子如何在mysql数据库中自动生成录入时间香港的dns服务器网站注册信息查询电信的arp病毒万网和万维网哪个好10m独享和100m 深圳托管费用云南省网站备案商务中国域名管理网站上线除了备案还需要什么商务互联 网站企业邮局和域名关系真的有息壤