这9种URL错误对SEO优化有致命影响

时光太瘦,指缝太宽。不经意间的一瞥,已隔经年。如果你不努力,一年后的你仍然是现在的你。要知道,你不是别人羡慕的“富二代”。你想要是生活,别人无法给你,只有靠自己拼搏,靠自己努力,靠自己奋斗,汗水永远比泪水更能打动成功,汗水的浇灌注定绽会放出绚丽的花朵!
一、url上使用#号好不好?
url当中的#号是一个锚点的标志位,这样的url打开之后会将访问者的视线定位在指定位置上,令访问者直接看到网页中间的一段内容。
很多站长直接在#号后面加参数且参数是有效的,即#号去掉与不去掉,打开的网页完全不同。
目前百度对带#号url的收录策略是:去掉#号后面的内容,仅对#号前面的url进行建库。这样就导致一些站长认为有意义有价值的页面,百度却无法收录,继而影响新链接的抓取和整体seo效果。
所以,站长在建站的时候对#号的使用一定要慎谨,百度站长平台不建议在有独特内容价值的url上使用#号,对于独特的内容,应该新开页面,用独立的url页面来承载该内容,让百度更容易抓取与识别。
二、url参数该如何使用呢?
也叫url query,是一个最复杂,最容易被忽视,这个问题多数出现在数据统计部门,如果去掉的话,该部门或其他部门就无法工作。
例如:为了统计一个页面,该用户是从哪个地方访问进来的,往往会在url中添加“?”问号,后面紧跟相关参数(时间参数、关键词参数、文章id参数等等)
这样做的弊端,也是显而易见的:
1、浪费搜索引擎对你网站的各项配额,从而影响其他正常的页面。
2、丢失很多本应拿到的链接加分,站外渠道的链接往往是最优质的。同一个url的分值可能分散成几十份。
3、seo的流量被统计到别的渠道(因为tracking字段写的是别的渠道,而且被收录被点击)
4、往往形成一种局面,产品用一套url,seo用另一套url, 甚至不同渠道用不同的url,后期开发和维护的成本极高。
遇到这种问题,也许大家都首先想到的是用canonical标签来解决,但在实际测试当中,百度对canonical标签的支持力度还是比较低的,所以,有好多人使用了该标签,但一直效果不佳的原因。那么大家可以尝试以下解决办法:
1、建立好网站的思维导图和元信息。
2、所有和seo元信息相关的参数都放到路径中去
3、所有和seo元信息不相干的参数都放到#后边,因为#后边不影响web服务器返回的内容。简单的说就是用#替代?。
4、每个页面中都利用js获取#后边的参数对,通过二次请求发回给统计服务器
5、如果#后边的参数影响页面内容,比如酒店的入住日期。那么这部分内容用ajax加载就行,他是不稳定的,不属于页面内容的一部分。
6、原始的#锚点定义肯定会冲突,定义一个#后边的变量,并用js控制屏幕滚动,来保证原始锚点的作用。
三、url中出现非必要元素?
出现这种情况,往往是产品或是初学seoer,想让url与页面相关性更强,才会使用。例如:
该页面讲的是上海某某酒店,那在url中,直接使用中文、中文全拼、英文等等。
如:/shanghai_moumou_hotel-12345678/
1.中文 (非必要元素)
2.由中文翻译的英文 (非必要元素)
3.id (必要元素)
其实,跟“相关性”比,url的唯一性与稳定性更为重要,那么这个url最佳的情况是:/hotel/shanghai/12345678/
四、url中出现大写字母合适吗?
对于这个问题,我只想说,大写字母统统换成小写字母。如果已经有大写字母的url了,那么做301跳转到小写字母上面,但一定要注意不要陷入301死循环中了。
五、url目录规范需要注意哪些?
把没有反斜杠的url做301跳转到带反斜杠的url上面。这句话,我相信做seo的人都知道,但往往在现实中,还是有很多网站,同时存在这两种url,虽然,把网站的收录无形的扩大了1倍,但危害远远要大于这个。对这个不多解释,有疑问可以给我留言,我一对一的帮你解决。
六、url避免出现太多无效目录,目录不宜过深
对于这个问题,就目前来说还是比较普遍存在的一个问题。这句话是什么意思了?直接看看下面举例,就知道了:
过多无效目录:/home/2017/08/07/2345.html
/home/a/1235.html
目录层次过深,简单理解就是你url中的反斜杠太多了;
无效目录,简单的理解就是你直接访问这个目录,该目录的页面是404,如
我直接访问:/home/2017/08/ 该页面是404;
我直接访问:/home/ 该页面是404。
尤其,是这种无效的目录,很多网站都存在,如发现有,请尽快进行解决。
七、对url中存在的数字没有进行判断
这个问题,对我来说,其实就是技术的逻辑不严谨导致的,试想一下,如果没有对url中的数字进行判断,那么url中的数字,我可以修改成任意数字,修改完后,访问该页面依旧返回200状态码。对于这个问题,就很严重了,如果被对手发现,会变成什么样?
出现该问题的页面类型,一般有:
1、筛选页面;
2、列表页面;
3、翻页;
4、id为主的详情页;
5、id为主的聚合页;
如果,发现自己网站存在这个问题的话,赶快让技术进行处理吧!
(直接把自己网站上面url中的数字改成任意数字,看看该页面能否访问)
八、不同的url都指向同一个页面
通过这个标题,我相信大家都应该知道是什么意思了。以前,最常见的就是动态url与静态url,都是可以访问到同一个页面,也都会想到使用canonical标签来解决。
其实,在我们实际中,还会遇到这种情况,就是一篇文章分了好多页面,还有一个把所有分页整合在一起的总页面,
例如:1111-p1.html、1111-p2.html、1111-all.html
对于这种页面,我们也要进行处理不然的话,对搜索引擎来说,也是重复页面。
九、pc端与移动端url不对应
这种问题主要指两者url结构完全不同,但页面内容是相同。
例如:
pc端url:/new/a/123.html
移动端url:/new/b/456.html
这种页面进行移动适配,虽然,理论上是没什么问题,但对于搜索引擎来说,还是不太方便,我们应该尽量做到pc与移动只有主域名不同,其他部分都相同,这样搜索引擎识别起来很方便,写适配正则也很方便。所以,应当尽量避免该问题的出现。
总结:
1、所有部门统一使用seo定义的url,屏蔽非seo url的入口。
2、用#替代?
3、统一使用小写
4、保证目录的规范
5、把不规范的url跳转到规范的url
6、在搭建网站结构、制作url时,尽量避开非主流设计,追求简单美即可, 越简单越平常,越好
7、不建议url中含有中文字符,中文字符容易出现识别问题
8、url长度要求从www开始到结束,总长度不超过1024个字节
9、避免无效参数,如ll(竖线)等
10、谨慎使用#参数,有可能会被爬虫截断,导致井号后面的url字符不生效,最终效果是网页抓取失败
11、避免出现太多无效目录,目录不宜过深,否则会影响链接层级计算,也不利于抓取。
您的关注,就是我最大的动力