多语版网站的URL结构指南

国际和多语言seo可以说是seo职权范围内更具挑战性的学科之一。
这可以通过具有hreflang错误的网站数量以及正在实施的常见误解的数量来显示。
虽然有决定考虑哪些语言和国家/地区,考虑到更广泛的业务因素,但仍需要做出技术决策 – 其中一项是您的网址结构的国际设置。
url的剖析在本文中,我将引用url(统一资源定位符),uri(统一资源标识符)和urn(统一资源名称)。差异可以通过下图解释:
url只能用于描述包含方案,主机和路径的完整(或绝对)。urn只能用于描述路径。一切都是uri。简而言之,所有urn和url都是uri,但并非所有uri都是url。
多语言url结构根据国际seo的url结构,有五种主要方式可以建立网站。这些是:
带有子文件夹的gtld带有子域名的gtld根域的不同cctld带参数的gtld完全不同的域名虽然有很多文章探讨了每种实现方法的优缺点,我将在稍后介绍其中的一些,但也存在技术堆栈的局限性。
例如,如果您使用shopify,则需要为每个国际版本设置新的shopify店面(除非您想使用插件通过javascript重写货币和价格)。
这意味着您可能需要使用不同的cctld或域,同时通过shopify的主题流体注入hreflang。
每种方法的优点您可以成功使用上述五种实现方法中的任何一种,因为有大量变量可用于多语言seo活动的成功 – 这只是其中之一。
不同的cctld这些信息向搜索引擎发送最强烈的信号,说明目标国家/地区。例如,domain.fr是法国的强烈征兆。
这种方法通常维护成本更高(因为它维护多个域),并且每个方法都有自己的反向链接配置文件来构建和维护。
多年来,一些cctld(例如.co和.ax)已被用于非国际目的,作为单词的结尾。
例如,bron.co和beesw.ax从营销和品牌的角度来看可能看起来很聪明,但实际上,它们是哥伦比亚和奥兰群岛的cctld。
子域和子目录不想重新引发像时间一样古老的seo辩论,使用具有子域名或子目录路线的gtld都是国际seo的可行实施。两者都在“野外”实施并取得了很大成功。
cnn和hotels.com是用于多语言url结构的子域的示例,而beatsbydre和imperva incapsula是子目录的示例。
根据经验,我在两种实现方法上都取得了成功 – 但是这里有一个更全面的分析,包括jenny halasz对子域名和子文件夹的争论。
从开发角度来看,您可以将其他平台和数据库映射到子域,或者将它们反向代理到子文件夹。
这又取决于技术堆栈的局限性,两者都可以通过边缘seo和用户工作者来处理映射或反向代理。
参数这是域附加了?lang = fr?url参数或类似的地方。
虽然这可以工作,但这是我推荐的实现方法,因为它不是用户友好的链接。
完全不同的领域与不同的cctld方法类似,使用不同的域名可能是一个富有成效的国际seo策略,特别是如果您的域名不是您的品牌名称。
可以从这种方法中受益的业务的一个很好的例子是英国零售品牌b&q,它使用域名diy.com(因为它们是diy零售业务)。
diy(自己动手)可能无法直接翻译成其他语言,因此这将成为完全使用不同域名的候选者。
某些国家/地区的url最佳做法在决定您的初始网址结构时,重要的是要彻底研究并考虑不仅非google搜索引擎的文化差异和细微差别,还要考虑不同的用户群。
日本的url最佳实践没有因果关系证明,拥有日本特定的cctld(例如.co.jp)比谷歌日本,goo.ne.jp或雅虎的排名更具优势。
将日语的url放在一起并帮助进行本地化时,您应该在urn中使用日语字符。
例如,如果您是一家针对日本市场的美国旅游公司,预订酒店,您的网址可能如下所示:
travel-usa.com/wisconsin/旅行/旅行?是汉字中的ryokou。日本使用多种字母表,包括汉字,平假名和片假名。
日本用户在将搜索查询转换为首选写作风格之前通常会输入拉丁文。平假名是日本最常用的字母,而片假名通常用于外来词。
只要您的url是utf-8编码,如果格式正确,日语字符将显示在serp中。
俄罗斯和yandex的url最佳实践与谷歌不同,yandex重视关键词包含在路径中 – 尽管重要的是它们不是以“垃圾邮件的方式”使用。
yandex的另一个常见问题是在定位俄罗斯时在网址中使用西里尔字母,谷歌关于该主题的官方署名是:
“[w] e(google)可以正常抓取非拉丁网址并将其编入索引。”
现实世界中一个很好的例子是维基百科的俄语版本,他使用西里尔语路径:
компьютер(计算机)的俄语维基百科页面
但是,当您将url复制并粘贴到浏览器之外时,cyrillic格式不正确,而是会出现损坏的路径:
https://ru.wikipedia.org/wiki/%d0%9a%d0%be%d0%bc%d0%bf%d1%8c%d1%8e%d1%82%d0%b5%d1%80
但是当您将其粘贴回浏览器(例如chrome或yabrowser)时,它可以正常工作并进行格式化。
中国和百度的url最佳实践百度与谷歌的运营方式不同,与谷歌有许多不同之处。它如何处理url以及百度定义为“友好”url的方式与谷歌略有不同。
使用百度,您应该不惜一切代价避免使用带参数的网址,因为百度可能会在抓取这些网页时遇到问题。与google类似,最佳做法是使用描述性urn。
与日本不同,还建议不要在url中使用中文字符。这是因为某些中文字符存在编码问题,这可能导致uri路径中出现不可读的字符。
这将导致百度 – 蜘蛛爬行和发现uri上的内容出现问题。但是,您可以用拼音替换汉字。