建立多区域网站和多语言网站注意事项
- 多语言网站:这类网站会运用多种语言来呈现内容。打个比方,有一家加拿大的企业,其官网就设有英语版与法语版。当用户使用 Google 搜索时,搜索引擎会尽力筛选出与搜索者所用语言适配的网页。
- 多区域网站:主要是把不同国家或地区的用户当作核心目标受众。比如,某产品制造商的业务覆盖了加拿大和美国,其对应的网站就着眼于服务这两国的消费者。此时,Google 搜索便会尝试匹配与搜索用户所处语言区域相符的网页。
还有些网站身兼二者特性,既是多区域的,也是多语言的。就像某个网站,它分别面向美国、加拿大用户定制了专属版本,而且给加拿大用户呈现的内容里,还同时备有英语、法语两种版本。
管理网站多语言版本指南
倘若您的网站存在多种语言的相同内容,不妨参考如下建议,助力用户以及 Google 搜索精准定位到适配的网页:一、为不同语言版本配置独立网址
Google 提倡针对各语言版本的网页,分别设置独一无二的网址,而非依赖 Cookie 或是浏览器设置来切换网页内容的语言。之所以这样建议,是因为独立网址更便于搜索引擎精准识别与抓取。二、善用 hreflang 注释
当您已经为不同语言版本安排了不同网址,那就得借助 hreflang 注释这一工具,它能引导 Google 搜索结果精准指向网页对应的正确语言版本,避免用户访问到错误的语言页面,极大提升用户的搜索体验。三、谨慎采用动态内容更改与用户重路由
要是您盘算着依据语言设置,动态更新网站内容,或是重新规划用户访问路径,那可得留意了。Google 很可能没办法把您所有的内容变体版本都找出来并抓取,原因主要有两点:其一,Googlebot 抓取工具大多源自美国;其二,这个抓取工具在发送 HTTP 请求时,并不会在请求标头里设定 Accept-Language,这就使得它难以精准捕捉动态变化的多语言内容。
下面内容需要科学上网环境(能看外网的环境)
向 Google 说明网页的不同语言版本
Google 提供了多种方式,助您给网页的语言或区域变体添加标签,像 hreflang 注释、站点地图这类方法都能派上用场。请务必选用恰当的手段,为您的网页做好标记。让网页语言清晰可辨
Google 判断网页语言,靠的是网页上肉眼可见的内容,而非代码层面的语言信息(诸如 lang 属性),也不看网址。您只要保证每个网页的内容与导航元素都采用同一种语言,别把原文和译文同时展示,就能帮 Google 精准判定网页语言。要是只翻译网页的模板文字,网页大部分内容却还用同一种语言呈现(含用户生成内容的网页常出现这种状况),那同样的内容就可能会以不同模板语言在搜索结果里反复出现,大大降低用户体验。建议您用 robots.txt 阻止搜索引擎抓取网站上自动翻译的网页。自动翻译出来的内容往往晦涩难懂,甚至会被当成网络垃圾。更关键的是,蹩脚生硬的翻译很容易给访客留下糟糕的网站印象。
助力用户切换网页语言
要是某个网页有多个语言版本:- 别随意自动重定向:别自动把用户从网站的一个语言版本,转向另一个版本。打个比方,别依据您猜测的用户偏好语言来重定向,这类重定向会阻碍用户与搜索引擎浏览网站的全部版本。
- 添加超链接:不妨添上超链接,指向该网页的其他语言版本。如此一来,用户点一点超链接,就能切换到网页的其他语言版本。
采用指定特定语言的网址
您可以在网址里融入本地化的字词,或是选用国际化域名 (IDN)。不过,千万要保证网址用的是 UTF-8 编码(其实,我们强烈建议只要条件允许,都用 UTF-8),而且链接到这些网址时,要做好正确转义。将网站内容定位到特定国家 / 地区(地理位置定位)
您能够把整个网站,或是部分内容,定位给某个特定国家 / 地区、说特定语言的用户。这么做能提升网页在目标国家 / 地区的排名,只是目标用户没办法看到其他语言区域或语言呈现的内容。要是想在 Google 上给网站做地理位置定位,按下面步骤来:
- 网页级或网站级:给网站或网页用上基于语言区域的网址。
- 网页级:用 hreflang 或站点地图告知 Google,哪些网页对应哪些地理位置、哪些语言。
要注意,地理位置定位没办法做到百分百精准,所以,得考虑到用户有可能访问到您网站的 “不合适” 版本。应对这个问题,有个简单办法:在所有网页都展示各语言版本的链接,方便用户自行选定所属区域与语言。
!请避免运用 IP 分析去对内容进行调整。要知道,IP 位置分析不仅实施起来存在困难,而且其结果往往是不可靠的。另外,Google 在抓取网站的时候,可能没办法准确抓取网站的不同变体情况。大部分(但并非全部)Google 的抓取行为都是源自美国,不过我们并不会尝试通过改变位置信息的方式来检测网站变体。建议大家采用以下这些明确的方法,比如 hreflang、备用网址以及显式链接等。
不妨采用基于语言区域的网址形式,这有助于您将网站的全部内容或者部分特定内容精准定位到各个不同的地理区域。关于这方面,以下的表格为您详尽阐释了可供选择的具体方案:

Google 对目标语言区域的判定机制及相关注意事项
在当今数字化的网络环境中,了解 Google 如何确定网页的目标语言区域对于网站运营者而言至关重要。Google 会综合考量多种因素来精准定位网页的最佳目标受众群体:
- 国家 / 地区代码一级的顶级域名 (ccTLD):像.de 明确代表德国,.cn 代表中国等,这些域名与特定国家 / 地区紧密相连,能清晰地向用户和搜索引擎表明网站是专门针对特定地域的。不过,需要注意的是,部分国家 / 地区对 ccTLD 的使用用户有一定限制,所以在采用之前一定要深入调查清楚。此外,像.tv 和.me 等个性化 ccTLD,由于用户和网站所有者常常将其视为比定位到具体国家 / 地区的域名更具通用性,Google 也会将它们当作通用顶级域名 (gTLD) 看待,具体可参考 Google 的 gTLD 列表。
- hreflang 语句:无论是存在于标记、标头还是站点地图中的 hreflang 语句,都是 Google 确定目标语言区域的重要依据。
- 服务器位置(依据服务器的 IP 地址判断):一般来说,服务器的实际位置靠近用户,在一定程度上能够反映网站的目标受众情况。然而,鉴于有些网站运用分布式内容分发网络 (CDN),或者选择在网络服务器基础架构良好的国家 / 地区进行托管,使得服务器位置这一因素并非完全可靠的判定线索。
- 其他线索:诸如网页上呈现的本地地址、电话号码,所使用的本地语言、货币,来自其他本地网站的链接,以及来自商家资料(若存在)的线索等,这些方面也都为 Google 判定网站目标受众群体提供了参考信息。
- Google 会从全球各地不同的地理位置对网页进行抓取,但并不会为了探寻某个网页的所有可能变体,而特意改变针对同一网站所使用的抓取工具来源。因此,务必运用文中提及的方法,如 hreflang 条目、ccTLD 或者显式链接等,将网站会呈现的所有语言区域或语言变体明确地告知 Google。
- Google 会直接忽略位置 meta 标记(例如 geo.position 或 distribution),以及地理位置定位 HTML 属性。
处理多语言 / 多区域网站中的重复网页问题:
当在同一个多区域网站的不同网址上,以同一种语言提供相似内容或者重复内容时(例如 example.de/ 和 example.com/de/ 都展示类似的德语内容),需要设定一个首选版本,然后借助 rel="canonical" 元素和 hreflang 标记,确保为搜索用户呈现正确的语言或区域网址。关于通用顶级域名:
通用顶级域名 (gTLD) 指的是那些未与特定地理位置挂钩的域名。倘若您的网站使用的是通用顶级域名(如.com、.org 或者下方罗列的其他域名),并且期望以特定地理位置的用户作为目标受众,那么就需要运用上述方法之一来明确指定目标国家 / 地区。Google 会将以下顶级域名认定为 gTLD:
- 通用顶级域名:凡是通过 IANA DNS 根区进行解析的 TLD,只要未在 ICANN 注册为国家 / 地区代码一级的顶级域名 (ccTLD),Google 都会将其视为 gTLD。例如:.com、.org、.edu、.gov 等等。
- 通用区域性顶级域名:尽管这类域名与具体地理区域存在关联,但通常还是会被看作与.com 或.org 类似的通用顶级域名,比如.eu、.asia 等。
- 通用国家 / 地区代码一级的顶级域名 (ccTLD):像.tv 和.me 等部分 ccTLD,由于用户和网站所有者倾向于认为它们比定位到具体国家 / 地区的域名更具通用性,所以 Google 也将其视为 gTLD。以下是这些 ccTLD 的具体列表(该列表可能会随时间有所更新):.ad、.ai、.as、.bz、.cc、.cd、.co、.dj、.fm、.io、.la、.me、.ms、.nu、.sc、.sr、.su、.tv、.tk、.ws 。
通过深入了解 Google 对目标语言区域的判定方式以及相应的处理方法,网站运营者能够更好地优化网站结构和内容,提升在搜索引擎中的表现,从而精准触达目标受众,实现网站的价值最大化。
改编自原文《管理多区域网站和多语言网站》需在能访问外网的环境中打开 |