http://www.soutuxiu.net:8080/star.html?pid=mm_18676183_0_0
Question
www.****.com, 现在是英语界面,但是不久会增加韩语版,我们自己设计的翻译程序,可以根据电脑的默认语言选择向用户显示英文或是韩文。我现在的问题是,如果这样的话,google会把我的网站以英文网站收录呢,还是韩语网站?那我又该以什么语言做SEO优化?因为英文和韩文都会在同一域名www.****.com,只是返回用户的语言不同?
Answer
具体 1.管理多区域网站:
您知道吗,经调查表明,绝大多数用户认为获得用自己语言提供的信息比获得一件低价格的商品更重要。生活在一个非英语的国家,我经常能听到一些朋友和家人表示,他们希望能使用本土或本地化网站 —— 经过适当本地化的网站能吸引更多用户,这是毫无疑问的。一直以来,谷歌都尽可能为用户显示最佳的搜索结果。多数情况下,这些搜索结果,都已经根据用户当前的位置或语言进行了本地化。
如果您打算花时间为自己的网站创建并维持一个本地化版本,那么很重要的一点就是,用户能够非常容易的找到这个本地化版本。在这一系列博文中,我们将从搜索引擎的角度来看看创建多区域和多语言网站都会涉及到哪些方面的问题。多区域网站是指给不同地区(通常是不同国家)的用户提供服务的网站;当该网站采用多种语言提供内容时,我们就称它为多语言网站。有些时候,一个网站既是多区域网站,也是多语言网站。下面我们就从一些最基本的准备工作开始,谈谈多区域网站需要注意的细节以及问题。
为创建全球网站做准备
创建一个多区域网站时,无论这个多区域网站是否有多语言版本,都是一项颇具挑战性的工作。创建基础版本时,往往会出现很多的问题,然而在创建多版本网站时,这些问题还可能会成倍增加,所以,在您开展工作之前,一定要确保一切正常运行。创建多区域网站,通常意味着您得面对突然成倍增加的URL数量,所以不要忘了需要提前预备好合适的基础架构来支持网站。
规划多区域网站
当针对多个区域(通常指不同国家)规划网站时,一定要先对可能会涉及到的法律或行政要求做一番研究,因为这些要求很可能会决定您接下来的工作方式,比如,是否满足使用国家域名的条件。
所有网站的创建都是从域名开始的;提到域名,谷歌按两种不同的类型来区分域名:
l 国家代码顶级域名(ccTLDs):这些域名与特定的国家相关(比如德国的.de和中国的.cn)。用户和搜索引擎用这些来作为区分您的网站究竟是为哪一国家提供服务的。
l 通用顶级域名(gTLDs): 这些域名通常不依赖于某一特定的国家。常见的通用顶级域名有.com、.net、.org、和.museum等。通常,谷歌也会把一些区域顶级域名,比如.eu和.asia视作通用顶级域名,因为这些域名也不与某一特定的国家相关。另外,我们还把一些虚拟国家代码顶级域名(比如.tv、.me等)当作通用顶级域名,因为我们发现用户和网站站长经常都认为这些域名更为通用,而非面向特定国家(关于此类被视作通用顶级域名的虚拟国家代码顶级域名,我们并没有整套清单,因为随着时间的发展这些情况有可能会发生变化)。使用网站站长工具地理目标设置, 您就可以为通用顶级域名网站定位目标地理区域。
网站地理定位因素
一般情况下,谷歌根据以下要素来确定某一网站(或某网站的一部分)的地理定位:
1. 国家代码顶级域名或者网站站长工具的手动通用顶级域名网站地理定位(这可以在域名级别、子域名级别或子目录级别进行)的使用,对于用户来说,通常都是一个非常明显的信号,清楚无误地说明了网站面向的某一国家。关于这方面的更多信息,可在我们的博客帖文和帮助中心找到。在搜索结果中显示由网站地理定位产生的区域标签,这种方法对于用户来说也非常清晰易懂。如果您网站上的同一页面内容面向的国家不只一个(比如,面向所有讲德语的国家),那么,使用地理设置通常是没有意义的,这种情况下其实只需用一种语言编写全部内容即可,无须使用网站地理定位设置(用其他语言编写的信息很快就能提供!)。
2. 服务器位置(通过服务器的IP地址)通常都靠近您的用户。不过,由于有些网站使用的是分布式的内容分发网络(CDNs)或者网站服务器被托管在某一具备更好的基础架构的国家,所以我们会尽量不单独依靠服务器位置这一要素。
3. 其他的信号也可以给我们一些提示。这有可能是网页上的本地地址和电话号码,本地语言和货币的使用,来自其他本地网站的链接,或谷歌本地商户中心(Google’s Local Business Center)的使用,当然得在可使用的情况下。
需要注意的是,我们不使用具有定位作用的元标签(比如“geo.position”或“distribution”)或HTML属性进行网站地理定位。尽管在其他方面这些方法可能会有一定用处,但我们发现在进行网站地理定位方面,它们使用起来通常都不够可靠。
URL架构
用于进行网站地理定位的前三种要素与使用的服务器和URLs紧密相关。仅仅从网页的基础上我们很难确定网站地理定位,所以有必要考虑使用URL架构,通过把网站内容分割成若干部分再进行地理定位,这样会容易一些。下面是一些可用于网站地理定位的URL架构,以及他们的优势和劣势:
国家代码顶级域名
比如:example.de、example.fr
带通用顶级域名的子域名
比如:de.site.com、fr.site.com等
带通用顶级域名的子目录
比如:site.com/de/、site.com/fr/等
URL 参数
比如: site.com?loc=de、?country=france,等
优势 (+)
– 网站地理定位清晰
– 与服务器位置无关
– 易于分离网站
– 需要满足相关法律要求(有时候)
优势 (+)
– 易于设置
– 可使用网站站长工具(Webmaster Tools)进行地理定位
– 允许有不同的服务器位置
– 易于分离网站
优势 (+)
– 易于设置
– 可使用网站站长工具(Webmaster Tools)进行地理定位
– 较低的维护成本(同一主机)
优势 (+)
(不推荐)
劣势 (-)
– 价格昂贵(+ 可用性)
– 需要更多基础架构
– 需要满足相关国家代码顶级域名要求(有时候)
劣势 (-)
– 用户可能不能单从URL识别地理定位(比如,“de”指的是语言还是国家?)
劣势 (-)
– 用户可能不能单从URL识别地理定位
– 单一的服务器位置
– 较难分离网站
劣势 (-)
– 基于 URL的内容分割很困难
– 用户可能不能单从URL识别地理定位
– 不能用网站站长工具(Webmaster Tools)进行地理定位
从中大家可以看到,网站地理定位并不是一种精确的科学(即使是使用国家代码顶级域名的网站在实质上也是一个全球性的网站)。所以很重要的一点是,您的网站也应该做好招待那些从“错误”的地方来的“不速之客”的准备,一种方法就是在所有页面上显示让用户选择其地区和所用语言的链接。我们将在以后的博文中进一步讨论一些其他可行方案。
处理全球网站上的一些重复内容
在面向不同地区并提供不同语言时,网站有时会通过不同的URL提供一些相同或类似的内容。通常,我们会建议您最好能够针对每个不同的用户组提供特别的内容,但是,在多区域网站创建的最初阶段,对于所有页面和各种变量来说,这一点并不一定能够实现,所以,一般情况下,只要这些内容是面向不同国家的不同用户的,就不会有什么问题。一般来说,没必要通过禁止在robots.txt file文件中进行抓取或通过使用”noindex” robots meta tag元标签来“隐藏”那些重复内容。不过,如果您是通过不同的URL向相同的用户提供相同的内容(比如,如果“example.de/”和“example.com/de/”都面向德国的用户显示德语内容),就有必要在其中选择一个偏爱的版本,并进行适当的重定向(或使用”rel=canonical”链接要素)。
2.管理多语言网站:
多语言网站是指拥有两种以上语言版本的网站。比如说,您的网站既有中文版本,又有英文版本,那他就是一个多语言的网站。
显然,如果浏览您的网站的人使用的是不同的语言,那么多语言网站就非常实用。如果您想让巴西人浏览您写的关于拉美足球的博客,您只需要选用葡萄牙语来发布。但如果您想让阿根廷球迷也能浏览您的博客,使用西班牙语则能帮助您达到目的。
谷歌和语言识别
谷歌需要确定您每个网页的主用语言。如果您在每个页面仅使用一种语言,并且避免并行翻译,这将更有利于谷歌进行语言识别。虽然谷歌可以对一种语言以上的网页进行识别,但我们建议,网页的基本部分如标题、工具条和菜单等最好使用同一种语言。
请注意,谷歌会忽略所有代码级语言信息,包括从“lang”属性到文档类型定义(DTD)。有些网页编辑程序会自动生成这些属性,因此,在识别网页语言时它们并不十分可靠。
如果有人在谷歌上使用本国语言进行搜索,并期望找到本地化的搜索结果,此时,网站站长要发挥作用了:如果您要使信息本地化,那么用以下技巧可使搜索结果显现出来。
多语言网站剖析:URL结构
在开发多语言网站时无需建立特别的URL。但是,您的用户可能希望查看URL来确定他们在浏览您网站的哪个版面。例如,下面的URL能让用户知道他们正在浏览网站的英语页面:
http://example.ca/en/mountain-bikes.html
http://en.example.ca/mountain-bikes.html
而下面的URL能让用户知道他们在浏览同一页面的法语页面:
http://example.ca/fr/mountain-bikes.html
http://fr.example.ca/mountain-bikes.html
另外,URL结构能让您更容易地分析多语言内容的索引。
如果您想用非英语字符建立URL,请一定使用UTF-8编码。用UTF-8编辑的URL在链接内容时能正确的被转换。 如果您需要对URL进行手动转换,您可以找到一个在线URL编码器来轻松帮您完成。例如,如果我想把下面的URL从英语转换到法语,http://example.ca/fr/mountain-bikes.html
URL转换之后可能会变为:
http://example.ca/fr/vélo-de-montagne.html
因为这个URL中包含一个非英语字符(é),所以在网页链接转换之后的情况可能是:
http://example.ca/fr/vélo-de-montagne.html
多语言网站的抓取和索引
我们建议您不要允许自动翻译来获得索引。自动翻译有时候没有意义,并且可能被当做垃圾信息。更重要的是,建立多语言网站的目的,在于通过提供多种语言的内容从而吸引更多的用户。如果您的用户无法理解自动翻译的内容,或者觉得翻译太僵硬,也许您需要考虑是否真的有必要为用户提供自动翻译的内容。
如果您计划将信息本地化,让Googlebot轻松地抓取到您网站所有语种的版本。您可以考虑在网页与网页间进行横向连接。换句话说,您可以在同样内容的不同语言的网页间建立链接。这样做对您的用户也有很大帮助。用我们之前提供的例子,假设一个法语网民碰巧登陆了页面http://example.ca/en/mountain-bikes.html; 现在,他可以点一下链接转换到页面http://example.ca/fr/vélo-de-montagne.html ,在这里他可以看到法语版的同样内容。
为了让您网站的所有内容更容易被抓取到,就应避免根据用户所用语言而进行的自动重新定向。这些重新定向会使用户(和搜索引擎)无法浏览您网站的所有版本。
最后,确保不同语言的内容有不同的URL,不用要cookies来显示转换的版本。
文字编码的处理
谷歌直接从HTTP标题、HTML 页面标题和内容中摘录文字编码。在文字编码上您不需做什么,除开要留意冲突信息,如内容和标题间的冲突。虽然谷歌能识别不同的文字编码,但我们建议您在网站上尽可能使用UTF-8。
近期评论