Auch, wenn das Internet global ist, so muss doch auf die Bedürfnisse regionaler Zielgruppen eingegangen werden. Am wichtigsten ist dabei vermutlich die Übersetzung der Inhalte in die jeweiligen Sprachen. Bei der Umsetzung gibt es allerdings einige Fallstricke, auf die ich im Folgenden kurz hinweisen möchte:
Pro Sprache eine ccTLD
Jeder Länderwebseite bekommt die der Sprache zugehörige ccTLD (Country-Code-Top-Level-Domain), Deutschland also example.de, Frankreich example.fr und so weiter. Für englischsprachige Inhalte bietet sich eine .com-Domain an. Experimente mit „Exoten-Domains“ aber auch Endungen wie .info oder .biz würde ich unterlassen. Sollte dieses Vorgehen nicht möglich sein, da die (fiktive) Poker Investments Limited aus Paraguay vielleicht noch die eigene ccTLD hält, aber realistisch betrachtet keine Chancen auf die weiteren Domains hat, so können auch Subdomains wie de.example.org und fr.example.org genutzt werden. Absehen würde ich davon, Verzeichnisse für die lokalisierten Versionen der Webseite zu verwenden.
Unmissverständliche Header
In der Theorie ist alles ganz einfach: Der Webserver sendet den Content-Language-HTTP-Header und in der dort angegeben Sprache ist das folgende HTML-Dokument. In der Praxis sieht das dann so aus, das die meisten Webmaster von diesem Header noch nie gehört haben, ihre Provider falsche oder keine Voreinstellungen gemacht haben und zusätzlich noch Meta-Header zur Sprachangabe, die dem HTTP-Header womöglich noch wiedersprechen, gesetzt werden. Suchmaschinen mussten also dazu übergehen, die Sprache einer Seite aus einer Reihe von Merkmalen selber zu erkennen und man sollte versuchen, es ihnen dabei nicht zu schwer zu machen. Es ist also mit einem HTTP-Header-Viewer zu überprüfen, ob und welche Language-Header gesendet werden, ob diese mit der realen Sprache des Dokumentes übereinstimmen und, ob die Meta-Header stimmen. Auch versuchen Suchmaschinen die Sprache anhand des Textes zu erkennen. Das Vorkommen bestimmter Wörter wie „und“ oder „neben“ kann als Anhaltspunkt dienen – deswegen ist es extrem wichtig, dass pro URI nur eine Sprache verwendet wird.
Links von gleichsprachigen Seiten
Ein weiterer Anhaltspunkt für Google, welche Sprache die Seite hat, sind – wie so häufig – eingehende Links. Normalerweise gibt es damit keine Probleme aber, wenn das Verhältnis zwischen englischsprachigen und deutschen Seiten, welche auf die eigene Seite verlinken zu ungünstig wird, so kann es passieren, dass diese Seite in den englischsprachigen Index rutscht – zu erkennen dadurch, dass bei deutschen Suchanfragen [ Diese Seite übersetzen] neben dem Resultat steht.
Lokale IP-Adressen
Suchmaschinen wie Google versuchen nicht nur die Sprache sondern auch die Herkunft einer Seite zu bestimmen. Dies äußert sich dann darin, dass man nicht nur in „Seiten auf Deutsch“ sondern auch in „Seiten aus Deutschland“ suchen kann. Ein wichtiger Punkt, an dem Google die Herkunft der Seite festmacht, ist die IP-Adresse, auf der das Projekt gehostet ist. Bei dieser Domain sieht es beispielswiese so aus:
hades:~# host www.sistrix.com
www.sistrix.com A 62.93.205.128
hades:~# whois 62.93.205.128
% This is the RIPE Whois query server #1.
[…]
country: DE
Es sollte also bei Projekten mit entsprechendem Budget darauf geachtet werden, dass die Zuordnung der IP-Adresse dem jeweiligen Land entspricht. Umsetzungsmöglichkeiten dafür gibt es viele, ein Gespräch mit dem Provider ist häufig hilfreich.
Keine automatisierten Übersetzungen
Auch, wenn es keinen direkten Einfluß auf die Suchmaschinenoptimierung hat, so kann nur empfohlen werden, den Content durch fähige Muttersprachler übersetzen zu lassen. Maschinenübersetzter Text ist zwar also kurzweilige Unterhaltung ganz nett, wird allerdings von niemandem ernst genommen oder verstanden. Auch bringt noch so toller Content in der Ursprungssprache nichts, wenn er in der Zielsprache nicht verstanden – und damit kommt der SEO-Teil – verlinkt wird.