Es ist soweit! Unser neuer SEO-Freund Apache 2.4 ist da!
Viele der neuen Funktionen sind für uns als SEOs einen intensiven Blick wert, schließlich profitieren wir immer von den neuen Tools.
Die aktualisierte Version des Webservers bringt nicht nur Vorbereitungen auf Cloud-Dienste und mehr Performance sondern ersetzen für uns SEO eigene Skripte durch bereits implementiere Module.
Auf viele der Features will ich nicht direkt eingehen (dazu gibt es viele andere Artikel, wie bei heise open), lediglich auf den obigen Link hinweisen, wenn sich jemand für die neuen FastCGI-Proxies für einen Webserver auf Stereoiden interessant.
Für uns interessant sind an dieser Stelle alle Features die wir als Werkzeuge für bekannte SEO-Techniken einsetzen können.
Dazu gehören:
- mod_sed: Filter Input (request) and Output (response) content using sed syntax
- mod_remoteip: Replaces the original client IP address for the connection with the useragent IP address list presented by a proxies or a load balancer via the request headers.
- mod_proxy_html: Rewrite HTML links in to ensure they are addressable from Clients’ networks in a proxy context.
- mod_proxy_express: Dynamic mass reverse proxy extension for mod_proxy
mod_sed a.k.a. Content Spinning
Durch das obige erwähnte Modul mod_sed (frei nach dem Unix-Tool sed) kann man alle aus- oder eingehenden Streams on-the-fly modifizieren. Interessant ist das für uns, wenn wir beispielsweise auf einer Seite alle Suchbegriffe je nach dem eingegebenen Keyword abändern wollen.
Mit einer beispielhaften Konfiguration sieht das folgendermaßen aus:
<Directory "/var/www/seo-projects/keyword-optimization">
AddOutputFilter Sed html
OutputSed "s/COMPUTER/notebook/g"
OutputSed "s/laptop/ultrabook/g"
</Directory>
Damit würden alle Vorkommnisse vom Wort “COMPUTER” mit “notebook” und analog “laptop” mit “ultrabook” ersetz werden.
Für geübte User gilt der Hinweis: verwendet das Modul via .htaccess und je nach hereinkommenden Keyword werden Platzhalter ersetzt.
Für den Input-Filter wird die Konfiguration gleichermaßen gesetzt, wobei hier nur die $_POST-Daten modifiziert werden. Analog dem obigen Beispiel mit:
AddInputFilter statt AddOutputFilter
InputSed statt OutputSed
mod_remoteip a.k.a. Cloaking
Mit dem Modul remoteip kann ohne weiteres eine man-in-the-middle-Attacke vorbereitet werden. Für Whitehat-SEOs kann die Technik zur optimierten Auslieferung von “mobile content” an die mobilen IP-Adressbereiche (bspw. T-Com, o2, vodafone, …) ausgeliefert werden.
Für die Blackhats unter uns kann der Google Bot, diverse Listing-Dienste und andere Crawler umgeleitet werden.
Diese Konfiguration:
RemoteIPHeader X-Forwarded-For
RemoteIPTrustedProxy 192.168.0.0/32
RemoteIPTrustedProxy www.webconsul.de
Leite alle Anfragen des interenen Adressbereichs 192.168.0.0/32 an den Host www.webconsul.de weiter. Wie gesagt, das kann für regionale Zwecke genutzt werden um andere Werbung auszuliefern, für mobile Adressen andere Styles oder aber auch für Suchmaschinene und Crawler um andere Inhalte zu platzieren.
Weitere Angaben zu Anwendungszwecken möchte ich nicht geben, aber angeblich soll das auch mit SSL-gesicherten Hosts und beispielsweise Banking gehen. Die Domain braucht selbst nur ein gültiges SSL-Zertifikat und kann damit alle Daten weiter- und durchleiten. Mit der obigen Kombination der Ein- und Ausgabefilter können dann Kontonummern ausgetauscht, Mailadressen geändert und vieles andere mehr ….
mod_proxy_html a.k.a. Scraping
Analog dem Modul sed modifiziert mod_proxy_html die ausgelieferten HTML-Daten. Dabei können Links auf die jeweilige Proxy-Umgebung angepasst werden, beispielsweise aber auch komplette Hosts wie google.de auf webconsul.de 
Was alles modifiziert werden kann findet sich dann in dieser Auflistung: ProxyHTMLURLMap.
mod_proxy_express a.k.a. Content XY
Die Warnung sagt alles über das Modul:
Do not enable proxying until you have secured your server. Open proxy servers are dangerous both to your network and to the Internet at large.
.
Vom einfachen Content-Mapping (um Scraping vorsichtig zu umschreiben) bis zu Cloacking auf IP-Adressbereiche und mehr kann man mit einer einfachen Konfiguration viel erreichen:
www1.example.com http://192.168.211.2:8080
www2.example.com http://192.168.211.12:8088
www3.example.com http://192.168.212.10
Ob die Domains zu Beginn wie im Beispiel Subdomains, andere Domains oder vieles mehr sind, die Ziele und Wege sind so offen wie die Phantasie des Admins
Also los, schaut euch das Upgrade kurz an und gebt Gas.
Welche Tipps habt ihr zur weiteren Optimierung?