Soeben habe ich bei einer Anmeldung bemerkt, dass Google mit seinem Dienst reCAPTCHA mittlerweile statt nur Büchern auch ihre Maps-Daten digitalisieren lassen.
Hämischerweise würde ich den umbenennen und den Titel folgendermaßen ändern: “Den Wert eures kostenlosen SEO-Spam-Hosting-Dienstes für euch aufrechterhalten”.
Die auf obigem Link aufgelisteten Punkte
Veröffentlicht eindeutige Richtlinien gegen Missbrauch und teilt sie euren Nutzern mit, etwa bei der Registrierung. So könnt ihr unmissverständlich klarstellen, was ihr als Spam betrachtet.
In Anmeldeformularen ist der Einsatz von Captchas (auf Englisch) oder vergleichbaren Verifizierungstools sinnvoll (auf Englisch). So sind nur Anmeldungen von Personen möglich und automatische Skripts werden an der Erstellung zahlreicher Websites auf eurem Hosting-Dienst gehindert. Diese Methoden bieten zwar keinen hundertprozentigen Schutz, halten jedoch viele Übeltäter fern.
Versucht, euren kostenlosen Hosting-Dienst auf andere Signale für Spam zu überwachen, etwa Weiterleitungen, eine große Anzahl von Anzeigenblöcken, bestimmte Spam-Keywords oder große Abschnitte von JavaScript-Code mit Escape-Sequenzen. Wenn ihr eine einfache, kostengünstige Lösung sucht, solltet ihr die site:-Operator-Abfrage oder Google Alerts (auf Englisch) in Betracht ziehen.
Protokolliert Registrierungen und versucht, typische Spam-Muster zu erkennen, beispielsweise die für das Ausfüllen von Formularen aufgewendete Zeit, die Anzahl der vom selben IP-Adressbereich gesendeten Anfragen, während der Registrierung verwendete User-Agents oder über Formulare eingereichte Werte wie Nutzernamen. Auch dies führt nicht immer zu eindeutigen Ergebnissen.
Überprüft eure Webserver-Protokolle auf plötzlich ansteigende Besucherzahlen, insbesondere wenn diese auf einer neu erstellten Website verzeichnet werden, und versucht herauszufinden, warum ihr mehr Bandbreite und Rechenleistung verbraucht.
Überlegt euch ein paar Möglichkeiten für eine Statusüberprüfung. Wenn ihr beispielsweise einen kostenlosen, lokalen polnischen Webhosting-Dienst unterhaltet, wie wahrscheinlich ist es dann, dass jemand in Japan über Nacht Tausende neue legitime Website erstellt? Es gibt ein paar hilfreiche Tools für die Erkennung der Sprache neu erstellter Websites, etwa Spracherkennungsbibliotheken oder das Google Translate API v2 (auf Englisch).
sollen wir als Aufforderung lesen und interpretieren, wie:
Erstellt AGBs und Anmelde-Richtlinien um der Seite einen offiziellen Charakter zu verleihen.
Erstellt ein SignUp-Form mit Captcha um der Seite einen offiziellen Charakter zu verleihen.
Achtet darauf keine Weiterleitungen, wenig Anzeigenblöcke, keine Spam-Keywords und JavaScript-Codes mit Escape-Sequenzen einzubinden. Prüft eure URLs regelmäßig bei Google selbst.
Achtet darauf keine typischen Spam-Muster zu hinterlassen, beispielsweise eine zufällige Zeit bei der Eingabe von Formulardaten, die Anzahl der Anmeldeversuche aus dem gleichen IP-Adressbereich, wählt die User-Agents zufällig nach tatsächlichen Nutzungszahlen.
Schickt nicht zuviel Traffic auf eine neue Site, sondern lasst den Traffic organisch wachsen, zumindest sollte es für das Protokoll so aussehen.
Haltet eure Seiten rein und verbreitet keine Malware und updatet auch die automatischen Blogs immer wieder. Eine Überwachung der eigenen Seiten ist über die Google Safe Browsing API möglich. Achtet, wie auch oben darauf, nicht das komplette Netzwerk über den gleichen API-Zugang zu prüfen, den gleichen Hoster aber schon.
Denkt bei der Erstellung der gehosteten Seiten nach, pro Hoster nur eine Sprache, eine Landesdomain und kein zu starkes Wachstum, am besten zufällig über viele Tage hinweg. Testet das auch mal mit Spracherkennungsbibliotheken und spinnt den daraus gewonnen Text nochmals oder übersetzt anhand Google Translate API v2 aber jagt das mehrmals durch, etvl. auch durch einen anderen Übersetzungsdienst, sodass Google den Text am Ende noch nicht kennt.
Viel Spaß beim Ausprobieren
Man muss die Zeichen nur richtig deuten
Vor gut über einem Jahr habe ich darüber schon geblott: Scheduled eMails mit GMail und vor zwei Tage hatten ich einen erstaunlichen Post zu den Conversion Rate Experts in meiner Mailbox, der sinngemäß titelte: falls Du GMail nutzt, dann haben wir den besten Tipp für dich. Mit dem Link zu: Boomerang for Gmail helps you keep track of your projects
Und sie haben recht, das Tool lohnt sich auf jeden Fall.
Unbedingt müsst ihr dabei auch noch folgende Posts aus der Industrie lesen:
Google als Bank? Klingt im ersten Moment etwas befremdlich, da wir viel
zu oft in den Medien über Google, den Datenschutz und als Datenkrake lesen.
Ende Januar gab es dazu einen interessanten Beitrag bei Basic Thinking mit dem Titel: Google und Facebook als Bank – ein nicht ganz unrealistisches Szenario
Und die Jungs dort haben nicht unrecht. Jedes reichweitenstarke Medium kann sich theoretisch um den Zahlungsverkehr kümmern. Seien es Amazon, Foursquare, Apple oder eben Google oder auch Facebook.
Allen gemeinsam ist, dass sie sich um ihre Nutzer kümmern und davon nicht gerade wenig haben. Bei vielen sind Zahlungsvorgänge im Prozessgeschehen mit dabei und sicher sind die Daten dort, zumindest für uns Dritte.
Anfang Februar hat Herr Dr. Hansjörg Leichsenring im Bank Blog gefragt Kommt die Google Bank? und sich über Banklizenz und Bankstrategie Gedanken gemacht.
Auch er hat recht und an dieser Stelle empfehle ich die Lektüre des obigen Links anstatt den Inhalt hier wiederzugeben.
Wichtige Fakten sind der Eintrag in der Google-Hilfe selbst zum Thema FSA:
Google Payments LTD ist von der britischen Finanzaufsichtsbehörde (Financial Services Authority – FSA) als elektronisches Geldinstitut autorisiert und unterliegt den entsprechenden Regelungen. Die FSA-Registernummer von Google Payments LTD lautet 900008.
Weitere Informationen zu Google Payments LTD und anderen registrierten elektronischen Geldinstituten erhalten Sie im Register der FSA.
Gleich nach dem am 12./13. August 2011 im deutschen Web durchgeführten Panda Update begannen die SEOs mit der Analyse, wobei sie sich zunächst das englischsprachige Netz vornahmen. Die Änderungen würden nach etwa 14 Tagen sichtbar werden, das wussten sie, also konnte man sich an dem orientieren, was kurz zuvor in den USA, GB, Kanada, Australien und weiteren Teilen der englischsprachigen Welt schon passiert und für Deutschland/Österreich/Schweiz zu erwarten war. Die ersten Analysen folgten zwischen dem 20. bis 30. September.
Aufstieg und Absturz
Die Suchmaschine reagierte nach dem Update tatsächlich auf einige Signale sehr viel empfindlicher. Das Fazit vorweg: Bloße Werbung wird nun eher abgestraft, hochwertiger Content noch mehr belohnt. Das bedeutet: Reine Affiliate-Seiten können stark zurückfallen, einige Nachrichtenseiten haben dagegen gewonnen. Diese Darstellung ist allerdings stark simplifiziert, denn es haben auch Werbeseiten gewonnen wie die deutschsprachige idealo.de. Warum ist das so? Nach dem Panda Update wird unter anderem die Verweildauer eines Nutzers auf einer Seite gemessen, ein sehr cleverer Schachzug. Wer also Werbung macht, die Menschen wirklich etwas bringt, diese dadurch zum Verweilen und Stöbern einlädt, hat gewonnen. Werbung für Anti Virus Software, wie Kaspersky, auf einem Blog zu Netzwerksicherheit oder eine Anzeige für Immobilien im Tessin auf dem Portal eines schweizer Maklers sind für die Besucher ja vielleicht sogar hilfreich. Wer hingegen seine Seite zumüllt, mit der tausendsten Wiederholung der gleichen Werbung und auch des gleichen sinnlosen Contents, der von irgendwo umgeschrieben wurde, verliert drastisch. Und das ist auch gut so. Auf einen Punkt gebracht lässt sich alles im Mantra subsumieren, das Google schon seit prähistorischen Urzeiten des Netzes betet: Baut die Seiten für die Nutzer, nicht für das, was Ihr für gutes SEO haltet (unter anderem ätzendes Keyword-Stuffing). Dann werdet Ihr gewinnen.
Die neuen 5 Todsünden
Nach Panda sind ganze Projekte im Orkus des Netzes verschwunden, nicht nur einzelne Unterseiten. Google hat, wie immer, mit mathematischen Methoden die menschlichen Such-Verhaltensweisen nachgeahmt, das Ergebnis wird als Algorithmus bezeichnet, dessen wahre Geheimnisse niemals jemand erfährt. Die SEO-Szene sucht allerdings nach nichts sehnlicher als nach Erklärungen. Inzwischen ist sie sich über 5 neue Todsünden relativ einig:
Wenig Inhalt mit viel drum herum. Damit ist nun nicht der textuelle Content gemeint, sondern Seiten, die so eine schlechte Usability aufweisen, dass es schwerfällt, auf ihnen zu navigieren. Es gibt Seiten, sogar von Webdesignern, auf denen man sich einfach nicht zurechtfindet. Kollegen, weniger ist mehr! Der Geek (oder Nerd), im Highspeed im Netz unterwegs, misst heute seine Zeit nicht mehr nach Sekunden. Er misst sie nach einem Klick. Ist die Information dann nicht da, ist er verschwunden.
Leere Seiten für die interne Verlinkung: Man ging stets davon aus, wichtige Inhalte intern zu verlinken – aber bitteschön nicht auf leere Seiten. Das betrachtet Google nach Panda als abzustrafenden SEO-Trick.
Ähnliche Inhalte: Darauf hat die SEO-Welt gewartet. Wann ist Google so weit, eine semantische Prüfung durchzuführen? Offenbar im Jahr 2011. Umgeschriebene Texte werden anscheinend erkannt, selbst wenn sie sich an die Spielregeln von CopyScape halten (nicht mehr als drei aufeinanderfolgende Worte kopieren). Es verwundert übrigens nicht, denn schon längst wird ja bei der Suche auch die Nähe bestimmter Keywords zueinander gewertet. Nun also auch die semantische Dichte. Das bedeutet: Reines Umschreiben von Inhalten ist nicht mehr. Selber denken und unter die Leute bringen, wie schräg und quer auch immer, wird künftig Punkte bringen. “Artikel-Portale” wurden besonders abgestraft. Hier veröffentlichen Autoren zu stets demselben Thema wiederkehrenden Content, mit Keywords gespickt. Das nutzt dem Leser nichts, das straft Panda daher ab.
Zu viel Werbung: Ist das Verhältnis von Werbung zu Inhalt zu groß, wird die Seite abgestraft. Das muss nun wirklich niemand mehr kommentieren. Danke, lieber Panda-Bär.
Affiliate Links, automatisch generierte Inhalte: Zahllose Seiten werden automatisch erstellt, um die Affiliate-Links einzublenden. Der Mehrwert für die Nutzer tendiert gegen null, selbst die Informationen zu Produkten, um die es geht, werden verdrängt. Die Folge nach Panda: Abstrafung.
Fazit:SEOs und Affiliates werden sich umstellen müssen. Einige Nachrichtenportale können hingegen weitermachen wie bisher. Und last, not least: Werbung ist durchaus nicht verboten. Aber sie muss ein bisschen Spaß machen.
In den kommenden Wochen werden Ihre Suchergebnisse und Anzeigen auf Google um eine +1-Schaltfläche ergänzt, mit deren Hilfe Nutzer Ihre Anzeigen weiterempfehlen können. Dafür sind keine Änderungen in Ihrem Konto erforderlich. Die URL der Zielseite Ihrer Anzeige kann zudem im Google-Profil der Nutzer erscheinen, die Ihrer Anzeige +1 geben.
Diese Nachricht kam vor ein paar Tagen per Newsletter in meine Inbox.
Wer von euch denkt, dass damit Google-Ranking kaufbar wird?
Bzw. diesmal weiterhin manipulierbar über Clickjacking, wie es bei Facebook-Fanpages schon so oft der Fall war?
In der Website Boosting 07-08/2010 war ein gutes Script zur Keyword-Recherche im Longtail beschrieben und gut erklärt.
Selbiges Script (hier verfügbar) habe ich genommen und nach meinem Bedarf hin angepasst.
Ausgangsbasis:
Ich will auf Google suchen und alle Ergebnisse zu einem gewissen Keyword in meine Datenbank zur späteren Verwendung speichern.
Daher richten wir uns eine MySQL-Datenbank mit folgender Struktur ein:
Dazu nehmen wir mein modifiziertes UserScript für das Firefox-AddOn GreaseMonkey: googlerelated.userjs
Selbiges gibt, wie aus dem Original bekannt, in der Google Suche nun immer eine Textbox aus, in dem alle Keywords enthalten sind.
Meine Erweiterung ist nun, dass noch ein Server gepingt wird und über zwei Parameter das Ursprungskeyword und alle verwandten Stichworte aus Googles Related-Sektion mit eingefügt werden.
Das Handling der Datenbank und Speicherung der Keywords nehme ich mit diesem kurzen PHP-Skript vor: keyword-store.php
Ruft man nach ein paar Suchvorgängen das Skript ohne Parameter auf, bekommt man einen Output wie, zum Beispiel:
Keywords
1:
depeche mode;;
depeche mode wrong;;
depeche mode erfurt;;
depeche mode live;;
depech mode;;
something a la mode;;
depeche mode peace;;
depeche mode wien;;
depeche mode home;;
depeche mode 2009;;
Es ist also ersichtlich, dass man damit gut und schnell Keywords, gerade related und Longtails, generieren kann.
Und heey, wer kann Keywords besser in die Themenrelevanz einordnen als unser Freund Google selbst?
Also einfach die beiden Skripten aktivieren und ganz normale Keywordrecherche betreiben, surfen oder was auch immer und langsam aber sicher füllt sich die Datenbank mit allen wichtigen Stichwörten und deren verwandten Suchbegriffe.
Dann noch eine Abfrage zu den ähnlichen Begriffen, wenn man einen neue Seite/Blog/Werbung erstellt und schon hat man eine gute, fundierte Basis.
Im vorherigen Artikel hatte ich bereits über die Verbesserung des Google Analytics-Code gesprochen, in der Diskussion sind aber noch ein paar kleine Verschnellerungen aufgetaucht, die in diesem Generator enthalten sind.
Der Code sieht nun folgendermaßen aus: <script>
var _gaq=[['_setAccount','UA-XXXXX-X'],['_gat._anonymizeIp'],['_trackPageview']];
(function(d){
var g=d.createElement('script');
g.async=1;
g.src='http://www.google-analytics.com/ga.js';
d.getElementsByTagName('head')[0].appendChild(g);
for(var i=0;i<d.getElementsByTagName('a').length;i++){
var a=d.getElementsByTagName('a')[i];
if(!a.getAttribute('onclick') && window.location.hostname!=a.hostname)
a.setAttribute('onclick', "_gaq.push(['_trackEvent', 'outbound', '"+a.href+"'])");
}
}(document))</script>
Also bitte ab sofort selbigen Code nutzen
Um Deinen individuellen Tracking-Code zu erhalten, gib hier die gewünschte ID ein:
Füge diesen Code vor dem Tag </body> ein:
Mit dem deutschen Datenschutz-Feature _anonymizeIp:
Der Standardcode von Google Analytics ist aufgebläht und langsam. Mathias Bynens beschreibt in dem Artikel Optimizing the asynchronous Google Analytics snippet wie man den Code verkürzen und erheblich verschnellern kann (vgl. Studie auf JSperf).
Damit aber nicht genug, denn man kann aus dem JavaScript nocht mehr herausholen. Wie in YoastsGoogle Analytics Plugin für WordPress will ich jedem Link, der von meiner Website führt, ein Tag “outbound” geben, sodass dies dann bei Google Analytics aufgeführt wird und ich weiß, wann der Besucher meine Seite verlassen hat.
Das kann man serverseitig mit dem Plugin lösen, oder auch vom Browser des Users selbst “berechnen” lassen und somit Bandbreite und Rechenaufwand sparen.
In Summe sieht das Skript gekürzt und verschlankt so aus: <script>var _gaq=[['_setAccount','UA-XXXXX-X'],['_trackPageview']];(function(d){var
g=d.createElement('script'),i,a;g.async=1;g.src='http://www.google-analytics.com/ga.js';d.head.appendChild(g);for(i=0;i<d.getElementsByTagName('a').length;
i++){a=d.getElementsByTagName('a')[i];if(!a.getAttribute('onclick'))if(window.location.hostname!=a.hostname)
a.setAttribute('onclick',"javascript:_gaq.push(['_trackEvent','outbound','"+a.href+"']);");}}(document))</script>
Damit funktioniert es wunderbar und Du musst lediglich den Code jetzt neu, vor dem Inhaltsende (</body>) einfügen.
Um Deinen Code zu bekommen, generiere selbigen hier:
Um Deinen individuellen Tracking-Code zu erhalten, gib hier die gewünschte ID ein:
Füge diesen Code vor dem Tag </body> ein:
Mit dem deutschen Datenschutz-Feature _anonymizeIp: