webconsul

the best webconsul(ting)

Das Google Panda Update

Sie sind hier: Startseite » Archiv für Google

Gleich nach dem am 12./13. August 2011 im deutschen Web durchgeführten Panda Update begannen die SEOs mit der Analyse, wobei sie sich zunächst das englischsprachige Netz vornahmen. Die Änderungen würden nach etwa 14 Tagen sichtbar werden, das wussten sie, also konnte man sich an dem orientieren, was kurz zuvor in den USA, GB, Kanada, Australien und weiteren Teilen der englischsprachigen Welt schon passiert und für Deutschland/Österreich/Schweiz zu erwarten war. Die ersten Analysen folgten zwischen dem 20. bis 30. September.

Aufstieg und Absturz

Die Suchmaschine reagierte nach dem Update tatsächlich auf einige Signale sehr viel empfindlicher. Das Fazit vorweg: Bloße Werbung wird nun eher abgestraft, hochwertiger Content noch mehr belohnt. Das bedeutet: Reine Affiliate-Seiten können stark zurückfallen, einige Nachrichtenseiten haben dagegen gewonnen. Diese Darstellung ist allerdings stark simplifiziert, denn es haben auch Werbeseiten gewonnen wie die deutschsprachige idealo.de. Warum ist das so? Nach dem Panda Update wird unter anderem die Verweildauer eines Nutzers auf einer Seite gemessen, ein sehr cleverer Schachzug. Wer also Werbung macht, die Menschen wirklich etwas bringt, diese dadurch zum Verweilen und Stöbern einlädt, hat gewonnen. Werbung für Anti Virus Software, wie Kaspersky, auf einem Blog zu Netzwerksicherheit oder eine Anzeige für Immobilien im Tessin auf dem Portal eines schweizer Maklers sind für die Besucher ja vielleicht sogar hilfreich. Wer hingegen seine Seite zumüllt, mit der tausendsten Wiederholung der gleichen Werbung und auch des gleichen sinnlosen Contents, der von irgendwo umgeschrieben wurde, verliert drastisch. Und das ist auch gut so. Auf einen Punkt gebracht lässt sich alles im Mantra subsumieren, das Google schon seit prähistorischen Urzeiten des Netzes betet: Baut die Seiten für die Nutzer, nicht für das, was Ihr für gutes SEO haltet (unter anderem ätzendes Keyword-Stuffing). Dann werdet Ihr gewinnen.

Die neuen 5 Todsünden

Nach Panda sind ganze Projekte im Orkus des Netzes verschwunden, nicht nur einzelne Unterseiten. Google hat, wie immer, mit mathematischen Methoden die menschlichen Such-Verhaltensweisen nachgeahmt, das Ergebnis wird als Algorithmus bezeichnet, dessen wahre Geheimnisse niemals jemand erfährt. Die SEO-Szene sucht allerdings nach nichts sehnlicher als nach Erklärungen. Inzwischen ist sie sich über 5 neue Todsünden relativ einig:

  1. Wenig Inhalt mit viel drum herum. Damit ist nun nicht der textuelle Content gemeint, sondern Seiten, die so eine schlechte Usability aufweisen, dass es schwerfällt, auf ihnen zu navigieren. Es gibt Seiten, sogar von Webdesignern, auf denen man sich einfach nicht zurechtfindet. Kollegen, weniger ist mehr! Der Geek (oder Nerd), im Highspeed im Netz unterwegs, misst heute seine Zeit nicht mehr nach Sekunden. Er misst sie nach einem Klick. Ist die Information dann nicht da, ist er verschwunden.
  2. Leere Seiten für die interne Verlinkung: Man ging stets davon aus, wichtige Inhalte intern zu verlinken – aber bitteschön nicht auf leere Seiten. Das betrachtet Google nach Panda als abzustrafenden SEO-Trick.
  3. Ähnliche Inhalte: Darauf hat die SEO-Welt gewartet. Wann ist Google so weit, eine semantische Prüfung durchzuführen? Offenbar im Jahr 2011. Umgeschriebene Texte werden anscheinend erkannt, selbst wenn sie sich an die Spielregeln von CopyScape halten (nicht mehr als drei aufeinanderfolgende Worte kopieren). Es verwundert übrigens nicht, denn schon längst wird ja bei der Suche auch die Nähe bestimmter Keywords zueinander gewertet. Nun also auch die semantische Dichte. Das bedeutet: Reines Umschreiben von Inhalten ist nicht mehr. Selber denken und unter die Leute bringen, wie schräg und quer auch immer, wird künftig Punkte bringen. “Artikel-Portale” wurden besonders abgestraft. Hier veröffentlichen Autoren zu stets demselben Thema wiederkehrenden Content, mit Keywords gespickt. Das nutzt dem Leser nichts, das straft Panda daher ab.
  4. Zu viel Werbung: Ist das Verhältnis von Werbung zu Inhalt zu groß, wird die Seite abgestraft. Das muss nun wirklich niemand mehr kommentieren. Danke, lieber Panda-Bär.
  5. Affiliate Links, automatisch generierte Inhalte: Zahllose Seiten werden automatisch erstellt, um die Affiliate-Links einzublenden. Der Mehrwert für die Nutzer tendiert gegen null, selbst die Informationen zu Produkten, um die es geht, werden verdrängt. Die Folge nach Panda: Abstrafung.

Fazit: SEOs und Affiliates werden sich umstellen müssen. Einige Nachrichtenportale können hingegen weitermachen wie bisher. Und last, not least: Werbung ist durchaus nicht verboten. Aber sie muss ein bisschen Spaß machen.

The Google+ Song

Sie sind hier: Startseite » Archiv für Google

Jedes gute Social Network braucht einen Song. Zuerst den Song, dann den Film.

Neu bei Google AdWords: Die +1-Schaltfläche

Sie sind hier: Startseite » Archiv für Google

In den kommenden Wochen werden Ihre Suchergebnisse und Anzeigen auf Google um eine +1-Schaltfläche ergänzt, mit deren Hilfe Nutzer Ihre Anzeigen weiterempfehlen können. Dafür sind keine Änderungen in Ihrem Konto erforderlich. Die URL der Zielseite Ihrer Anzeige kann zudem im Google-Profil der Nutzer erscheinen, die Ihrer Anzeige +1 geben.

Diese Nachricht kam vor ein paar Tagen per Newsletter in meine Inbox.

Wer von euch denkt, dass damit Google-Ranking kaufbar wird?
Bzw. diesmal weiterhin manipulierbar über Clickjacking, wie es bei Facebook-Fanpages schon so oft der Fall war?

Keywords von Google – Related und Longtails

Sie sind hier: Startseite » Archiv für Google

In der Website Boosting 07-08/2010 war ein gutes Script zur Keyword-Recherche im Longtail beschrieben und gut erklärt.
Selbiges Script (hier verfügbar) habe ich genommen und nach meinem Bedarf hin angepasst.

Ausgangsbasis:
Ich will auf Google suchen und alle Ergebnisse zu einem gewissen Keyword in meine Datenbank zur späteren Verwendung speichern.

Daher richten wir uns eine MySQL-Datenbank mit folgender Struktur ein:

Keyword-Datenbank Struktur

Dazu nehmen wir mein modifiziertes UserScript für das Firefox-AddOn GreaseMonkey:
googlerelated.userjs

Selbiges gibt, wie aus dem Original bekannt, in der Google Suche nun immer eine Textbox aus, in dem alle Keywords enthalten sind.
Meine Erweiterung ist nun, dass noch ein Server gepingt wird und über zwei Parameter das Ursprungskeyword und alle verwandten Stichworte aus Googles Related-Sektion mit eingefügt werden.

Das Handling der Datenbank und Speicherung der Keywords nehme ich mit diesem kurzen PHP-Skript vor:
keyword-store.php

Ruft man nach ein paar Suchvorgängen das Skript ohne Parameter auf, bekommt man einen Output wie, zum Beispiel:

Keywords

    1:

  • depeche mode;;
    depeche mode wrong;;
    depeche mode erfurt;;
    depeche mode live;;
    depech mode;;
    something a la mode;;
    depeche mode peace;;
    depeche mode wien;;
    depeche mode home;;
    depeche mode 2009;;

    abendmode:

  • günstige abendmode;;
    abendmode große größen;;
    abiballkleider;;
    zero;;
    abendkleider;;
    brautmode;;
    cocktailkleider;;
    abendschuhe;;

    armani:

  • armani Jeans;;
    armani uhren;;
    gucci;;
    hugo boss;;
    armani schmuck;;
    armani sonnenbrillen;;
    armani brillen;;
    armani watches;;

    designermode:

  • designermode herren;;
    designermode outlet;;
    designermode online;;
    ed hardy;;
    armani;;
    markenmode;;
    yoox;;
    hugo boss;;

    designermode herren:

  • herren wintermode;;
    wintermode designermode;;
    designermode 24;;
    designermode damen;;

    designermode outlet:

  • magazzino designermode outlet factory;;
    designer outlet designermode;;
    magazzino designermode outlet center;;
    magazzino designermode outlet mode;;
    designermode sehr beliebt;;
    designermode billig;;
    designermode mister wong;;
    hardy designermode;;

    ed hardy:

  • christian audigier;;
    ed hardy outlet;;
    ed hardy t-shirt;;
    ed hardy wikipedia;;
    ed hardy kids;;
    ed hardy schuhe;;
    don ed hardy;;
    ed hardy parfum;;

    glamour:

  • instyle;;
    joy;;
    cosmopolitan;;
    jolie;;
    elle;;
    gala;;
    freundin;;
    vogue;;

    h&m:

  • h&m katalog;;
    h&m kinder;;
    h&m job;;
    zara;;
    pimkie;;
    new yorker;;
    h&m gutschein;;
    h&m österreich;;

    hugo boss:

  • hugo boss anzüge;;
    hugo boss hemden;;
    hugo boss schuhe;;
    armani;;
    dolce gabbana;;
    hugo boss karriere;;
    hugo boss gürtel;;
    hugo boss shop;;

    markenmode:

  • markenmode für kinder;;
    designermode;;
    ed hardy;;
    modemarken;;
    markenmode günstig;;
    baby markenmode;;
    mister wong markenmode;;
    markenmode kinderbekleidung;;

    mode:

  • designermode;;
    mode und preis;;
    abendmode;;
    model;;
    vero moda;;
    new yorker;;
    glamour;;
    h&m;;

    mode und preis:

  • bonprix;;
    h und m;;
    c und a;;
    klingel;;
    bader;;
    mode und preis österreich;;
    mode und preis katalog;;
    happy size;;

    model:

  • model gesucht;;
    elite model;;
    model casting;;
    kindermodel;;
    modelstyle;;
    model magersucht;;
    img model;;
    walter model;;

    new yorker:

  • pimkie;;
    zara;;
    tally weijl;;
    h&m;;
    c und a;;
    deichmann;;
    new yorker öffnungszeiten;;
    new yorker filialen;;

    vero moda:

  • zara;;
    mango;;
    tally weijl;;
    zero;;
    h&m;;
    new yorker;;
    vero moda online;;
    only;;

    yoox:

  • yoox deutschland;;
    designermode;;
    yoox sale;;
    asos;;
    joox;;
    yoox gutschein;;
    diesel;;
    dressforless;;

Es ist also ersichtlich, dass man damit gut und schnell Keywords, gerade related und Longtails, generieren kann.
Und heey, wer kann Keywords besser in die Themenrelevanz einordnen als unser Freund Google selbst?

Also einfach die beiden Skripten aktivieren und ganz normale Keywordrecherche betreiben, surfen oder was auch immer und langsam aber sicher füllt sich die Datenbank mit allen wichtigen Stichwörten und deren verwandten Suchbegriffe.
Dann noch eine Abfrage zu den ähnlichen Begriffen, wenn man einen neue Seite/Blog/Werbung erstellt und schon hat man eine gute, fundierte Basis.

Optimiere deinen Google Analytics-Code … noch ein bisschen besser

Sie sind hier: Startseite » Archiv für Google

Im vorherigen Artikel hatte ich bereits über die Verbesserung des Google Analytics-Code gesprochen, in der Diskussion sind aber noch ein paar kleine Verschnellerungen aufgetaucht, die in diesem Generator enthalten sind.

Der Code sieht nun folgendermaßen aus:
<script>
var _gaq=[['_setAccount','UA-XXXXX-X'],['_gat._anonymizeIp'],['_trackPageview']];
(function(d){
  var g=d.createElement('script');
  g.async=1;
  g.src='http://www.google-analytics.com/ga.js';
  d.getElementsByTagName('head')[0].appendChild(g);
  for(var i=0;i<d.getElementsByTagName('a').length;i++){
    var a=d.getElementsByTagName('a')[i];
    if(!a.getAttribute('onclick') && window.location.hostname!=a.hostname)
    a.setAttribute('onclick', "_gaq.push(['_trackEvent', 'outbound', '"+a.href+"'])");
  }
}(document))</script>

Also bitte ab sofort selbigen Code nutzen :-)


Um Deinen individuellen Tracking-Code zu erhalten, gib hier die gewünschte ID ein:

Füge diesen Code vor dem Tag </body> ein:

Mit dem deutschen Datenschutz-Feature _anonymizeIp:

Optimiere deinen Google Analytics-Code

Sie sind hier: Startseite » Archiv für Google

Der Standardcode von Google Analytics ist aufgebläht und langsam. Mathias Bynens beschreibt in dem Artikel Optimizing the asynchronous Google Analytics snippet wie man den Code verkürzen und erheblich verschnellern kann (vgl. Studie auf JSperf).

Damit aber nicht genug, denn man kann aus dem JavaScript nocht mehr herausholen. Wie in Yoasts Google Analytics Plugin für WordPress will ich jedem Link, der von meiner Website führt, ein Tag “outbound” geben, sodass dies dann bei Google Analytics aufgeführt wird und ich weiß, wann der Besucher meine Seite verlassen hat.

Das kann man serverseitig mit dem Plugin lösen, oder auch vom Browser des Users selbst “berechnen” lassen und somit Bandbreite und Rechenaufwand sparen.

In Summe sieht das Skript gekürzt und verschlankt so aus:
<script>var _gaq=[['_setAccount','UA-XXXXX-X'],['_trackPageview']];(function(d){var
g=d.createElement('script'),i,a;g.async=1;g.src='http://www.google-analytics.com/ga.js';d.head.appendChild(g);for(i=0;i<d.getElementsByTagName('a').length;
i++){a=d.getElementsByTagName('a')[i];if(!a.getAttribute('onclick'))if(window.location.hostname!=a.hostname)
a.setAttribute('onclick',"javascript:_gaq.push(['_trackEvent','outbound','"+a.href+"']);");}}(document))</script>

Damit funktioniert es wunderbar und Du musst lediglich den Code jetzt neu, vor dem Inhaltsende (</body>) einfügen.

Um Deinen Code zu bekommen, generiere selbigen hier:


Um Deinen individuellen Tracking-Code zu erhalten, gib hier die gewünschte ID ein:

Füge diesen Code vor dem Tag </body> ein:

Mit dem deutschen Datenschutz-Feature _anonymizeIp:

Duplicate Content in WordPress-Blogs vermeiden

Sie sind hier: Startseite » Archiv für Google

Um Duplicate Content in einem WordPress-Blog zu vermeiden, habe ich heute (leider etwas zu spät) folgende Erweiterung in meinem webconsul WordPress-Theme in den <head>-Tag eingefügt:

<?php
if((is_home() && ($paged < 2 )) || is_single() || is_page() || is_category()){
    echo '<meta name="robots" content="index,follow" />';
} else {
    echo '<meta name="robots" content="noindex,follow" />';
}
?>

Damit werden alle Seiten außer der Startseite, einer Beitragsseite oder einer Kategorie mit noindex geblockt und somit auch nicht von Google als Duplicate Content zu erkennen geben.

Erläuterung: Das Problem rührt daher, dass die Archiv-Seiten der jeweiligen Monate und Co entsprechend sonst die gleichen Inhalte ausliefert.
Aber ich gehe davon aus, dass Google das selbst berücksichtigt, insofern viele Blogs selbige Technik nicht verwenden, daher lasst euch nicht beunruhigen, aber wenn ihr mal 30 Sekunden Zeit habt, dann baut das mit ein.

18 Millionen Nutzerprofile – powered by Google

Sie sind hier: Startseite » Archiv für Google

Will man in vielen Blogs, sozialen Community und dem ganzen Rest eindeutige Profile anlegen um den jeweiligen Seitenbetreiber und/oder Spam-System nicht aufzufallen, so braucht man Input. Viel Input.

Den beschafft man sich am besten einfach über Google selbst, indem man die Google Profile dazu nutzt.

Vor einiger Zeit konnte man über die Suchanfrage inurl:http://www.gstatic.com/s2/sitemaps/sitemap entsprechend 3449 Sitemaps mit je 5000 Profilen finden.
Gut, die Nummerierung ist relativ simpel und mit einem kleinen Skript kann man alle Sitemaps runterladen:
for($i=100; $i<3450; $i++)
system("wget http://www.gstatic.com/s2/sitemaps/sitemap-".$i.".txt");

Und dann die jeweiligen Sitemaps durchlaufen und die jeweiligen Profile mit diesem Skript:

for($i=2000; $i<3000; $i++) {
$file = fopen("../sitemap-$i.txt", "r") or exit("Unable to open file!");
system("mkdir profiles-$i");
while(!feof($file)) {
$random = rand(2,10);
$id = split('/', fgets($file));
$id = $id[4];
echo "fetching $id";
system("sh ../wget.sh $i $id");
sleep($random);
}
fclose($file);
}

Und wget.sh dann mit eigenem User-Agent und Parametern konfiguriert gibt am Ende 3499*5000 = 17.245.000 Google Profile.

Damit kann man sich ein schönes User-Netzwerk aufbauen, Blogs einrichten und vieles mehr.

Aber dabei sollte natürlich nie gegen die jeweiligen Richtlinien der Betreiber verstoßen werden.

HTML-Inhalte mit PHP laden

Sie sind hier: Startseite » Archiv für Google

HTML-Inhalte kann man mit PHP ganz einfach von anderen Seiten scrapen äh laden.

Dazu installiert ihr einfach Simple HTML DOM und schon geht es los.

Entweder holt ihr die Inhalte über cURL (der Vorteil ist defintiv eine mögliche Header-Modifizierung um Referer oder Cookies zu übertragen), wie hier beschrieben oder über die eingebaute Funktion file_get_html(url), die auch Inhalte aus dem Web lädt.

Damit kann man mit:
$html = file_get_html('http://www.google.com/');

Schon Inhalte holen und durch die DOM-Struktur mit folgenden Befehlen laufen:
// Alle Bilder finden und Quellsource ausgeben
foreach($html->find('img') as $element)
echo $element->src . '
';

// Alle Links durchlaufen und Verweisziel ausgeben
foreach($html->find('a') as $element)
echo $element->href . '
';

Mit dem Code ist es ein leichtes die Google SERPs zu überwachen (sowohl für Bilder als auch die anderen organischen Suchergebnisse) und/oder RSS-Feeds abzurufen und vieles mehr.

Seid kreativ ;-)
Um zum Beispiel gut zu ranken, Seiten zu finden, bei denen man kommentieren möchte, und vieles mehr.

Caffeine ist live – Google on the run!

Sie sind hier: Startseite » Archiv für Google

Google hat es getan: Caffeine ist live.

Eine detaillierte Erläuterung dazu schreibt Vanessa Fox persönlich beim Search Engine Land

Den besten deutschen Artikel gibt es dazu bei Sistrix, der dazu schon einen Vortrag gehalten hatte.

Aber natürlich darf man die unterschiedlichen Rankings zwischen Google und Bing nicht vergessen, die Rand herausgearbeitet hat.