webconsul

the best webconsul(ting)

Duplicate Content in WordPress-Blogs vermeiden

Sie sind hier: Startseite » Archiv für Google

Um Duplicate Content in einem WordPress-Blog zu vermeiden, habe ich heute (leider etwas zu spät) folgende Erweiterung in meinem webconsul WordPress-Theme in den <head>-Tag eingefügt:

<?php
if((is_home() && ($paged < 2 )) || is_single() || is_page() || is_category()){
    echo '<meta name="robots" content="index,follow" />';
} else {
    echo '<meta name="robots" content="noindex,follow" />';
}
?>

Damit werden alle Seiten außer der Startseite, einer Beitragsseite oder einer Kategorie mit noindex geblockt und somit auch nicht von Google als Duplicate Content zu erkennen geben.

Erläuterung: Das Problem rührt daher, dass die Archiv-Seiten der jeweiligen Monate und Co entsprechend sonst die gleichen Inhalte ausliefert.
Aber ich gehe davon aus, dass Google das selbst berücksichtigt, insofern viele Blogs selbige Technik nicht verwenden, daher lasst euch nicht beunruhigen, aber wenn ihr mal 30 Sekunden Zeit habt, dann baut das mit ein.

18 Millionen Nutzerprofile – powered by Google

Sie sind hier: Startseite » Archiv für Google

Will man in vielen Blogs, sozialen Community und dem ganzen Rest eindeutige Profile anlegen um den jeweiligen Seitenbetreiber und/oder Spam-System nicht aufzufallen, so braucht man Input. Viel Input.

Den beschafft man sich am besten einfach über Google selbst, indem man die Google Profile dazu nutzt.

Vor einiger Zeit konnte man über die Suchanfrage inurl:http://www.gstatic.com/s2/sitemaps/sitemap entsprechend 3449 Sitemaps mit je 5000 Profilen finden.
Gut, die Nummerierung ist relativ simpel und mit einem kleinen Skript kann man alle Sitemaps runterladen:
for($i=100; $i<3450; $i++)
system("wget http://www.gstatic.com/s2/sitemaps/sitemap-".$i.".txt");

Und dann die jeweiligen Sitemaps durchlaufen und die jeweiligen Profile mit diesem Skript:

for($i=2000; $i<3000; $i++) {
$file = fopen("../sitemap-$i.txt", "r") or exit("Unable to open file!");
system("mkdir profiles-$i");
while(!feof($file)) {
$random = rand(2,10);
$id = split('/', fgets($file));
$id = $id[4];
echo "fetching $id";
system("sh ../wget.sh $i $id");
sleep($random);
}
fclose($file);
}

Und wget.sh dann mit eigenem User-Agent und Parametern konfiguriert gibt am Ende 3499*5000 = 17.245.000 Google Profile.

Damit kann man sich ein schönes User-Netzwerk aufbauen, Blogs einrichten und vieles mehr.

Aber dabei sollte natürlich nie gegen die jeweiligen Richtlinien der Betreiber verstoßen werden.

HTML-Inhalte mit PHP laden

Sie sind hier: Startseite » Archiv für Google

HTML-Inhalte kann man mit PHP ganz einfach von anderen Seiten scrapen äh laden.

Dazu installiert ihr einfach Simple HTML DOM und schon geht es los.

Entweder holt ihr die Inhalte über cURL (der Vorteil ist defintiv eine mögliche Header-Modifizierung um Referer oder Cookies zu übertragen), wie hier beschrieben oder über die eingebaute Funktion file_get_html(url), die auch Inhalte aus dem Web lädt.

Damit kann man mit:
$html = file_get_html('http://www.google.com/');

Schon Inhalte holen und durch die DOM-Struktur mit folgenden Befehlen laufen:
// Alle Bilder finden und Quellsource ausgeben
foreach($html->find('img') as $element)
echo $element->src . '
';

// Alle Links durchlaufen und Verweisziel ausgeben
foreach($html->find('a') as $element)
echo $element->href . '
';

Mit dem Code ist es ein leichtes die Google SERPs zu überwachen (sowohl für Bilder als auch die anderen organischen Suchergebnisse) und/oder RSS-Feeds abzurufen und vieles mehr.

Seid kreativ ;-)
Um zum Beispiel gut zu ranken, Seiten zu finden, bei denen man kommentieren möchte, und vieles mehr.

Caffeine ist live – Google on the run!

Sie sind hier: Startseite » Archiv für Google

Google hat es getan: Caffeine ist live.

Eine detaillierte Erläuterung dazu schreibt Vanessa Fox persönlich beim Search Engine Land

Den besten deutschen Artikel gibt es dazu bei Sistrix, der dazu schon einen Vortrag gehalten hatte.

Aber natürlich darf man die unterschiedlichen Rankings zwischen Google und Bing nicht vergessen, die Rand herausgearbeitet hat.

SEO-Input der letzten Tage

Sie sind hier: Startseite » Archiv für Google

Um den Blog hier wieder mit mehr Leben zu füllen, gibt es die besten SEO Artikel und Beiträge aus den letzten Tagen und Wochen, die ich mir zum intensiveren Lesen notiert hatte:

  • Site Review Part 3 in der BING Community
  • Google MayDay Update und mehr hier: Google Makes One Change Per Day To Search Algorithm
  • How Do Americans Access Government Data? Search Engines. Ist bei uns in .de auch nicht anders.
  • Etwas schwärzer: content spinning eine nicht zu empfehlende Technik, aber netter Write-Up
  • Another 10 Ways Search Engines May Rerank Search Results wie Suchmaschinen die Ergebnisse bewerten und bewerten könnten. Dazu aber mehr in der nächsten Zeit.
    Das sind nun genug Geschichten zur Optimierung und in der nächsten Zeit gibt es noch mehr.

    Update:
    Ganz vergessen hatte ich diesen Post mit diesem Video:

    Quintessenz draus: für wichtige Seiten Google Sites dazu nicht verwenden, scheinbar ranken die nicht (Anmerkung meinerseits: für Linkvalue und Linkbuilding schon :D ) und nutzt anderen Content, wie das Android App Ding, aber schreibt den so um, dass der Nutzen für den User auf jeden Fall vorhanden ist. Changelog zur Contentmaximierung nach unten und so weiter… ;)

    Stay tuned!

  • Statistik am Freitag

    Sie sind hier: Startseite » Archiv für Google

    Am heutigen Freitag, den (13-1)., scheint in der Blogosphäre das Thema Statistik brandheiß zu sein.

    Bei SEOmoz wird darüber berichtet, wie man in Google Analytics die Besucher gekonnt einteilt (Advanced Segmentation) und noch mehr aus selbigen herausholen kann.

    Passend gibt es dazu in den Science Blogs einen Artikel darüber, wie man Statistiken richtig liest. Auch verdammt nützlich, denn wenn man nicht weiß, was man mit den gesammelten Daten anfangen kann/soll, dann bringen die auch nichts.

    In Ergänzung dazu gibt es diesen Post: Wie man Kundenmeinungen als Erfolgsfaktor zur Vertrauensbildung und Werbung nutzen kann.

    Den größten Buzz verursachen seit heute wohl neben Google Buzz wohl die kanadischen Winterspiele in Vancouver.
    Dazu wurden Social Media Richtlinien verhängt, wie den Sportlern sagen was und wie sie bloggen oder zwitschern dürfen:

    So dürfen die Olympioniken beispielsweise nicht journalistisch aktiv werden und über Konkurrenten, Teamkollegen und interne Abläufe berichten. Dennoch werden die Sportler dazu aufgefordert Social Media Plattformen, wie Facebook und Twitter aktiv zu verwenden und in aller Munde zu sein – unter Vorbehalt der Social-Media-Richtlinien.

    Im Bing-Blog gibt es noch einen lesenswerten Artikel über Webspam und beim Copyblogger gibt es von Dan Kennedy die “14 Regeln” von einem der erfolgreichsten Werbetextern.

    Zum Thema Social Media Optimierung oder kurz SMO gibt es hier noch einen netten Artikel über die Entwicklung von Linkfarmen.

    Dazu gab es gestern noch aus der Serie Konversionsbooster (Teil 1 und Teil 2) den Teil 3 über Cross Selling.

    Zum erheiternden Abschluss muss ich noch auf diesen Post hier verlinken: hier gibts durch einen Klingelton größere Brüste also als Frau unbedingt ausprobieren.

    Google zur optimalen Seitenstruktur

    Sie sind hier: Startseite » Archiv für Google

    Vor einiger Zeit gab es ja schon die erste Site Clinic von Google und heute kam der zweite Beitrag zur Serie raus: Google Grants Site Clinic: Überarbeitung der Website-Struktur

    Dabei wird die Struktur der Seite www.kenia-hilfe.com beleuchtet und wichtige Tipps gegeben.

    Gut, dass man auf Title- und Meta-Tags achten soll ist nicht wirklich was neues, auch, dass man eine Sitemap verwenden soll, um Google das Crawling zu erleichtern beziehungsweise zu ersparen. Gerade bei der Empfehlung hier und dem Sitemap Generator hier sollte wohl jeder wissen, dass sich der Einsatz lohnt.

    In dem Artikel wird auch nochmals auf 301-Weiterleitungen und die 404-Fehlerseiten eingegangen. Zu den 301 Redirects will ich nur kurz sagen, dass man Weiterleitungen auf jeden Fall so umleiten soll, außer man will ein Problem temporär lösen, aber bei einer nachhaltigen Änderungen muss der 301 verwendet werden.
    Zu den 404-Fehlerseiten muss mehr gesagt werden. Einerseits sind die Seiten auch für den User verdammt sinnvoll. Gerade bei irgendwelchen kaputten Verlinkungen, umgezogenen Seiten und Vertippern, braucht der User einen Guide, der ihn an der Handn immt und zur gewünschten Seite bringt. Damit wird der Besucher nicht verloren und ob es ein Besucher oder ein Crawler ist, ist dabei egal.
    Daher kontrolliert nochmals eure Fehlerseiten und wenn auch diese korrekt und gut arbeiten, dann könnt ihr jetzt verdient und entspannt in das Wochenende gehen.

    Google Adwords Neuerungen und Gutschein

    Sie sind hier: Startseite » Archiv für Google

    Gestern ist mir ein Google Adwords Gutschein ins Haus gefaltert und die 75 Euro will ich nicht einfach verstreichen lassen. Daher habe ich mir in den letzten Tagen nochmals die Neuerungen angeschaut und bin auch die interessanten Artikel gestoßen:
    Click to Call Ads

    Wie auch hier berichtet wurde.
    Nun erlaubt Google in den Kampagneneinstellungen für mobile Anzeigen eine Rufnummer zu hinterlegen, die der Benutzer mit einem einfachen Klick am Handy direkt anrufen kann. Diese Funktion ist nur ein logischer Schritt zur verbesserten Usability und nicht wirklich ein Highlight.

    Somit hat nicht nur AdScale hat ein neues Werbeformat, die Video Interstitial Ads, auf den Markt geworfen, sondern auch mal wieder Google.

    Interessanter ist der neue Bereich in den Adwordskonten mit dem Namen “Werbechancen”.
    Dazu gibt es eine ausführliche Erklärung in diesem Beitrag und hier die erste Verlautung von Google selbst.

    Die lesenswerteste Beitragsserie zum Google Contentnetzwerk gibt es auf www.sem-praxis.de:
    Das Google Content Werbenetzwerk verstehen – Teil 1 – das Netzwerk
    Das Google Content Werbenetzwerk verstehen – Teil 2 – die Planung
    Das Google Content Werbenetzwerk verstehen – Teil 3 – die Webseiten
    Das Google Content Werbenetzwerk verstehen – Teil 4 – die Gebote

    Dazu kam heute auch noch der interessante Post von Julia zum Thema Zeitliche Ausrichtung von Google Adwords-Kampagnen der die logische Fortführung von diesem ist.

    Mehr interessante Seiten werden direkt von Google empfohlen: Blick über den Tellerrand 1 und Blick über den Tellerrand 2

    Google indiziert schnell – bald neuer Pingdienst?

    Sie sind hier: Startseite » Archiv für Google

    Zur Zeit ist es in aller Munde, Googles real-time web.

    Gerade wer sich auch über die Spameinträge bei Twitter und Co geärg.. äh gewundert hat und diesen Müll nun auch in den top Suchergebnisse zu finden kann schon manchmal stören.

    Zum Glück arbeitet Google an der Relevanz und somit Gewichtung der Beiträge aber zufrieden bin ich damit eigentlich noch nicht.

    Klar man kann die Trends auch hier einsehen, aber das ist eben was anderes als die Suchergebnisse.

    Mal sehen was noch kommt, wir können auf jeden Fall gespannt sein, was Google noch so alles macht und vor allem, woran sich die neuen Social Media Experten, Gurus und Evangelisten sowie SEOs machen.

    Es wird ein tolles Jahr und Google sollte doch mehr Leute im Anti-Spam-Team einschleusen, vielleicht einen Speedreader, der live die Tweets checkt ;-) ?

    Googles Bildersuche: der andere Weg zum Produkt

    Sie sind hier: Startseite » Archiv für Google

    Google bietet Handy-Besitzern* seit geraumer Zeit an Google Goggles zu verwenden mit Hilfe eines Bildes zu suchen.
    Dabei muss ein Foto vom gewünschten Objekt, zum Beispiel der Pariser Eiffelturm, gemacht werden und dieses über die Applikation an Google gesandt werden.
    Dort wird das Bild verarbeitet und das gewünschte Suchergebnis geliefert:

    Es wäre ja nicht Google, wenn da nicht mehr kommen würde.

    Also hat Google sich selbst als Weihnachtsgeschenk, passend zum 24. Dezember folgendes Patent eintragen lassen:
    Image Capture for Purchases

    Das funktioniert ähnlich der Suche für Sehenswürdigkeiten und/oder Monumente und bietet mit folgendem Ablauf den Einkauf, natürlich über Google Checkout, an.

    Google Visual Search 1
    Google Visual Search 2
    Google Visual Search 3

    Aber habt keine Angst davor, Google ist doch nicht evil.
    Die Informationen und Grafiken hat Bill in seinem Artikel verwendet erläutert.

    * diese müssen entweder auf Android, Palm, Blackberry, Symbian oder Windows Mobile laufen oder Java (J2ME) unterstützen. Dies und genauere Informationen gibt es auf der passenden Hilfe-Seite.