webconsul

the best webconsul(ting)

18 Millionen Nutzerprofile – powered by Google

Sie sind hier: Startseite » 18 Millionen Nutzerprofile – powered by Google

Will man in vielen Blogs, sozialen Community und dem ganzen Rest eindeutige Profile anlegen um den jeweiligen Seitenbetreiber und/oder Spam-System nicht aufzufallen, so braucht man Input. Viel Input.

Den beschafft man sich am besten einfach über Google selbst, indem man die Google Profile dazu nutzt.

Vor einiger Zeit konnte man über die Suchanfrage inurl:http://www.gstatic.com/s2/sitemaps/sitemap entsprechend 3449 Sitemaps mit je 5000 Profilen finden.
Gut, die Nummerierung ist relativ simpel und mit einem kleinen Skript kann man alle Sitemaps runterladen:
for($i=100; $i<3450; $i++)
system("wget http://www.gstatic.com/s2/sitemaps/sitemap-".$i.".txt");

Und dann die jeweiligen Sitemaps durchlaufen und die jeweiligen Profile mit diesem Skript:

for($i=2000; $i<3000; $i++) {
$file = fopen("../sitemap-$i.txt", "r") or exit("Unable to open file!");
system("mkdir profiles-$i");
while(!feof($file)) {
$random = rand(2,10);
$id = split('/', fgets($file));
$id = $id[4];
echo "fetching $id";
system("sh ../wget.sh $i $id");
sleep($random);
}
fclose($file);
}

Und wget.sh dann mit eigenem User-Agent und Parametern konfiguriert gibt am Ende 3499*5000 = 17.245.000 Google Profile.

Damit kann man sich ein schönes User-Netzwerk aufbauen, Blogs einrichten und vieles mehr.

Aber dabei sollte natürlich nie gegen die jeweiligen Richtlinien der Betreiber verstoßen werden.



Ähnliche Beiträge:
  • Google zur optimalen Seitenstruktur Vor einiger Zeit gab es ja schon die erste Site Clinic von Google und heute kam der zweite Beitrag zur Serie raus: Google Grants Site...
  • Google Adwords Neuerungen und Gutschein Gestern ist mir ein Google Adwords Gutschein ins Haus gefaltert und die 75 Euro will ich nicht einfach verstreichen lassen. Daher habe ich mir in...
  • HTML-Inhalte mit PHP laden HTML-Inhalte kann man mit PHP ganz einfach von anderen Seiten scrapen äh laden. Dazu installiert ihr einfach Simple HTML DOM und schon geht es los....
  • Caffeine ist live – Google on the run! Google hat es getan: Caffeine ist live. Eine detaillierte Erläuterung dazu schreibt Vanessa Fox persönlich beim Search Engine Land Den besten deutschen Artikel gibt es...
  • Blogspamming like a Pro In den letzten zwei Posts steht, wie man Inhalte von anderen Seiten scrapet oder zur eigenen Verarbeitung lädt. Dieser Post gehört wie manche anderen auch...
  • Google vs. WolframAlpha – Klappe die Nächste Seit einiger Zeit ist ja Wolfram|Alpha als neuer Google Killer im Gespräch. Verwunderlich ist es da nicht, dass Google zum Gegenangriff startet. Gerade folgende Youtube...
  • Google Doodle Soeben habe ich wieder einen Artikel über die Google Doodles gelesen, der auf dieses Video verweist: Vor einiger Zeit gab es ja auch den Wettbewerb...

Hinterlasse eine Antwort