Gerade habe ich im TED Blog (Link) gesehen, dass dort in der der WordPress-Theme Sidebar auf folgendes Spreadsheet bei Google verlinkt wird:
» TED Talks – Google Spreadsheet
Sicherheitshalber hab ich die Dateien als Export gesichert und ihr könnt sie euch hier runterladen:
Gerade um einen Mirror zur erstellen oder die strukturierten Daten anderweit zu Verwendungen, solltet ihr mit obigen Dateien was anfangen können. Ein Video-Aggregator für Geeks könnte damit wohl einfach zu realisieren sein *hint *;-)
Zur Unterhaltung müsst ihr euch unbedingt die Poetry In Motion-Playlist anschauen, mit diesen Videos:
Will man in vielen Blogs, sozialen Community und dem ganzen Rest eindeutige Profile anlegen um den jeweiligen Seitenbetreiber und/oder Spam-System nicht aufzufallen, so braucht man Input. Viel Input.
Den beschafft man sich am besten einfach über Google selbst, indem man die Google Profile dazu nutzt.
Vor einiger Zeit konnte man über die Suchanfrage inurl:http://www.gstatic.com/s2/sitemaps/sitemap entsprechend 3449 Sitemaps mit je 5000 Profilen finden.
Gut, die Nummerierung ist relativ simpel und mit einem kleinen Skript kann man alle Sitemaps runterladen:
for($i=100; $i<3450; $i++)
system("wget http://www.gstatic.com/s2/sitemaps/sitemap-".$i.".txt");
Und dann die jeweiligen Sitemaps durchlaufen und die jeweiligen Profile mit diesem Skript:
for($i=2000; $i<3000; $i++) {
$file = fopen("../sitemap-$i.txt", "r") or exit("Unable to open file!");
system("mkdir profiles-$i");
while(!feof($file)) {
$random = rand(2,10);
$id = split('/', fgets($file));
$id = $id[4];
echo "fetching $id";
system("sh ../wget.sh $i $id");
sleep($random);
}
fclose($file);
}
Und wget.sh dann mit eigenem User-Agent und Parametern konfiguriert gibt am Ende 3499*5000 = 17.245.000 Google Profile.
Damit kann man sich ein schönes User-Netzwerk aufbauen, Blogs einrichten und vieles mehr.
Aber dabei sollte natürlich nie gegen die jeweiligen Richtlinien der Betreiber verstoßen werden.