Links aus einer benutzderfinierten Google-Suche extrahieren

Manchmal hätte man gerne alle Links einer einzelnen benutzerdefinierten Suche (Custom Search Engine) in einer übersichtlichen Liste. Sei es um einen besseren Überblick zu erhalten oder um die Linkliste für einen Crawler der eigenen Suchmaschine weiter zu verarbeiten. Leider gibt es keine direkte Möglichkeit aus dem Admin-Dashboard so eine Liste zu generieren. Aber immerhin zwei Wege dahin:

Lösung A Gefrickel mit der ID

Es gibt dafür aber eine Frickel-Lösung, wie sie hier bei StackExchange beschrieben ist (und natürlich nur für eine eigene CSE möglich ist):

  1. Im Admin-Bereich der benutzerdefinierten Suche unter Grundlagen in der linken Navigation findet sich die ID der Suchmaschine, die aus 21 Ziffern (ID-VORDERERTEIL) gefolgt von einem Doppelpunkt und weiteren 11 Zeichen (ID-HINTERERTEIL besteht.
  2. Aus dieser ID muss man nun drei Elemente extrahieren:
    1. ID-Vorderteil – Das sind die 21 Zeichen bis zum Doppelpunkt.
    2. ID-Hiterteil – Das sind die 11 Zeichen hinter dem Doppelpunkt.
    3. Der Labelname – Der setzt sich aus der Zeichenfolge [_cse_] gefolgt von ID-Hinterteil zusammen.
  3. Nun muss man mit diesen Angaben eine URL für die API zusammen stricken, um eine TSV-Datei (oder XML-Datei) herunterladen zu können. Dazu die URL nach folgendem Muster erstellen:
    http://www.google.com/cse/api/ID-VORDERTEIL/annotations/ID-HINTERTEIL?label=LABELNAME&num=5000&start=0&feed=0&output=tsv
  4. Gibt man nun diese fertige URL in die Adresszeile des Browsers ein erhält man eine z.B: in Excel gut lesbare Linkliste der jeweiligen Links einer benutzerdefinierten Suche.

Lösung B – Excel-Sortierung

Eine Alternative zu dem Gefrickel mit der ID ist, sich zunächst einmal alle Annotationen aller eigenen Suchmaschinen herunterzuladen. Das ist unter „Erweitert“ im Admin-Bereich möglich in dem man dort auf „Annotationen herunterladen“ geht und am Besten die XML-Datei lädt. Öffnet man diese XML-Datei in Excel erhält man eine Tabelle mit allen Links aller seiner benutzderfinierten Suchmaschinen. Sortiert man hier nach Spalte „Label“ bzw. „Name“ (hängt davon ab ob man die TSV- oder XML-Datei heruntergeladen hat) erhält man so die gesuchten Links alle auf einen Schlag.

Wer erst noch wissen will das die benutzerdefinierte Suche (Custom Search) von Google überhaupt ist, dem sei dieses Youtube-Video empfohlen.

Nützlich sind die Dinger nämlich vor allem für thematisch fokussierte Suchen @henkvaness hat dazu beispielsweise eine Suchmaschine über verschiedene soziale Netzwerke zusammengestellt.

Selbst habe ich mal für die tägliche Arbeit eine Rezensionssuchmaschine erstellt und eine Suche über alle Presseorgane in Baden-Württemberg bzw. in Rheinland-Pfalz.

Dieser Eintrag wurde veröffentlicht in Tools und getaggt als , , , , . Fügen Sie den permalink zu Ihren Favoriten hinzu.

Schreib einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *