YaCy mit Webstruktur-Analyse

YaCy Webstructure in ActionIn der aktuellen Entwicklerversion von YaCy gibt es eine neue Seite, die aus dem aktuellem Crawljob eine Webstruktur generiert, welche ähnlich einer Mindmap anzeigt wie die indexierten Seiten untereinander verlinkt sind. Damit kann man einerseits die Struktur der Verlinkung sehen, andererseits kann man ganz gut erkennen, was der eigene Indexer gerade tut. Weiterhin lässt sich so recht gut das Ranking nachvollziehen.

Webmaster können die Struktur nutzen, wenn sie sowieso ihre eigene Seite gerade in den Index bringen, um zu erkennen, zu welchen Seiten man von ihrer Seite aus über mehrere Links kommen kann.

Die Webstrukturseite ist unter http://localhost:8080/WatchWebStructure_p.html für den Admin des Peers zu finden. 8080 muss gegebenenfalls durch den abgeänderten Peerport ersetzt werden.

6 Responses to “YaCy mit Webstruktur-Analyse”

  1. […] LtHawk: 2:45 Uhr aufstehen, 3:30 zu KoH – dann zusammen zum Essener Hbf und um 4:09 dann schliesslich auf Richtung Köln. Alles lief nach Plan. Angekommen in Köln riefen wir Huppi an, den wir am Ausgang des Kölner Hbf’s erwarteten – dann die Schreckensnachricht: Das Auto ist im Eimer. Mist. Nach kurzer Zeit stand fest wie wir nach Berlin kommen, wir hatten eine kompetente Mitarbeiterin einer Sixt Filiale _im_ Hilton Hotel ausfindig gemacht, die uns das kleinste was der Laden zu bieten hatte (A4 o_O) sofort vermieten konnte Im Starbucks haben KoH und ich dann noch ca. 2h programmiert, YaCy-Admin braucht halt Aufmerksamkeit. Als Huppi und allo dann angekommen waren hatten wir schon ein paar Kaffee getrunken und sind dann (zur Freude von Huppi) mit dem schönen schnellen Mietwagen in Richtung Berlin losgefahren. Allo: Also fuhren nun Huppi und ich mit Bus und Bahn also zum Kölner Hbf. Dort angekommen fanden wir die beiden anderen im Starbucks, direkt neben den Sixt Büro, wo wir nun die Autoschlüssel abholten. Das Auto – ein Audi A4 – selber stand in der Tiefgarage vom Hilton Hotel. Jetzt konnte es endlich losgehen, und wir fuhren nach Berlin. Dort kamen wir dann mit einigen Stunden Verspätung an. Dort war natürlich der große Ansturm schon vorbei, aber es kamen noch einige interessierte Leute. Von der Presse kam das ZDF vorbei, und ließ sich von Orbiter die YaCy-Suchfunktion sowie die Webstruktur vorführen. […]

  2. daburna sagt:

    Super Feuature! Vorallem für mich als Webmaster. Nur wie kommt meine Seite selbst in den Mittelpunkt? Muss ich manuell einen Crawl über meine Seite starten oder reicht das pure surfen per Proxy aus?

  3. allo sagt:

    Du crawlst natürlich deine Seite, um möglichst viel Struktur um deine Seite zu kennen. Es funktioniert auch, wenn ein anderer Crawl deine Seite mit erwischt, aber dann sieht es mit deiner in der Mitte nicht mehr so interessant aus.

    Wenn es nun gerade erfasst wurde, kannst du in der latest-Version schon in einem Textfeld die Url, die zentral sein soll eingeben.

    Ansonsten bei 0.52 stable oben ?host=domain.de oder wenn dort schon ?… steht ?…&host=domain.de verwenden.

  4. Low012 sagt:

    Die Grafik war auch der Hingucker auf dem LinuxTag! Letztes Jahr war das übrigens die WatchCrawler-Seite, die da ja auch ganz neu war.

  5. daburna sagt:

    Ah okay, danke! Super! Mit dem Domaineingabefeld ist das ganze ja noch komfortabler und interessanter!

  6. […] einen guten Monat nach YaCy 0.52 ist heute Version 0.53 erschienen. Neben der bereits hier erwähnten Webstruktur-Analyse enthält YaCy nun unter anderem eine verbesserte Bildersuche, eine schönere […]

Leave a Reply