YaCy mit Webstruktur-Analyse

YaCy Webstructure in ActionIn der aktuellen Entwicklerversion von YaCy gibt es eine neue Seite, die aus dem aktuellem Crawljob eine Webstruktur generiert, welche ńhnlich einer Mindmap anzeigt wie die indexierten Seiten untereinander verlinkt sind. Damit kann man einerseits die Struktur der Verlinkung sehen, andererseits kann man ganz gut erkennen, was der eigene Indexer gerade tut. Weiterhin lńsst sich so recht gut das Ranking nachvollziehen.

Webmaster k÷nnen die Struktur nutzen, wenn sie sowieso ihre eigene Seite gerade in den Index bringen, um zu erkennen, zu welchen Seiten man von ihrer Seite aus Řber mehrere Links kommen kann.

Die Webstrukturseite ist unter http://localhost:8080/WatchWebStructure_p.html fŘr den Admin des Peers zu finden. 8080 muss gegebenenfalls durch den abgeńnderten Peerport ersetzt werden.

6 Responses to “YaCy mit Webstruktur-Analyse”

  1. […] LtHawk: 2:45 Uhr aufstehen, 3:30 zu KoH – dann zusammen zum Essener Hbf und um 4:09 dann schliesslich auf Richtung K├Âln. Alles lief nach Plan. Angekommen in K├Âln riefen wir Huppi an, den wir am Ausgang des K├Âlner Hbf’s erwarteten – dann die Schreckensnachricht: Das Auto ist im Eimer. Mist. Nach kurzer Zeit stand fest wie wir nach Berlin kommen, wir hatten eine kompetente Mitarbeiterin einer Sixt Filiale _im_ Hilton Hotel ausfindig gemacht, die uns das kleinste was der Laden zu bieten hatte (A4 o_O) sofort vermieten konnte Im Starbucks haben KoH und ich dann noch ca. 2h programmiert, YaCy-Admin braucht halt Aufmerksamkeit. Als Huppi und allo dann angekommen waren hatten wir schon ein paar Kaffee getrunken und sind dann (zur Freude von Huppi) mit dem sch├Ânen schnellen Mietwagen in Richtung Berlin losgefahren. Allo: Also fuhren nun Huppi und ich mit Bus und Bahn also zum K├Âlner Hbf. Dort angekommen fanden wir die beiden anderen im Starbucks, direkt neben den Sixt B├╝ro, wo wir nun die Autoschl├╝ssel abholten. Das Auto – ein Audi A4 – selber stand in der Tiefgarage vom Hilton Hotel. Jetzt konnte es endlich losgehen, und wir fuhren nach Berlin. Dort kamen wir dann mit einigen Stunden Versp├Ątung an. Dort war nat├╝rlich der gro├če Ansturm schon vorbei, aber es kamen noch einige interessierte Leute. Von der Presse kam das ZDF vorbei, und lie├č sich von Orbiter die YaCy-Suchfunktion sowie die Webstruktur vorf├╝hren. […]

  2. daburna sagt:

    Super Feuature! Vorallem f├╝r mich als Webmaster. Nur wie kommt meine Seite selbst in den Mittelpunkt? Muss ich manuell einen Crawl ├╝ber meine Seite starten oder reicht das pure surfen per Proxy aus?

  3. allo sagt:

    Du crawlst nat├╝rlich deine Seite, um m├Âglichst viel Struktur um deine Seite zu kennen. Es funktioniert auch, wenn ein anderer Crawl deine Seite mit erwischt, aber dann sieht es mit deiner in der Mitte nicht mehr so interessant aus.

    Wenn es nun gerade erfasst wurde, kannst du in der latest-Version schon in einem Textfeld die Url, die zentral sein soll eingeben.

    Ansonsten bei 0.52 stable oben ?host=domain.de oder wenn dort schon ?… steht ?…&host=domain.de verwenden.

  4. Low012 sagt:

    Die Grafik war auch der Hingucker auf dem LinuxTag! Letztes Jahr war das ├╝brigens die WatchCrawler-Seite, die da ja auch ganz neu war.

  5. daburna sagt:

    Ah okay, danke! Super! Mit dem Domaineingabefeld ist das ganze ja noch komfortabler und interessanter!

  6. […] einen guten Monat nach YaCy 0.52 ist heute Version 0.53 erschienen. Neben der bereits hier erw├Ąhnten Webstruktur-Analyse enth├Ąlt YaCy nun unter anderem eine verbesserte Bildersuche, eine sch├Ânere […]

Leave a Reply