Ergebnis 1 bis 10 von 10

Thema: BOT nutch/1.2 (nutch)

  1. #1
    MBR
    MBR ist offline
    Postrank 2 Avatar von MBR
    Registriert seit
    12.08.2011
    Beiträge
    56

    BOT nutch/1.2 (nutch)

    Hi zusammen,

    hab grad keine passende Kategorie gefunden, daher poste ich das erstmal hier.

    Kennt jemand diesen Bot? Hab ich seit gestern in den Logs.
    Soll ich den sperren oder nicht?

    Danke

  2. #2
    Postrank 3 Avatar von Malte Landwehr
    Registriert seit
    07.08.2011
    Ort
    Münster
    Beiträge
    118
    Dabei handelt es sich um Welcome to Apache Nutch®. Kannst du sperren.

  3. #3
    MBR
    MBR ist offline
    Postrank 2 Avatar von MBR
    Registriert seit
    12.08.2011
    Beiträge
    56
    Hmm ... ich sperr ja so einiges, aber da bin ich mir echt unsicher?

    Der Bot kommt kommt über diverse Ips und achtet auch die robots.txt.
    Zum Thema Nutch hab ich auch grad einen älteren Artikel bei TP gefunden.

  4. #4
    Postrank 8
    Registriert seit
    23.08.2011
    Ort
    Würzburg
    Beiträge
    1.492
    Nutch ist nur eine Software, so wie viele andere auch. Die Frage ob sperren oder nicht richtet sich wohl eher danach, wer die Software einsetzt und was er mit den Daten macht. Ich persönlich würde aber auch sperren. Wenn einer so eine Software nutzt und nach außen "seriös" erscheinen will, dann ändert der zumindest den UA und nutzt nicht die Defaultvorgabe.

    Ich habe auch so Leute auf meinen Seiten, die senden UAs wie
    "Firefox/4.0.1 /Nutch-1.2" <- der kommt mit verschiedenen IPs und unterschiedlichen UA, aber immer mit nutch
    "nutch-solr-integration/Nutch-1.2"

  5. #5
    MBR
    MBR ist offline
    Postrank 2 Avatar von MBR
    Registriert seit
    12.08.2011
    Beiträge
    56
    Zitat Zitat von Synonym Beitrag anzeigen
    Ich habe auch so Leute auf meinen Seiten, die senden UAs wie
    "Firefox/4.0.1 /Nutch-1.2" <- der kommt mit verschiedenen IPs und unterschiedlichen UA, aber immer mit nutch
    "nutch-solr-integration/Nutch-1.2"
    Bei mir nur mit "nutch/1.2 (nutch)"

  6. #6
    Postrank 8
    Registriert seit
    23.08.2011
    Ort
    Würzburg
    Beiträge
    1.492
    Das kann dann der gleiche sein wie bei mir. Einer der UAs ist auch nur "nutch/1.2 (nutch)". Andere IP, gleicher Inhaber. -> "cluster.eu.webcrawler.pixray.com"

    Kann aber auch ein anderer sein, der die Software nur nutzt.

  7. #7
    Postrank 3 Avatar von Malte Landwehr
    Registriert seit
    07.08.2011
    Ort
    Münster
    Beiträge
    118
    Zitat Zitat von MBR Beitrag anzeigen
    ich sperr ja so einiges, aber da bin ich mir echt unsicher?
    Es ist definitiv keine große Suchmaschine also was soll dein Verlust/Schaden sein, wenn du ihn nicht sperrst?

  8. #8
    Platzwart Avatar von catcat
    Registriert seit
    10.06.2011
    Ort
    Kaunas
    Beiträge
    2.338
    So wie ich das verstanden habe, kann sich da jeder Horst seine eigene SuMa einrichten und festlegen wie und wo gesucht werden soll.
    Nur... ich hab eigentlich keinen Bock, das dann zig nutch-bots von zig selbsternannten SuMa-Betreibern meine Sites crawlen und mir ganz neue Dimensionen des nutzlosen traffics zeigen.

    Ist schon schlimm genug, daß der google-bot bei mir campt.
    Habe eben beschlossen, an Easiophobie zu leiden.
    Und grade ist auch noch ne Pagophobie dazugekommen...
    catcat.cc/

  9. #9
    MBR
    MBR ist offline
    Postrank 2 Avatar von MBR
    Registriert seit
    12.08.2011
    Beiträge
    56
    Zitat Zitat von Malte Landwehr Beitrag anzeigen
    Es ist definitiv keine große Suchmaschine also was soll dein Verlust/Schaden sein, wenn du ihn nicht sperrst?
    Ich hab ihn jetzt gesperrt. Merci

  10. #10
    MBR
    MBR ist offline
    Postrank 2 Avatar von MBR
    Registriert seit
    12.08.2011
    Beiträge
    56
    Zitat Zitat von Synonym Beitrag anzeigen
    Das kann dann der gleiche sein wie bei mir. Einer der UAs ist auch nur "nutch/1.2 (nutch)". Andere IP, gleicher Inhaber. -> "cluster.eu.webcrawler.pixray.com"
    Ist definitiv der gleiche. Danke Dir!

Lesezeichen

Lesezeichen

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •  
Hosting und Domains | Seide | Darts | Impressum