[Statistik] Kuriose Zahlenspiele aus dem dritten Quartal

Ich habe mich gewundert. In einer Woche verzeichnete der Blog zwar die übliche Anzahl von Besuchern von ca. 50 bis 100 am Tag, aber die Aufrufe schossen in die Höhe. Langsam aber stetig stiegen die Zahlen auf über 1000 Aufrufe am Tag an. Ein Blick hinter die Kulisse offenbarte, dass sich Googles Roboter ein bisschen ausgetobt haben. Kurze Zeit später kam dann auch die Meldung von Google, dass die Seite neu indexiert wurde, weswegen der Traffic kurzzeitig steigen kann.

Google Indizierung Buechernarr
Eine Google Indexierung schraubt die Zugriffe kurzfristig hoch

Noch drastischer waren die Zugriffszahlen des Bots Mediatoolkit. Dieser erzeugte an einem Tag über 4500 Seitenaufrufe.

Erstaunlich, was für einen Traffic allein nur die Roboter erzeugen. Und zeigt, dass es durchaus wichtig ist, die Zugriffe auf seiner Seite im Blick zu behalten. Der Bot von Mediatoolkit ist harmlos und hat nicht versucht, die Seite zu hacken, kann allerdings durchaus die Performance des Blogs beeinflussen. Es gibt aber auch die sogenannten Bad Bots. Wenn diese auf den Blog aufmerksam werden, dann sollte der Seitenadministrator aktiv werden.

Ich bin allerdings auch in diesem Fall aktiv geworden, denn viele der Good Bots lesen die robots.txt aus, so dass mit einem einfachen Befehl der Traffic reduziert oder gänzlich deaktiviert werden kann. Ich selbst nutze den “Crawl-delay”-Befehl, um die Anzahl der Zugriffe zu regeln. Der Roboter darf zum Beispiel nur minütlich auf die Seite zugreifen.

traffic crawler
Von diversen Diensten erzeugter Traffic auf dem Blog

 

Übrigens: Bei den Zahlen, die ich in den Statistik-Beiträgen nenne, sind natürlich jegliche Aktivitäten der Roboter herausgerechnet. Ebenso wie die eigene Seitenadministration, die ebenfalls für ordentlich Traffic sorgt.

 

Ein weiteres Kuriosum: Mehr oder weniger aus dem Nichts kamen plötzlich an die 500 Besucher an einem Tag und sorgten für über 650 Zugriffe. Ziel der Besucher: Die Rezension zu “Die wilde Sophie“, die am 27. März 2018 online gegangen ist. Wohlgemerkt, es handelte sich um Besucher und nicht einen Roboter.

Allerdings kann ich nicht sagen, wo die Besucher herkamen, weil keine eindeutige Signatur hinterlassen wurde. Für gewöhnlich hinterlassen die Besucher eine Spur zu der Seite, die auf diesen Blog verlinkt. Dies war in diesem Besucherpeak nicht der Fall. Irgendwie kurios.

 


[the_ad id=”3637″]

2 Kommentare

  1. Hallo,

    ich glaube das mit den Besuchern darf man eh nicht so genau nehmen. Wenn man drei Plugins zum Zählen nutzt, bekommt man drei Ergebnisse. Das eine zählt Robots mit, das nächste nicht oder eben nur einige nicht.

    Dann gibt es noch Testseiten zum Geschwindigkeitstest oder Spambots, die auch jeweils mit eigenen IPs auftauchen.

    Bzgl. der Aufrufe habe ich kürzlich mal auf meinem Blog getestet. Der erste Seitenaufruf dauert grob 3 Sekunden, wenn der Server nicht gerade schluckauf hat. 100 Parallele Anfragen mit 5000 Requests sind dann aber ziemlich schnell erledigt (<2 Minuten), weil die Ergebnisse gecached werden. Das heißt selbst ein kleiner Server liegt bei Millionen von Abfragen pro Tag. So ganz schnell ist da also nichts lahmzulegen, wenn man mit Caching arbeitet.

    LG

    Torsten

    1. Hallo Thorsten,

      als Admin einer Website hat man durchaus Möglichkeiten, auf Roboter, Crawler und Webseiten-Cache Einfluss zu nehmen. Vornehmlich, um die Performance der Seite nicht zu sehr darunter leiden zu lassen. Ich möchte ja nicht, dass dauernd irgendwelche Roboter für Traffic sorgen.

      Deswegen auch meine Hinweise, wie die Roboter ein wenig gebremst werden können.

      Wie im Beitrag schon geschrieben, bereinige ich meine Zugriffszahlen von Robotern, Crawlern und auch eigenen Zugriffen, wenn ich diese in den Statistikbeiträgen angebe.

      Ich finde es zudem sehr interessant, wenn einzelne Beiträge auf einmal so viele echte Besucher verzeichnen können, auch wenn ich nicht immer ausmachen kann, wo die herkommen.

      Herzliche Grüße
      Frank

Kommentar hinterlassen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert