Analiza ponad 7 miliardów plików logów przeprowadzona przez Botify i Chrisa Longa (współzałożyciela agencji Nectiv) pokazuje, jak zmieniła się aktywność crawlerów OpenAI w okresie od listopada 2024 do marca 2026 roku.

Treść przygotowana przez AI

Jest to krótka charakterystyka przygotowana przez AI i pełni funkcję informacyjną, a nie interpretacyjną. Ludzka praca kończy się tutaj na selekcji badań i raportów, z którymi z tych czy innych powodów warto się moim zdaniem zapoznać. Opis badania oraz wyimek statystyk powinny pomóc w ocenie, czy dane te są interesujące.

Crawl OpenAI wzrósł trzykrotnie, aktywność ChatGPT-User spadła o 28%

Dane z plików logów zebranych przez Botify wskazują na wyraźne rozbieżności między aktywnością różnych botów OpenAI. Wzrost aktywności crawlerów automatycznych zbiegł się w czasie z premierą GPT-5 w sierpniu 2025 roku, natomiast aktywność bota ChatGPT-User — będącego bezpośrednim proxy interakcji użytkowników — poszła w przeciwnym kierunku.

Kilka kluczowych liczb z badania:

  • Łączna aktywność crawlerów OpenAI (GPTBot i OAI-SearchBot) wzrosła trzykrotnie od sierpnia 2025 roku.
  • OAI-SearchBot odnotował wzrost o 3,5x — w zbiorze danych Botify oznacza to przyrost o 2,2 miliarda zdarzeń.
  • GPTBot zwiększył aktywność 2,9-krotnie, co odpowiada wzrostowi o 1,8 miliarda zdarzeń.
  • Aktywność ChatGPT-User spadła o 28% w okresie od 1 grudnia 2025 do 14 marca 2026 roku w porównaniu z poprzednim analogicznym okresem.
  • Branże z największym wzrostem aktywności OAI-SearchBot: Healthcare (+740,94%) i Media/Publishing (+701,91%).
  • W ciągu ostatniego miesiąca objętego analizą Google wygenerował 18,2 miliarda zdarzeń crawl, OpenAI — 887 milionów (ok. 4% aktywności Google). Rok wcześniej proporcja wynosiła 1,38%.

Dane sugerują ponadto, że po premierze GPT-5 stosunek aktywności OAI-SearchBot do GPTBot zmienił się z 0,95 na 1,14 — co oznacza, że OpenAI przeszło od relatywnej przewagi crawlowania treningowego do przewagi crawlowania wyszukiwania. Zależność ta różni się jednak istotnie w zależności od branży: serwisy Healthcare i Retail/eCommerce są częściej crawlowane w celach treningowych, natomiast Media/Publishing i Software — w celach wyszukiwawczych.

Analiza Botify i Chrisa Longa: OpenAI Has Tripled Their Crawl of the Web

  • Kto przeprowadził badanie: Botify — platforma enterprise SEO posiadająca jeden z największych zbiorów danych z plików logów na świecie — we współpracy z Chrisem Longiem, konsultantem SEO/AEO i współzałożycielem agencji Nectiv.
  • Próbka badawcza: Ponad 7 miliardów plików logów dotyczących aktywności crawlerów OpenAI, wyodrębnionych z ogólnego zbioru przekraczającego 250 miliardów logów klientów Botify.
  • Metodologia: Analiza plików logów serwera rejestrujących aktywność trzech botów OpenAI: ChatGPT-User, GPTBot i OAI-SearchBot. Dane segmentowano według bota, branży i okresu.
  • Zakres czasowy: Listopad 2024 – marzec 2026, z wyróżnieniem punktu przełomowego w sierpniu 2025 roku (premiera GPT-5).
  • Rynek/region: Dane globalne, obejmujące klientów enterprise Botify z branż: retail/e-commerce, technologia, publishing, podróże, marketplace i inne.

Pełne wyniki analizy wraz z wykresami dostępne są bezpośrednio w oryginalnym artykule, do zapoznania się z którym zachęcam.

Źródło

  1. OpenAI Has Tripled Their Crawl of the Web: An Analysis of 7B+ Log Files

Te artykuły powinny Cię zainteresować

  1. Jak pobrać query fan-out z ChatGPT? Dwa poręczne bookmarklety
  2. Nieobecność w Bingu może szkodzić widoczności w ChatGPT
  3. Nowy domyślny model ChatGPT cytuje 20% mniej źródeł
  4. Szeroka analiza 102k fan-out queries
  5. llms.txt nie przyciąga botów AI. Dane z logów są jednoznaczne

O autorze

Nazywam się Michał Małysa i od wielu lat zajmuję się zawodowo SEO oraz analizą treści, a od 2023 roku w zakres moich obowiązków i zainteresowań dość naturalnie weszło AI. Na stronie MałySEO porządkuję wiedzę o pozycjonowaniu stron internetowych, AI Search oraz działaniu LLM-ów. Prowadzę również MałySEO Newsletter, do którego subskrypcji serdecznie Cię zachęcam na podstronie najlepszego w Polsce newslettera SEO.

Jako że przygotowanie materiałów do MałySEO Newslettera oraz na bloga zajmuje nieco czasu, może zaświtać Ci w głowie dość miły z mojej perspektywy pomysł drobnego rewanżu. Jeżeli uznasz, że lektura tego wpisu była dla Ciebie czymś więcej, niż tylko szybkim odklepaniem randomowej internetowej treści, możesz postawić mi kawkę na buycoffee.to. Z góry dziękuję!

Postaw mi kawę na buycoffee.to

Jeżeli z jakiegoś powodu potrzebujesz się ze mną skontaktować, wyślij mail na adres kontakt[at]michalmalysa.pl