Dan Petrovic opisuje odkrycie, które mogło potwierdzić wykorzystanie danych Schema przez Google w procesie groundingu AI Overviews. Podczas analizy źródeł cytowanych przez Gemini zauważył fragment tekstu, który nie występował w widocznej treści strony Salesforce, ale znajdował się w kodzie FAQ Schema. Update po komentarzu polskiego eksperta SEO pokazuje jednak, że temat wciąż wymaga testów.
Fragment z AI Overviews znaleziony w FAQ Schema
Autor analizował odpowiedź Gemini na pytanie „How can AI be used to improve SEO?”, która wykorzystała pięć źródeł jako podstawę do generowania odpowiedzi. Każda ze stron została podzielona na mniejsze fragmenty (chunks), które następnie oceniono pod kątem dopasowania do zapytania przy użyciu cross-encodera.
Dan Petrovic zwrócił uwagę na jedno zdanie w odpowiedzi AI: „AI enhances SEO by automating keyword research, optimizing content creation, predicting search trends, analyzing competitor strategies, and personalizing user experiences to boost rankings.” Fragment pochodził z domeny Salesforce i był widoczny w snippecie generowanym przez Gemini.
Gdy autor kliknął „read more”, by znaleźć ten tekst na stronie docelowej, okazało się, że zdanie nie występuje w widocznej treści HTML. Dopiero przeszukanie kodu źródłowego strony ujawniło, że identyczny fragment znajduje się w strukturze FAQ Schema (LD+JSON) jako odpowiedź na pytanie „How does AI enhance SEO strategies?”.
Wątpliwości po komentarzu eksperta
Jak zauważa Petrovic, gdyby potwierdziło się, że Google czerpie dane bezpośrednio ze strukturalnych danych Schema, byłby to pierwszy konkretny dowód na wykorzystanie LD+JSON w pipeline RAG dla AI Overviews. Mogłoby to wpłynąć na podejście do implementacji danych strukturalnych w kontekście widoczności w systemach AI – wciąż nie wiemy bowiem, na ile rady dotyczące używania różnych form schemy faktycznie są w kontekście AI Search istotne, a na ile stanowią chłopskorozumową rozkminę bez pokrycia w rzeczywistości.
Autor aktualizuje jednak swoje wnioski po komentarzu polskiego eksperta SEO Łukasza Rogali, który wskazuje alternatywne wyjaśnienie. Fragment mógł pochodzić z ukrytego elementu HTML (takiego jak accordion czy rozwijana sekcja FAQ), niekoniecznie bezpośrednio ze Schema. Problem polega na tym, że gdy ten sam tekst występuje zarówno w LD+JSON, jak i w ukrytym HTML, nie da się jednoznacznie określić, z którego źródła korzysta Gemini.
Więcej w oryginalnym artykule
Pełny artykuł z bloga australijskiej agencji Dejan zawiera szczegółową analizę wszystkich pięciu źródeł wykorzystanych przez Gemini, wraz ze screenshotami pokazującymi proces scoringu chunks i fragmenty kodu źródłowego. Autor przedstawia również tabelę z liczbą chunków dla każdej z analizowanych stron oraz wizualizacje pokazujące, które fragmenty otrzymały najwyższe wyniki dopasowania do zapytania.
W materiale znajdziesz link do narzędzia, którego Dan Petrovic użył do scoringu fragmentów treści (Snippets Tool), oraz pełny kod FAQ Schema ze strony Salesforce. Artykuł zawiera też komentarz Łukasza Rogali z propozycją testu oraz tabelę porównującą trzy hipotezy (Gemini czyta LD+JSON / czyta ukryty DOM / czyta oba źródła) z opisem dowodów potrzebnych do potwierdzenia każdej z nich. Warto przeczytać oryginał, żeby zobaczyć pełną metodologię, screenshoty z procesu analizy i samodzielnie ocenić, czy odkrycie jest przekonujące.
Źródło
Te artykuły powinny Cię zainteresować
- 3/4 najlepszych produktów wg ChataGPT znajduje się w karuzeli Google Shopping
- AI są bardzo niespójne w rekomendowaniu marek i produktów
- Badanie 2,5 mln linków wewnętrznych pokazuje, że seowcy potrafią linkować
- Badanie korelacji cech contentu z widocznością w AI Search
- Topical Authority istotne także w kontekście AI Overview. Na to wskazują wnioski z analizy fan-out queries
O autorze
Nazywam się Michał Małysa i od wielu lat zajmuję się zawodowo SEO oraz analizą treści, a od 2023 roku w zakres moich obowiązków i zainteresowań dość naturalnie weszło AI. Na stronie MałySEO porządkuję wiedzę o pozycjonowaniu stron internetowych, AI Search oraz działaniu LLM-ów. Prowadzę również MałySEO Newsletter, do którego subskrypcji serdecznie Cię zachęcam na podstronie najlepszego w Polsce newslettera SEO.
Jako że przygotowanie materiałów do MałySEO Newslettera oraz na bloga zajmuje nieco czasu, może zaświtać Ci w głowie dość miły z mojej perspektywy pomysł drobnego rewanżu. Jeżeli uznasz, że lektura tego wpisu była dla Ciebie czymś więcej, niż tylko szybkim odklepaniem randomowej internetowej treści, możesz postawić mi kawkę na buycoffee.to. Z góry dziękuję!
Jeżeli z jakiegoś powodu potrzebujesz się ze mną skontaktować, wyślij mail na adres kontakt[at]michalmalysa.pl
