Google DeepMind zaprezentował Project Genie – eksperymentalny prototyp pozwalający tworzyć i eksplorować interaktywne wirtualne światy. Narzędzie wykorzystuje model Genie 3 do generowania dynamicznych środowisk w czasie rzeczywistym na podstawie tekstowych poleceń i obrazów. Dostęp do prototypu otrzymują subskrybenci Google AI Ultra w USA (18+).

Jest to krótka charakterystyka przygotowana przez AI i pełni funkcję informacyjną, a nie interpretacyjną. Ludzka praca kończy się tutaj na selekcji newsów, z którymi z tych czy innych powodów warto się moim zdaniem zapoznać. Opis nowinki powinien pomóc w ocenie, czy news jest interesujący i warto dalej go eksplorować (do czego oczywiście zachęcam!).

Jak działa Project Genie

  • World Sketching – tworzenie światów poprzez prompty tekstowe oraz generowane lub wczytywane obrazy
  • World Exploration – nawigacja po wygenerowanym środowisku z generowaniem ścieżek w czasie rzeczywistym
  • World Remixing – modyfikowanie istniejących światów i tworzenie nowych interpretacji
  • Integracja z Nano Banana Pro do precyzyjnego podglądu i modyfikacji światów przed eksploracją
  • Możliwość definiowania perspektywy (pierwszoosobowa, trzecioosobowa)
  • Pobieranie wideo z eksploracji utworzonych światów
  • Ograniczenie generacji do 60 sekund
  • Dostępność: subskrybenci Google AI Ultra w USA (użytkownicy 18+)

Google DeepMind rozwija modele światów

Genie 3 to uniwersalny model świata symulujący dynamikę środowisk i przewidujący ich ewolucję w oparciu o podejmowane akcje. W przeciwieństwie do statycznych trójwymiarowych migawek, model generuje otoczenie w czasie rzeczywistym podczas poruszania się i interakcji ze światem. System symuluje fizykę i interakcje dla dynamicznych środowisk.

Google DeepMind ma długą historię tworzenia agentów dla konkretnych środowisk (szachy, Go), ale budowanie AGI wymaga systemów nawigujących w różnorodności rzeczywistego świata. Project Genie jest eksperymentalnym prototypem badawczym powstałym na bazie testów z zaufanymi testerami z różnych branż.

Źródła

Te artykuły powinny Cię zainteresować

  1. AI Mode z Gemini 3 Flash. Mocniej czekamy jednak na Gemini 3 Pro Image
  2. ChatGPT upodabnia się do Google’a – tym razem przez Top Stories i wizualne snippety
  3. Gemini krok po kroku dogania ChatGPT
  4. Google Maps z dynamiczniejszą integracją z Gemini
  5. Raport giełdowy Google za Q4 2025 wskazuje na szalone przychody z reklam

O autorze

Nazywam się Michał Małysa i od wielu lat zajmuję się zawodowo SEO oraz analizą treści, a od 2023 roku w zakres moich obowiązków i zainteresowań dość naturalnie weszło AI. Na stronie MałySEO porządkuję wiedzę o pozycjonowaniu stron internetowych, AI Search oraz działaniu LLM-ów. Prowadzę również MałySEO Newsletter, do którego subskrypcji serdecznie Cię zachęcam na podstronie najlepszego w Polsce newslettera SEO.

Jako że przygotowanie materiałów do MałySEO Newslettera oraz na bloga zajmuje nieco czasu, może zaświtać Ci w głowie dość miły z mojej perspektywy pomysł drobnego rewanżu. Jeżeli uznasz, że lektura tego wpisu była dla Ciebie czymś więcej, niż tylko szybkim odklepaniem randomowej internetowej treści, możesz postawić mi kawkę na buycoffee.to. Z góry dziękuję!

Postaw mi kawę na buycoffee.to

Jeżeli z jakiegoś powodu potrzebujesz się ze mną skontaktować, wyślij mail na adres kontakt[at]michalmalysa.pl