Google DeepMind zaprezentował Project Genie – eksperymentalny prototyp pozwalający tworzyć i eksplorować interaktywne wirtualne światy. Narzędzie wykorzystuje model Genie 3 do generowania dynamicznych środowisk w czasie rzeczywistym na podstawie tekstowych poleceń i obrazów. Dostęp do prototypu otrzymują subskrybenci Google AI Ultra w USA (18+).
Jest to krótka charakterystyka przygotowana przez AI i pełni funkcję informacyjną, a nie interpretacyjną. Ludzka praca kończy się tutaj na selekcji newsów, z którymi z tych czy innych powodów warto się moim zdaniem zapoznać. Opis nowinki powinien pomóc w ocenie, czy news jest interesujący i warto dalej go eksplorować (do czego oczywiście zachęcam!).
Jak działa Project Genie
- World Sketching – tworzenie światów poprzez prompty tekstowe oraz generowane lub wczytywane obrazy
- World Exploration – nawigacja po wygenerowanym środowisku z generowaniem ścieżek w czasie rzeczywistym
- World Remixing – modyfikowanie istniejących światów i tworzenie nowych interpretacji
- Integracja z Nano Banana Pro do precyzyjnego podglądu i modyfikacji światów przed eksploracją
- Możliwość definiowania perspektywy (pierwszoosobowa, trzecioosobowa)
- Pobieranie wideo z eksploracji utworzonych światów
- Ograniczenie generacji do 60 sekund
- Dostępność: subskrybenci Google AI Ultra w USA (użytkownicy 18+)
Google DeepMind rozwija modele światów
Genie 3 to uniwersalny model świata symulujący dynamikę środowisk i przewidujący ich ewolucję w oparciu o podejmowane akcje. W przeciwieństwie do statycznych trójwymiarowych migawek, model generuje otoczenie w czasie rzeczywistym podczas poruszania się i interakcji ze światem. System symuluje fizykę i interakcje dla dynamicznych środowisk.
Google DeepMind ma długą historię tworzenia agentów dla konkretnych środowisk (szachy, Go), ale budowanie AGI wymaga systemów nawigujących w różnorodności rzeczywistego świata. Project Genie jest eksperymentalnym prototypem badawczym powstałym na bazie testów z zaufanymi testerami z różnych branż.
Źródła
- Project Genie: Experimenting with infinite, interactive worlds — The Keyword (Google Blog)
Te artykuły powinny Cię zainteresować
- AI Mode z Gemini 3 Flash. Mocniej czekamy jednak na Gemini 3 Pro Image
- ChatGPT upodabnia się do Google’a – tym razem przez Top Stories i wizualne snippety
- Gemini krok po kroku dogania ChatGPT
- Google Maps z dynamiczniejszą integracją z Gemini
- Raport giełdowy Google za Q4 2025 wskazuje na szalone przychody z reklam
O autorze
Nazywam się Michał Małysa i od wielu lat zajmuję się zawodowo SEO oraz analizą treści, a od 2023 roku w zakres moich obowiązków i zainteresowań dość naturalnie weszło AI. Na stronie MałySEO porządkuję wiedzę o pozycjonowaniu stron internetowych, AI Search oraz działaniu LLM-ów. Prowadzę również MałySEO Newsletter, do którego subskrypcji serdecznie Cię zachęcam na podstronie najlepszego w Polsce newslettera SEO.
Jako że przygotowanie materiałów do MałySEO Newslettera oraz na bloga zajmuje nieco czasu, może zaświtać Ci w głowie dość miły z mojej perspektywy pomysł drobnego rewanżu. Jeżeli uznasz, że lektura tego wpisu była dla Ciebie czymś więcej, niż tylko szybkim odklepaniem randomowej internetowej treści, możesz postawić mi kawkę na buycoffee.to. Z góry dziękuję!
Jeżeli z jakiegoś powodu potrzebujesz się ze mną skontaktować, wyślij mail na adres kontakt[at]michalmalysa.pl
