Intelligenza Artificiale
Meta AI trasforma prompt in mondi VR esplorabili
Meta AI trasforma i prompt di testo in mondi VR esplorabili, dalla fantascienza alla realtà…aumentata. Un altro giorno, un altro passo avanti nello sviluppo dell’intelligenza artificiale generativa da parte delle grandi aziende tecnologiche. Meta Reality Labs ha annunciato un progetto di ricerca che compie un passo avanti verso la trasformazione della generazione di testo in mondo virtuale in realtà. Scopriamo WorldGen.
Meta AI: un passo verso altri mondi virtuali esplorabili
WorldGen è progettato per generare mondi 3D esplorabili stilisticamente coerenti a partire da un singolo prompt di testo. L’idea è che questi possano essere utilizzati per lo sviluppo VR in motori come Unreal Engine 5 o Unity (vedi la nostra guida ai software per lo sviluppo di videogiochi ), anche se il documento di ricerca rivela che c’è ancora molta strada da fare.
Secondo il documento di ricerca WorldGen , il modello di intelligenza artificiale di Meta può creare scene che si estendono fino a 50 × 50 metri, in cui gli utenti possono camminare ed esplorare. Possono anche essere esportate per l’uso in motori in tempo reale.
La pipeline combina la generazione di layout procedurali, la pianificazione basata su immagini, la ricostruzione 3D basata sulla diffusione, l’estrazione di navmesh, la decomposizione delle scene, il perfezionamento delle mesh e il texturing. WorldGen può anche scomporre le scene in oggetti tramite un processo AutoPartGen accelerato, che ha lo scopo di rendere gli ambienti generati più modificabili e riutilizzabili.
Però ci sono delle limitazioni su WorldGen
Tuttavia, WorldGen presenta attualmente notevoli limitazioni. Può generare una sola vista di riferimento, limitando la scala delle scene che possono essere prodotte.
Non supporta nativamente mondi aperti più ampi, che si estendono per chilometri anziché per metri. Ciò richiederebbe la generazione e l’unione di più regioni locali, il che potrebbe introdurre transizioni non fluide o artefatti visivi ai confini, osserva il documento di ricerca.
La piattaforma non può nemmeno modellare ambienti multistrato, come dungeon a più piani o transizioni tra interno ed esterno. E non può riutilizzare texture o geometrie, il che ne limita l’efficienza e quindi l’usabilità per lo sviluppo.
Le necessità degli sviluppatori di Meta AI
Alcuni sviluppatori hanno sottolineato la necessità di texture condivisibili tra gli oggetti. Meta afferma di stare valutando come aggiungere texture riutilizzabili nelle versioni future per rendere la piattaforma più scalabile.
Altri sviluppatori hanno ipotizzato che il documento dia l’impressione che le generazioni tendano a essere ripetitive, con gli elementi sempre disposti secondo uno schema a griglia.
Modellare Mondi 3D è la vera sfida di sempre
Il principale ostacolo alla creazione di esperienze di computing spaziale immersive, che si tratti di gaming consumer, gemelli digitali industriali o simulazioni di formazione dei dipendenti, è da tempo la natura laboriosa della modellazione 3D. La produzione di un ambiente interattivo richiede in genere team di artisti specializzati che lavorano per settimane.
Secondo un nuovo rapporto tecnico di Meta’s Reality Labs , WorldGen è in grado di generare mondi 3D attraversabili e interattivi a partire da un singolo prompt di testo in circa cinque minuti.
Sebbene la tecnologia sia attualmente di livello di ricerca, l’architettura WorldGen affronta specifici punti critici che hanno impedito all’intelligenza artificiale generativa di essere utile nei flussi di lavoro professionali: interattività funzionale, compatibilità del motore e controllo editoriale.
Finalmente gli ambienti 3D diventano davvero interattivi
Il sistema di WorldGen genera una mesh di navigazione (navmesh), una mesh poligonale semplificata che definisce le superfici percorribili, insieme alla geometria visiva. Questo garantisce che un prompt come “villaggio medievale” produca non solo un insieme di case, ma un layout spazialmente coerente in cui le strade sono libere da ostacoli e gli spazi aperti sono accessibili.
Per le aziende, questa distinzione è fondamentale. Un gemello digitale di un impianto di produzione o una simulazione di formazione sulla sicurezza per ambienti pericolosi richiedono dati fisici e di navigazione validi.
L’approccio di Meta garantisce che l’output sia “pronto per il motore di gioco”, il che significa che gli asset possono essere esportati direttamente su piattaforme standard come Unity o Unreal Engine . Questa compatibilità consente ai team tecnici di integrare flussi di lavoro generativi nelle pipeline esistenti senza la necessità di hardware di rendering specializzato, spesso richiesto da altri metodi, come i campi di radianza.




