Banyak peneliti berpikir bahwa model dunia akan menjadi sangat penting untuk masa depan robotika. Li, pendiri World Labs, telah menulis tentang bagaimana model-model ini bisa memfasilitasi pengembangan robot yang menjelajahi lautan dalam dan membantu penyedia layanan kesehatan, namun untuk saat ini, aplikasinya lebih sederhana. Para pembuat Pokémon Go, misalnya, menggunakan miliaran gambar yang dikumpulkan oleh pemain game tersebut untuk membangun potongan pertama dari model dunia yang, mereka harapkan, bisa membantu memandu robot pengantaran.
Google DeepMind dan World Labs saat ini sedang fokus pada upaya mereka untuk membangun model-model yang dapat menghasilkan lingkungan virtual interaktif 3D dari kombinasi teks, gambar, dan dalam kasus World Labs, petunjuk video. Alat-alat seperti ini bisa digunakan untuk menyederhanakan desain permainan video dan pengalaman VR yang imersif, namun dibandingkan dengan model bahasa yang besar, mereka tampaknya memiliki rentang aplikasi yang terbatas. Terobosan sebenarnya kemungkinan besar akan datang dari mengintegrasikan sistem-sistem seperti ini ke dalam agen cerdas yang fleksibel, yang bisa merepresentasikan lingkungan mereka, meramalkan konsekuensi dari tindakan-tindakan mereka, dan kemudian memutuskan apa yang harus dilakukan.




