വാക്കുകളിലൂടെയോ ചിത്രങ്ങളിലൂടെയോ സംവേദനാത്മകമായ ഒരു ലോകം ഉണ്ടാക്കാം എന്ന പ്രോജക്ട് ജീനി ,സക്കർബർഗ് അവതരിപ്പിച്ച മെറ്റാവേഴ്സ് എന്നതിന്റെ മറ്റൊരു രൂപമാണ്.
Image Credit: Google DeepMind
ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് രംഗത്ത് വിപ്ലവകരമായ മാറ്റങ്ങൾ ലക്ഷ്യമിട്ട് ഗൂഗിൾ പുറത്തിറക്കിയ പരീക്ഷണ പദ്ധതിയാണ് പ്രോജക്ട് ജീനി (Project Genie). വെറും വാക്കുകളിലൂടെയോ ചിത്രങ്ങളിലൂടെയോ പൂർണ്ണമായും സംവേദനാത്മകമായ ഒരു ലോകം (Interactive World) സൃഷ്ടിക്കാൻ സാധിക്കുമെന്നതാണ് ഇതിന്റെ പ്രത്യേകത. ഗൂഗിൾ മേധാവി സുന്ദർ പിച്ചൈ എക്സ് (X) പ്ലാറ്റ്ഫോമിലൂടെയാണ് ഈ വിസ്മയിപ്പിക്കുന്ന സാങ്കേതികവിദ്യ ലോകത്തിന് മുന്നിൽ അവതരിപ്പിച്ചത്. ഒരു ബഹിരാകാശ സഞ്ചാരി ശൂന്യാകാശത്ത് നടക്കുന്നത് (Space walk) ചിത്രീകരിക്കുന്ന വീഡിയോ പങ്കുവെച്ചുകൊണ്ട് താൻ ഈ സംവിധാനം പരീക്ഷിച്ചതായും അദ്ദേഹം വ്യക്തമാക്കി.
ഗൂഗിൾ ഡീപ്മൈൻഡ് (Google DeepMind) വികസിപ്പിച്ചെടുത്ത ജീനി 3 (Genie 3) എന്ന കരുത്തുറ്റ എഐ മോഡലാണ് ഈ പദ്ധതിയുടെ അടിസ്ഥാനം. 2025-ൽ ഒരു പരിമിത ഗവേഷണ പതിപ്പായി (Limited Research Preview) അവതരിപ്പിക്കപ്പെട്ട ജീനി 3, പ്രതീകാത്മക ലോകങ്ങൾ നിർമ്മിക്കുന്നതിൽ (World Generation) അത്ഭുതകരമായ കഴിവ് തെളിയിച്ചിട്ടുണ്ട്. പ്രോജക്ട് ജീനി എന്ന പ്രോട്ടോടൈപ്പ് വെബ് ആപ്പിൽ ജീനി 3 കൂടാതെ ഗൂഗിളിന്റെ എഐ മോഡലുകളായ നാനോ ബനാന പ്രോ+ (Nano Banana Pro+), ജെമിനി (Gemini) എന്നിവയും സംയോജിപ്പിച്ചിരിക്കുന്നു. ഇവയുടെ സംയുക്ത പ്രവർത്തനത്തിലൂടെയാണ് ഉപയോക്താക്കൾക്ക് റിയലിസ്റ്റിക് ആയ ദൃശ്യാനുഭവം ലഭിക്കുന്നത്.
മറ്റ് എഐ ടൂളുകളെ അപേക്ഷിച്ച് കൂടുതൽ ക്രിയാത്മകമായ ഇടപെടലാണ് പ്രോജക്ട് ജീനിയിൽ നടക്കുന്നത്. ഇതിന്റെ പ്രവർത്തനത്തെ പ്രധാനമായും താഴെ പറയുന്ന ഘട്ടങ്ങളായി തിരിക്കാം:
1. വേൾഡ് സ്കെച്ചിങ് (World Sketching): ഉപയോക്താവ് നൽകുന്ന ടെക്സ്റ്റ് പ്രോംറ്റുകളോ (Text Prompts) ലളിതമായ ചിത്രങ്ങളോ വിശകലനം ചെയ്ത് എഐ ഒരു 360 ഡിഗ്രി ഡിജിറ്റൽ ലോകം നിർമ്മിക്കുന്നു. പശ്ചാത്തലങ്ങൾ, വെളിച്ചം, നിഴലുകൾ, കഥാപാത്രങ്ങൾ എന്നിവയെല്ലാം ഇതിൽ ഉൾപ്പെടും.
2. വിർച്വൽ പ്രവേശനം: ഇങ്ങനെ നിർമ്മിക്കപ്പെട്ട ലോകത്തേക്ക് ഉപയോക്താവിന് രണ്ട് രീതികളിൽ പ്രവേശിക്കാം:
ഫസ്റ്റ് പേഴ്സൺ വ്യൂ (First-Person View): നമ്മൾ നേരിട്ട് ആ ലോകത്ത് നിൽക്കുന്നതായും നമ്മുടെ കണ്ണുകളിലൂടെ ചുറ്റുമുള്ള കാഴ്ചകൾ കാണുന്നതായും അനുഭവപ്പെടും.
തേഡ് പേഴ്സൺ വ്യൂ (Third-Person View): ഒരു കഥാപാത്രത്തെ പുറത്തുനിന്ന് നിരീക്ഷിക്കുന്ന അല്ലെങ്കിൽ നിയന്ത്രിക്കുന്ന രീതിയാണിത്.
3. തത്സമയ മാറ്റങ്ങൾ (Real-time Editing): നിർമ്മിക്കപ്പെട്ട പശ്ചാത്തലങ്ങളിൽ ഉപയോക്താവിന്റെ താൽപ്പര്യത്തിനനുസരിച്ച് മാറ്റങ്ങൾ വരുത്താനും പുതിയ വസ്തുക്കൾ കൂട്ടിച്ചേർക്കാനും സാധിക്കും. നിലവിൽ 60 സെക്കൻഡ് ദൈർഘ്യമുള്ള ലോകങ്ങളാണ് ഈ പരീക്ഷണ പതിപ്പിൽ സൃഷ്ടിക്കാനാവുന്നത്.പിച്ചൈ പങ്കുവെച്ച വീഡിയോ തേഡ് പേഴ്സൺ വ്യൂ എന്ന രീതിയിലുള്ളതായിരുന്നു.
മെറ്റാ (Meta) മേധാവി മാർക്ക് സക്കർബർഗ് വലിയ പ്രതീക്ഷയോടെ അവതരിപ്പിക്കുകയും എന്നാൽ ചാറ്റ്ജിപിടിയുടെയും ജനറേറ്റീവ് എഐയുടെയും വരവോടെ പിന്നോട്ട് പോവുകയും ചെയ്ത മെറ്റാവേഴ്സ് (Metaverse) സങ്കൽപ്പത്തിന്റെ ഒരു പുതിയ രൂപമാണ് പ്രോജക്ട് ജീനി. എന്നുവെച്ചാൽ സക്കർബർഗ് ചില കാരണങ്ങളാൽ നിർത്തിവച്ച മെറ്റാവേഴ്സ് എന്ന സാങ്കല്പിക ലോകത്തിൻറെ മറ്റൊരു രൂപമാണ് പ്രോജക്ട് ജീനി. വിആർ ഹെഡ്സെറ്റുകൾ (VR Headsets) വഴി ആളുകൾ സംവദിച്ചിരുന്ന വിർച്വൽ ലോകങ്ങളെ കൂടുതൽ ലളിതമായി വെബ് ആപ്പിലൂടെ ലഭ്യമാക്കുകയാണ് ഗൂഗിൾ ചെയ്യുന്നത്.
മിക്സഡ് റിയാലിറ്റി (Mixed Reality - MR), വിർച്വൽ റിയാലിറ്റി (VR) എന്നീ സാങ്കേതികവിദ്യകൾ ഭാവിയിൽ നമ്മുടെ ജീവിതത്തിന്റെ ഭാഗമാകുമ്പോൾ പ്രോജക്ട് ജീനി അതിൽ നിർണ്ണായക പങ്ക് വഹിക്കും. വിനോദം, വിദ്യാഭ്യാസം, ഗെയിമിംഗ് എന്നീ മേഖലകളിൽ ആർക്കും സ്വന്തമായി ലോകങ്ങൾ സൃഷ്ടിക്കാൻ ഇത് വഴി സാധിക്കും. നിലവിൽ ഇതൊരു ഗവേഷണ പ്രോജക്ട് ആയതിനാൽ, ആളുകൾ ഈ സാങ്കേതികവിദ്യ എങ്ങനെ പ്രയോജനപ്പെടുത്തുന്നു എന്ന് പഠിച്ച ശേഷം മാത്രമേ കൂടുതൽ ഫീച്ചറുകൾ ഗൂഗിൾ ഔദ്യോഗികമായി പുറത്തിറക്കുകയുള്ളൂ.
ലളിതമായി പറഞ്ഞാൽ, ഒരു ചിത്രത്തിൽ നിന്നോ അല്ലെങ്കിൽ നിങ്ങൾ നൽകുന്ന ഒരു വിവരണത്തിൽ (Text Prompt) നിന്നോ ഒരു വീഡിയോ ഗെയിം അല്ലെങ്കിൽ ഇന്ററാക്ടീവ് ലോകം നിമിഷങ്ങൾക്കുള്ളിൽ നിർമ്മിക്കാൻ ഇതിന് സാധിക്കും (Project Genie).പ്രോഗ്രാമിംഗ് അറിയാത്തവർക്കും സ്വന്തമായി ഗെയിമുകൾ നിർമ്മിക്കാൻ ഇത് അവസാനം ഒരുക്കുന്നു. അതേസമയം ഗെയിം ഡെവലപ്പർമാരെ സംബന്ധിച്ചിടത്തോളം ഒരു മെനക്കേടും കൂടാതെ പുതിയ ഗെയിം ഐഡിയകൾ പെട്ടെന്ന് പരീക്ഷിച്ച് നോക്കാൻ (Prototyping) ഇത് സഹായിക്കും. മറ്റൊരു കാര്യം ഇത് ഉപയോഗിക്കുകയോ അല്ലെങ്കിൽ അനുഭവിക്കുകയോ ചെയ്യുന്ന വ്യക്തിയായ നിങ്ങൾ നീങ്ങുന്നതിനനുസരിച്ച് പുതിയ സ്ഥലങ്ങൾ തത്സമയം നിർമ്മിക്കാനുള്ള ശേഷി ഇതിനുണ്ട്.
More read AI : എന്തുകൊണ്ട് സ്ത്രീകൾ കൂടുതൽ ജാഗ്രത പുലർത്തുന്നു? ;പഠനം
