محققان موفق شدهاند تا با استفاده از مدل پردازش زبان طبیعی، سیستمی بسازند که توصیف متنی کاربر را به انیمیشن سهبعدی تبدیل میکند.
محققان دانشگاه ملی استرالیا و دانشگاه آکسفورد و آکادمی هوش مصنوعی پکن سیستم هوش مصنوعی جدیدی موسوم به 3D-GPT توسعه دادهاند که بهسادگی میتواند مدلهای سهبعدی را ازطریق توصیفهای متنیِ ارائهشدهی کاربر ایجاد کند.
3D-GPT که در مقالهای علمی توصیف شده است، روش کارآمدتری برای ایجاد مدلهای سهبعدی در مقایسه با مدلسازیهای فعلی ارائه میدهد.
3D-GPT درخواست کاربر را تحلیل و به اقدامات لازم تجزیه میکند
3D-GPT پروژهی مدلسازی سهبعدی را به بخشهای دردسترس تقسیم و سپس عامل مناسب را برای هر وظیفه تعیین میکند. این سیستم از چندین عامل هوش مصنوعی بهره میگیرد که هرکدام روی بخشی از درک توصیف متنی و اجرای فرآیند مدلسازی تمرکز میکنند.
محققان میگویند: «3D-GPT با استفاده از مدل زبان بزرگ (LLM) بهعنوان راهکار اصلی مسئله، توصیف متنی پروژه را در قالب اقداماتی تشریح میکند که باید برای مدلسازی سهبعدی انجام شوند. سپس برای اجرای هر بخش، عامل مناسب آن را در نظر میگیرد.»
قسمتهای سیستم 3D-GPT
عاملهای اصلی عبارتاند از: عامل ارسال وظیفه که دستورهای متنی را تجزیهوتحلیل میکند و عامل مفهومسازی که جزئیاتی را اضافه میکند که در توصیف اولیه ممکن است فراموش شده باشند و عامل مدلسازی که پارامترها را تنظیم و کدی را تولید میکند تا نرمافزارهای سهبعدی مانند Blender را اجرا کند.
با تجزیهی فرایند مدلسازی و اختصاص عاملهای هوش مصنوعی تخصصی، 3D-GPT خواهد توانست درخواست کاربر را تفسیر کند و توصیفات متنی را با اضافهکردن جزئیات لازم بهبود دهد و درنهایت مدل سهبعدی را مطابق نیاز کاربر تولید کند.
سیستم جدید روی این دستور آزمایش شد: «صبح بهاری مهآلود، جایی که گلهای نمناک در مرتع سرسبزی قرار دارند و در اطراف آن درختان در حال شکوفهدادن هستند.» 3D-GPT توانست صحنههای سهبعدی کامل را با گرافیک واقعگرایانهای تولید کند که عناصر توصیفشده در متن را دقیق منعکس میکرد.
مدل سهبعدی ساختهشده با 3D-GPT
اگرچه کیفیت گرافیک هنوز به سطح مطلوبی نرسیده است، نتایج اولیه نشان میدهند که رویکرد مبتنیبر عاملهای هوش مصنوعی، روش کاملاً امیدوارکنندهای برای سادهترکردن تولید محتوای سهبعدی است. ساختار این سیستم بهنحوی است که امکان ارتقای مستقل هر عامل را فراهم میکند.
پژوهشگران میگویند: «تحقیقات تجربی ما تأیید میکند که 3D-GPT نهتنها دستورها را تفسیر و اجرا میکند و نتایج مطمئنی ارائه میدهد؛ بلکه با طراحان انسانی مؤثرتر همکاری میکند.»
3D-GPT بهجای اینکه از ابتدا شروع به ساختن مدلها کند، از نرمافزارهای طراحی سهبعدی موجود کمک میگیرد؛ بههمیندلیل، این سیستم میتواند زیرساخت انعطافپذیری را برای تولید محتواهای 3D باتوجهبه پیشرفت تکنیکهای مدلسازی فراهم میکند.
پژوهشگران نتیجه میگیرند که سیستم آنها قابلیتهای بالقوهی مدلهای زبان طبیعی در مدلسازی سهبعدی را مشخص میکند و چهارچوب اساسی پیشرفتهای آینده در تولید محتوا و انیمیشن خواهد بود.
این تحقیق میتواند صنعت مدلسازی سهبعدی را متحول و دردسترستر کند. همانطورکه بهسمت دوران متاورس پیش میرویم و خلق محتوای سهبعدی بهعنوان عامل اصلی این فضا شناخته میشود، ابزارهایی مانند 3D-GPT میتوانند برای تولیدکنندگان محتوا و تصمیمگیران در زمینههای مختلف، از بازی و واقعیت مجازی تا سینما و تجربههای چندرسانهای، بسیار ارزشمند باشند.
چهارچوب 3D-GPT هنوز در مراحل ابتدایی و محدودی قرار دارد؛ اما توسعهی آن گام مهمی در مدلسازی سهبعدی مبتنیبر هوش مصنوعی است و امکانات جذابی را برای پیشرفتهای آینده بهارمغان میآورد.