فناوری اطلاعات

December 22, 2022
16:01 پنجشنبه، 1ام دیماه 1401
کد خبر: 141472

OpenAI هوش مصنوعی Point-E را منتشر کرد؛ تبدیل متن به مدل‌های سه‌بعدی

مدل هوش مصنوعی Point-E می‌تواند براساس داده‌های کاربران که شامل متن و تصویر می‌شود، مدل‌های سه‌بعدی (به‌شکل ابر نقاط) تولید کند.
 
استارتاپ هوش مصنوعی OpenAI که ایلان ماسک یکی از بنیان‌گذاران آن است و بیشتر با معرفی مدل DALL-E که متن را به تصویر تبدیل می‌کند، شناخته می‌شود، از انتشار جدیدترین مولد تصویرسازی خود با نام POINT-E خبر داد که می‌تواند براساس پیام‌های متنی کاربران، مدل‌های سه‌بعدی (به‌شکل ابر نقاط) تولید کند. در‌حالی‌که سیستم‌های موجود مانند DreamFusion گوگل برای تولید تصاویر خود معمولاً به چندین ساعت زمان و GPU نیاز دارند، Point-E کار خود را تنها با یک GPU و فقط در یک یا دو دقیقه انجام می‌دهد.
 
مدل‌سازی سه‌بعدی در صنایع و برنامه‌های مختلفی مورد استفاده قرار می‌گیرد. جلوه‌های CGI فیلم‌های پرفروش مدرن، بازی‌های ویدیویی، VR و AR، مأموریت‌های نقشه‌برداری دهانه ماه ناسا و همچنین دیدگاه متا برای متاورس، همگی به قابلیت‌های مدل‌سازی سه‌بعدی وابسته هستند.
 
با‌این‌حال، حتی با وجود تلاش انویدیا برای خودکارسازی تولید اشیا و برنامه موبایل RealityCapture اپیک گیمز که به کاربران اجازه می‌دهد با گوشی iOS خود، اشیا دنیای واقعی را به‌عنوان تصاویر سه‌بعدی اسکن کنند، ایجاد تصاویر سه‌بعدی فوتورئالیستی همچنان یک فرایند زمان‌بر است.
 
نحوه کار مدل هوش مصنوعی Point-E
 
سیستم‌های هوش مصنوعی تبدیل متن به تصویر مانند DALL-E 2 و Craiyon از OpenAI در سال‌های اخیر به‌سرعت محبوبیت زیادی پیدا کرده‌اند. تبدیل متن به مدل‌های سه‌بعدی نیز شاخه‌ای از این تحقیق محسوب می‌شود. POINT-E برخلاف سیستم‌های مشابه که از مجموعه بزرگی از گره‌ها (متن، تصویر) استفاده می‌کنند و به آن‌ها اجازه می‌دهد تا دستورات متنوع و پیچیده‌ای را دنبال کنند، روی مجموعه داده کوچک‌تری از گره‌ها (تصویر سه‌بعدی) آموزش داده شده است.
 
تیم OpenAI توضیح می‌دهد که برای تولید یک شیء سه‌بعدی از یک متن، ابتدا یک تصویر با استفاده از مدل متن به تصویر نمونه‌برداری‌‌شده و سپس یک شیء سه‌بعدی براساس تصویر نمونه‌برداری‌شده تهیه می‌شود. هر دو این مراحل را می‌توان در چند ثانیه انجام داد و به روش‌های بهینه‌سازی گران‌قیمت نیاز ندارد.
 
به عنوان مثال، اگر به این سیستم یک پیام متنی مانند «گربه‌ای که بوریتو می‌خورد» را ارائه کنید، Point-E ابتدا یک نمای مصنوعی رندر سه‌بعدی از گربه در‌حال بوریتو خوردن ایجاد می‌کند. سپس تصویر تولید‌شده را از طریق یک سری مدل‌های انتشار اجرا می‌کند تا ابر نقطه سه‌بعدی و RGB تصویر اولیه را ایجاد کند. در این پروسه، ابتدا یک مدل ابری درشت 1024 نقطه‌ای و سپس یک مدل 4096 نقطه‌ای ظریف‌تر به کاربران ارائه خواهد شد.
 
اگر دوست دارید تا این مدل هوش مصنوعی را امتحان کنید، OpenAI کد منبع باز پروژه خود را در Github منتشر کرده است.
  • مشترک شوید!

    برای عضویت در خبرنامه روزانه ایستنا؛ نشانی پست الکترونیکی خود را در فرم زیر وارد نمایید. پس از آن به صورت خودکار ایمیلی به نشانی شما ارسال میشود، برای تکمیل عضویت خود و تایید صحت نشانی پست الکترونیک وارد شده، می بایست بر روی لینکی که در این ایمیل برایتان ارسال شده کلیک نمایید. پس از آن پیامی مبنی بر تکمیل عضویت شما در خبرنامه روزانه ایستنا نمایش داده میشود.

    با عضویت در خبرنامه پیامکی آژانس خبری فناوری اطلاعات و ارتباطات (ایستنا) به طور روزانه آخرین اخبار، گزارشها و تحلیل های حوزه فناوری اطلاعات و ارتباطات را در هر لحظه و هر کجا از طریق پیام کوتاه دریافت خواهید کرد. برای عضویت در این خبرنامه، مشترکین سیمکارت های همراه اول لازم است عبارت 150 را به شماره 201464 و مشترکین سیمکارت های ایرانسل عبارت ozv ictn را به شماره ۸۲۸۲ ارسال کنند. دریافت موفق هر بسته خبری که محتوی پیامکی با حجم ۵پیامک بوده و ۴ تا ۶ عنوان خبری را شامل میشود، ۳۵۰ ریال برای مشترک هزینه در بردارد که در صورتحساب ارسالی از سوی اپراتور مربوطه محاسبه و از اعتبار موجود در حساب مشترکین سیمکارت های دائمی کسر میشود. بخشی از این درآمد این سرویس از سوی اپراتور میزبان شما به ایستنا پرداخت میشود. مشترکین در هر لحظه براساس دستورالعمل اعلامی در پایان هر بسته خبری قادر خواهند بود اشتراک خود را در این سرویس لغو کنند. هزینه دریافت هر بسته خبری برای مشترکین صرفا ۳۵۰ ریال خواهد بود و این هزینه برای مشترکین در حال استفاده از خدمات رومینگ بین الملل اپراتورهای همراه اول و ایرانسل هم هزینه اضافه ای در بر نخواهد داشت.