فناوری اطلاعات

June 25, 2023

9:53 یکشنبه، 4ام تیرماه 1402

کد خبر: 146596

مدل هوش مصنوعی Stable Diffusion به‌روز شد؛ تولید تصاویر واقع‌گرایانه‌تر با مشکلات کمتر

شرکت Stability AI از عرضه نسخه v0.9 مدل هوش مصنوعی Stable Diffusion خبر داده است که می‌تواند عرصه را بر میدجرنی تنگ‌تر کند.

استارتاپ Stability AI از جدیدترین نسخه مدل هوش مصنوعی خلق تصویر Stable Diffusion به نام SDXL v0.9 رونمایی کرد. این نسخه قادر است تصاویر فوق‌العاده واقع‌گرایانه‌تری بسازد و مشکلاتی مثل تصویرسازی‌های عجیب و غریب از دست‌ها را نداشته باشد.

به گزارش Decrypt، نسخه جدید مدل هوش مصنوعی Stable Diffusion عملکرد بسیار بهتری نسبت به نسخه‌های قبلی دارد و تنها با دریافت چند کلمه می‌تواند تصاویر خارق‌العاده‌ای بسازد. این نسخه به‌گونه‌ای طراحی شده است که بخش عمده کارها را خودش به‌جای شما انجام دهد و حتی در هنگام حرف‌زدن با هوش مصنوعی بتوانید با زبانی طبیعی‌تر با آن حرف بزنید.

Stability AI می‌گوید SDXL 0.9 قادر است جزئیات تصاویر را افزایش دهد و کاربردهای تولید تصاویر با کمک هوش مصنوعی را بیشتر کند. این شرکت می‌گوید نسخه 0.9 در مقایسه با نسخه بتا که پیش‌تر در ماه آوریل منتشر شده بود، عملکرد بسیار بهتری در تبدیل متن به تصویر دارد.

برای مشاهده این پیشرفت می‌توانید تصاویر حاصل از یک ورودی مشترک را در این دو نسخه مقایسه کنید. برای مثال، نسخه جدید برای توصیف «گرگی در پارک ملی یوسمیتی با تم فیلم‌برداری مستندهای طبیعت» تصویری واقع‌گرایانه‌تر را به‌وجود آورده است که نسبت به نسخه پیشین جزئیات بسیار بیشتری دارد.

تعداد پارامترهای Stable Diffusion بسیار بیشتر شده است

بخشی از دلیل این پیشرفت محسوس به افزایش قابل‌توجه شمار پارامترهای SDXL 0.9 مربوط می‌شود. حالا 3.5 میلیارد پارامتر پایه به مدل جدید Stability AI اجازه می‌دهند یادگیری عمیق‌تری داشته باشد و مطابق با یادگیری‌های خود تصاویر بهتری تولید کند.

نسخه 0.9 همچنین گرایش بیشتری به‌سمت ورودی‌های ساده پیدا کرده است و می‌تواند مبتنی بر آن‌ها نتایج بهتری تولید کند. برای مثال، اگر توصیف «دو دست که به‌سمت هم اشاره می‌کنند» را به هوش مصنوعی بدهید، می‌توانید تصویری بسیار واقع‌گرایانه از این مدل دریافت کنید. پیشرفت این نسخه در مقایسه با نسخه‌های قبلی کاملاً مشهود است.

نسخه جدید Stable Diffusion که اولین‌بار در ماه اوت 2022 به شهرت رسید و یکی از مدل‌های متن‌باز تولید تصاویر محسوب می‌شود، حالا با این آپدیت می‌تواند رقیب جدی‌تری برای Dall-E و Midjourney باشد. این مدل همین حالا هم محبوب‌ترین هوش مصنوعی متن‌باز تولید تصاویر محسوب می‌شود.

جدیدترین نسخه Stable Diffusion از طریق ابزار تولید و ویرایش تصاویر شرکت Init ML عرضه می‌شود. این مدل فعلاً نمی‌تواند به‌صورت محلی مورد استفاده قرار بگیرد یا آموزش داده شود، اما زمانی که عرضه عمومی آن آغاز گردد، برای اجرا به حداقل 16 گیگابایت رم و کارت گرافیکی با 8 گیگابایت VRAM نیاز خواهد داشت. تاریخ عرضه عمومی این نسخه احتمالاً اواسط ماه ژوئیه خواهد بود.

+ /
نویسنده: ملکی /
چاپ /
صفحه اصلی

در این زمینه از آرشیو ایستنا:

مشترک شوید!

برای عضویت در خبرنامه روزانه ایستنا؛ نشانی پست الکترونیکی خود را در فرم زیر وارد نمایید. پس از آن به صورت خودکار ایمیلی به نشانی شما ارسال میشود، برای تکمیل عضویت خود و تایید صحت نشانی پست الکترونیک وارد شده، می بایست بر روی لینکی که در این ایمیل برایتان ارسال شده کلیک نمایید. پس از آن پیامی مبنی بر تکمیل عضویت شما در خبرنامه روزانه ایستنا نمایش داده میشود.

با عضویت در خبرنامه پیامکی آژانس خبری فناوری اطلاعات و ارتباطات (ایستنا) به طور روزانه آخرین اخبار، گزارشها و تحلیل های حوزه فناوری اطلاعات و ارتباطات را در هر لحظه و هر کجا از طریق پیام کوتاه دریافت خواهید کرد. برای عضویت در این خبرنامه، مشترکین سیمکارت های همراه اول لازم است عبارت 150 را به شماره 201464 و مشترکین سیمکارت های ایرانسل عبارت ozv ictn را به شماره ۸۲۸۲ ارسال کنند. دریافت موفق هر بسته خبری که محتوی پیامکی با حجم ۵پیامک بوده و ۴ تا ۶ عنوان خبری را شامل میشود، ۳۵۰ ریال برای مشترک هزینه در بردارد که در صورتحساب ارسالی از سوی اپراتور مربوطه محاسبه و از اعتبار موجود در حساب مشترکین سیمکارت های دائمی کسر میشود. بخشی از این درآمد این سرویس از سوی اپراتور میزبان شما به ایستنا پرداخت میشود. مشترکین در هر لحظه براساس دستورالعمل اعلامی در پایان هر بسته خبری قادر خواهند بود اشتراک خود را در این سرویس لغو کنند. هزینه دریافت هر بسته خبری برای مشترکین صرفا ۳۵۰ ریال خواهد بود و این هزینه برای مشترکین در حال استفاده از خدمات رومینگ بین الملل اپراتورهای همراه اول و ایرانسل هم هزینه اضافه ای در بر نخواهد داشت.