هوش مصنوعی

May 21, 2025
14:18 چهارشنبه، 31ام اردیبهشتماه 1404
کد خبر: 193096

رونمایی از هوش مصنوعی ویدئوساز گوگل

منبع: ایسنا

مدل هوش مصنوعی «Veo 3» گوگل می‌تواند ویدئوهایی با صدا تولید کند.

شرکت گوگل به عنوان بخشی از اعلامیه‌های امسال خود در کنفرانس توسعه دهندگان I/O، جدیدترین مدل‌های رسانه‌ای خود را معرفی کرده است که قابل توجه‌ترین آنها شاید «Veo 3» باشد که اولین نسخه از این مدل است که می‌تواند ویدئوهایی با صدا تولید کند.

برای مثال، می‌تواند ویدئویی از پرندگان با صدای آوازشان یا یک خیابان شهری با صدای ترافیک در پس‌زمینه ایجاد کند.

گوگل می‌گوید «Veo 3» همچنین در تجسم فیزیک دنیای واقعی و در همگام سازی لب‌ها عملکرد خوبی دارد.

در حال حاضر، این مدل فقط برای مشترکین Gemini Ultra در ایالات متحده در برنامه جمینای(Gemini) و برای کاربران سازمانی در «Vertex AI» در دسترس است. همچنین در «Flow» (ابزار جدید ساخت فیلم هوش مصنوعی گوگل) نیز در دسترس است.

ابزار «Flow»، مدل Veo، Imagen و Gemini را برای ساختن کلیپ‌ها و صحنه‌های سینمایی گرد هم می‌آورد. کاربران می‌توانند خروجی نهایی را که می‌خواهند به زبان طبیعی توصیف کنند و «Flow» دست به کار خواهد شد تا آن را برای آنها بسازد.

این ابزار جدید در حال حاضر فقط برای مشترکین گوگل AI Pro و Ultra در ایالات متحده در دسترس خواهد بود، اما گوگل می‌گوید که به زودی در کشورهای بیشتری عرضه خواهد شد.

در حالی که این شرکت یک مدل کاملاً جدید تولید کننده ویدئو را منتشر کرده است، اما هنوز «Veo 2» را رها نکرده است. کاربران می‌توانند تصاویری از افراد، صحنه‌ها، سبک‌ها و اشیاء به «Veo 2» بدهند تا به عنوان مرجع برای خروجی مورد نظر خود در «Flow» استفاده کنند. آنها به کنترل‌های دوربین دسترسی خواهند داشت که به آنها اجازه می‌دهد صحنه‌ها را بچرخانند و روی اشیاء خاص برای «Flow» بزرگنمایی کنند.

به‌علاوه، اگر بخواهند می‌توانند فریم‌های خود را از عمودی به افقی تغییر دهند و اشیاء را از ویدئوهای خود اضافه یا حذف کنند.

گوگل همچنین آخرین مدل تولید کننده تصویر خود موسمو به «Imagen 4» را در این مراسم معرفی کرد. این شرکت گفت «Imagen 4» جزئیات ظریفی مانند پیچ و تاب پارچه‌ها و خز حیوانات را با شفافیت قابل توجه نشان می‌دهد و در تولید تصاویر فوتورئالیستی و انتزاعی برتری دارد.

همچنین می‌تواند تصاویری در نسبت‌های مختلف با وضوح تا 2K ایجاد کند.

مدل «Imagen 4» اکنون از طریق برنامه Gemini، Vertex AI و در برنامه‌های Workspace از جمله Docs و Slides در دسترس است.

گوگل همچنین اعلام کرد که به زودی نسخه‌ای از «Imagen 4» را که 10 برابر سریعتر از «Imagen 3» است، منتشر خواهد کرد.

در نهایت، گوگل برای کمک به مردم برای شناسایی محتوای تولید شده توسط هوش مصنوعی که این روزها سخت‌تر از هر زمانی شده است، ابزار «SynthID Detector» را راه‌اندازی کرده است که پورتالی است که در آن کاربران می‌توانند قطعه‌ای از یک محتوای رسانه‌ای را که فکر می‌کنند با هوش مصنوعی تولید شده است، آپلود کنند و گوگل تعیین می‌کند که آیا کار هوش مصنوعی است یا خیر.

  • مشترک شوید!

    برای عضویت در خبرنامه روزانه ایستنا؛ نشانی پست الکترونیکی خود را در فرم زیر وارد نمایید. پس از آن به صورت خودکار ایمیلی به نشانی شما ارسال میشود، برای تکمیل عضویت خود و تایید صحت نشانی پست الکترونیک وارد شده، می بایست بر روی لینکی که در این ایمیل برایتان ارسال شده کلیک نمایید. پس از آن پیامی مبنی بر تکمیل عضویت شما در خبرنامه روزانه ایستنا نمایش داده میشود.

    با عضویت در خبرنامه پیامکی آژانس خبری فناوری اطلاعات و ارتباطات (ایستنا) به طور روزانه آخرین اخبار، گزارشها و تحلیل های حوزه فناوری اطلاعات و ارتباطات را در هر لحظه و هر کجا از طریق پیام کوتاه دریافت خواهید کرد. برای عضویت در این خبرنامه، مشترکین سیمکارت های همراه اول لازم است عبارت 150 را به شماره 201464 و مشترکین سیمکارت های ایرانسل عبارت ozv ictn را به شماره ۸۲۸۲ ارسال کنند. دریافت موفق هر بسته خبری که محتوی پیامکی با حجم ۵پیامک بوده و ۴ تا ۶ عنوان خبری را شامل میشود، ۳۵۰ ریال برای مشترک هزینه در بردارد که در صورتحساب ارسالی از سوی اپراتور مربوطه محاسبه و از اعتبار موجود در حساب مشترکین سیمکارت های دائمی کسر میشود. بخشی از این درآمد این سرویس از سوی اپراتور میزبان شما به ایستنا پرداخت میشود. مشترکین در هر لحظه براساس دستورالعمل اعلامی در پایان هر بسته خبری قادر خواهند بود اشتراک خود را در این سرویس لغو کنند. هزینه دریافت هر بسته خبری برای مشترکین صرفا ۳۵۰ ریال خواهد بود و این هزینه برای مشترکین در حال استفاده از خدمات رومینگ بین الملل اپراتورهای همراه اول و ایرانسل هم هزینه اضافه ای در بر نخواهد داشت.