هوش مصنوعی تولید ویدیو تنسنت منتشر شد
به ادعای تنسنت، مدل 13 میلیارد پارامتری Hunyuan Video قدرتمندترین مدل تولید ویدیوی متنباز موجود است.
شرکت تنسنت (Tencent) از هوش مصنوعی تبدیل متن به ویدیوی Hunyuan Video رونمایی کرد که بهصورت متنباز منتشر شده است؛ نکته جالب این است که این هوش مصنوعی درست زمانی منتشر میشود که در کمپین 12 روزه OpenAI هستیم. این شرکت احتمال دارد در این کمپین هوش مصنوعی ویدیوساز Sora را پس از ماهها انتظار برای عموم منتشر کند.
براساس اعلام وبسایت Hunyuan Video، هوش مصنوعی جدید تنسنت مدلی جدید و پیشرفته است که ویدیوهای با کیفیت بالا را از طریق پرامپتهای متنی ایجاد می کند. به ادعای این شرکت، مدل 13 میلیارد پارامتری Hunyuan Video قدرتمندترین مدل تولید ویدیوی متنباز موجود است.
هوش مصنوعی تبدیل متن به ویدیوی تنسنت
تنسنت در اعلامیه رسمی خود میگوید: «ما Hunyuan Video را ارائه میکنیم، مدل متنباز جدیدی که عملکرد آن در تولید ویدیو اگر بهتر از مدلهای متنبسته پیشرو نباشد، با آنها قابلمقایسه است.» مقایسه بنچمارکهای مدل جدید تنسنت با دیگر مدلها را در جدول میبینید:
این شرکت چینی ادعا میکند مدل جدیدش براساس نتایج ارزیابی کارشناسان، از مدلهای پیشرفتهای مانند Runway Gen-3 یا Luma 1.6 بهتر است. البته با این مدل جدید فقط میتوانید ویدیوهای 5 ثانیهای تولید کنید. همچنین تولید هر ویدیو حدوداً 15 دقیقه طول میکشد.
مدل جدید تنسنت از یک انکودر متنی مبتنیبر مدل زبانی چندوجهی (MLLM) استفاده میکند و با نرخ همترازی متن تا 68.5 درصد بهتر از مدلهای پیشرفته قبلی عمل میکند. نرخ همترازی متن میزان وفاداری مدل هوش مصنوعی به پرامپت شما و میزان مطابقت خروجی با آنچه را نوشته بودید، اندازهگیری میکند. همچنین تنسنت میگوید این هوش مصنوعی 96.4 درصد امتیاز کیفیت بصری دارد.
Hunyuan Video بهصورت متنباز در گیتهاب منتشر شده اما اگر بخواهید در سایت اصلی از این مدل استفاده کنید، باید اعتبار بخرید تا بتوانید ویدیو تولید کنید؛ برای هر ویدیو نیز به 15 اعتبار نیاز دارید. هر یک بسته 150 اعتباری 9.99 دلار هزینه دارد. البته در FAL.ai میتوانید این هوش مصنوعی را نیز رایگان امتحان کنید.