هوش مصنوعی

August 18, 2024
9:42 یکشنبه، 28ام مردادماه 1403
کد خبر: 172045

یک هوش مصنوعی جدید می‌تواند متون ۱۰ هزار کلمه‌ای تولید کند

یکی از مشکلات عمده‌ای که مدل‌های زبان بزرگ با آن مواجه هستند، طول خروجی متنی است که تولید می‌کنند. مدل‌های زبانی کنونی ادعا می‌کنند که ورودی‌ها را تا ۱۰۰ هزار کلمه پردازش می‌کنند اما برای تولید خروجی‌هایی با طول متوسط ۲۰۰۰ کلمه با مشکلاتی مواجه هستند. اما اکنون به نظر می‌رسد یک مدل هوش مصنوعی جدید این توانایی را ارتقا داده است.

به گزارش ایسنا، برای حل این مشکل، گروهی از محققان هوش مصنوعی در دانشگاه چینهوا(Tsinghua)، یک مدل زبانی بزرگ(LLM) به نام لانگ رایتر(LongWriter) توسعه داده‌اند.

این هوش مصنوعی می‌تواند پاسخ‌های طولانی ایجاد کند

این گروه ادعا می‌کنند که مدل زبان بزرگ آنها می‌تواند خروجی متن تا ۱۰ هزار کلمه تولید کند.

به نقل از آی‌ای، از آنجایی که مدل‌های زبانی بزرگ جریان‌ساز شده‌اند، بسیاری متوجه شده‌اند که آنها نمی‌توانند پاسخ‌های بسیار طولانی مانند کتاب‌های کامل یا نسخه‌های خطی تولید کنند و حد فعلی تولید متن آنها به نظر می‌رسد تقریبا ۲۰۰۰ کلمه باشد.

محققان می‌گویند که احتمالا این به این دلیل است که همه آنها با استفاده از داده‌های کوتاه آموزش دیده‌اند. آنها در تلاش جدید خود دریافتند که اگر مدل‌های زبانی بزرگ را کمی تغییر دهند و با استفاده از اسناد بسیار طولانی‌تر آموزش دهند، می‌توان متون طولانی‌تری تولید کرد.

آزمایش نظریه

محققان برای آزمایش نظریه خود، ابتدا یک مدل ‌زبانی بزرگ را با ۹ میلیارد پارامتر با استفاده از یک مجموعه داده معمولی، که شامل اسنادی بود که عمدتا کمتر از ۲۰۰۰ کلمه بودند، آموزش دادند.

همانطور که انتظار می‌رفت، هنگام پرس و جو، این هوش مصنوعی می‌توانست متن‌هایی با حداکثر ۲۰۰۰ کلمه ایجاد کند.

سپس، محققان یک مدل زبانی بزرگ سنتی را با استفاده از یک کانال ارتباطی به نام AgentWrite اصلاح کردند تا داده‌های آموزشی را به وظایف فرعی تجزیه کنند.

آنها سپس مجموعه داده‌ای را به نام LongWriter-۶k جمع‌آوری کردند که حاوی ۶۰۰۰ سند مکتوب با طول ۲۰۰۰ تا ۳۲ هزار کلمه بود. آنها سپس مدل زبانی بزرگ اصلاح شده را با استفاده از مجموعه داده جدید آموزش دادند و دریافتند که با انجام این کار، طول متنی که این هوش مصنوعی می‌تواند تولید کند به تقریبا ۱۰ هزار کلمه افزایش می‌یابد.

قابلیت استفاده در زمینه‌های مختلف

در بررسی مطالب طولانی جدید تولید شده توسط مدل زبانی بزرگ، محققان آنها را منسجم و قابل استفاده در زمینه‌های مختلف یافتند. آنها همچنین ویدیویی را منتشر کردند که نشان می‌دهد لانگ رایتر یک راهنمای گردشگری ۱۰ هزار کلمه‌ای برای افرادی که به چین سفر می‌کنند تولید می‌کند.

محققان اذعان می‌کنند که اکنون که مشخص شده است که مدل‌ زبانی بزرگ می‌تواند کل مقالات تحقیقاتی، کتاب‌ها، دست‌نوشته‌ها یا شاید حتی فیلم‌نامه‌های فیلم را تولید کند. با درک محدودیت‌ها و به‌کارگیری شیوه‌های استفاده مسئولانه، انسان‌ها می‌توانند از قدرت مدل زبانی بزرگ استفاده کنند و در عین حال خطرات بالقوه را کاهش دهند.

  • مشترک شوید!

    برای عضویت در خبرنامه روزانه ایستنا؛ نشانی پست الکترونیکی خود را در فرم زیر وارد نمایید. پس از آن به صورت خودکار ایمیلی به نشانی شما ارسال میشود، برای تکمیل عضویت خود و تایید صحت نشانی پست الکترونیک وارد شده، می بایست بر روی لینکی که در این ایمیل برایتان ارسال شده کلیک نمایید. پس از آن پیامی مبنی بر تکمیل عضویت شما در خبرنامه روزانه ایستنا نمایش داده میشود.

    با عضویت در خبرنامه پیامکی آژانس خبری فناوری اطلاعات و ارتباطات (ایستنا) به طور روزانه آخرین اخبار، گزارشها و تحلیل های حوزه فناوری اطلاعات و ارتباطات را در هر لحظه و هر کجا از طریق پیام کوتاه دریافت خواهید کرد. برای عضویت در این خبرنامه، مشترکین سیمکارت های همراه اول لازم است عبارت 150 را به شماره 201464 و مشترکین سیمکارت های ایرانسل عبارت ozv ictn را به شماره ۸۲۸۲ ارسال کنند. دریافت موفق هر بسته خبری که محتوی پیامکی با حجم ۵پیامک بوده و ۴ تا ۶ عنوان خبری را شامل میشود، ۳۵۰ ریال برای مشترک هزینه در بردارد که در صورتحساب ارسالی از سوی اپراتور مربوطه محاسبه و از اعتبار موجود در حساب مشترکین سیمکارت های دائمی کسر میشود. بخشی از این درآمد این سرویس از سوی اپراتور میزبان شما به ایستنا پرداخت میشود. مشترکین در هر لحظه براساس دستورالعمل اعلامی در پایان هر بسته خبری قادر خواهند بود اشتراک خود را در این سرویس لغو کنند. هزینه دریافت هر بسته خبری برای مشترکین صرفا ۳۵۰ ریال خواهد بود و این هزینه برای مشترکین در حال استفاده از خدمات رومینگ بین الملل اپراتورهای همراه اول و ایرانسل هم هزینه اضافه ای در بر نخواهد داشت.