عرضه نسل جدید مدلهای زبان کوچک مایکروسافت یک گام جلوتر از گوگل
مایکروسافت مجموعه جدید و بهروز شده از مدلهای زبان کوچک Phi را در پلتفرم Hugging Face منتشر کرد و ادعا میکند که از مدلهای رقیب از جمله متا و گوگل عملکرد بهتری دارد.
غول نرم افزاری جهان در بهروز رسانی پلتفرم Phi 3 که آوریل امسال منتشر شد، از سه مدل Phi 3.5 تحت مجوز باز MIT رونمایی کرد که با نامهای زیر شناخته میشوند: Phi 3.5-MoE، Phi 3.5-mini و Phi 3.5-vision.
به گفته این شرکت، مدل Phi-3.5-MoE در اصل یک مدل سبک است که بر اساس مجموعه اطلاعات مورد استفاده برای دادههای مصنوعی Phi-3 و فیلتر کردن اسناد در دسترس عموم با تمرکز بر دادههای بسیار باکیفیت و منطقی ساخته شده است. این مدل قابلیت پشتیبانی چندزبانه را شامل میشود و با طول زمینه 128K (به صورت توکن) ارایه میشود تا در زمینههای تجاری و تحقیقاتی در چندین زبان مختلف مورد استفاده قرار بگیرد.
در ادامه توضیحات مایکروسافت آمده است: «مدلهای زبان کوچک برای تسریع تحقیقات در مورد زبان و مدلهای چندوجهی، و برای استفاده به عنوان بلوک ساختمانی برای ویژگیهای مولد مبتنی بر هوش مصنوعی طراحی شدهاند».
شرکت مایکروسافت به منظور پشتیبانی از نسل جدید مدلهای زبان کوچک خود از 512 پردازنده گرافیکی H100-80G انویدیا برای آموزش این مدلها در مدت 23 روز روی 4.9 تریلیون توکن به عنوان دادههای آموزشی استفاده کرده است.