دیپسیک به مدال طلای المپیاد ریاضی رسید
استارتآپ چینی دیپسیک اعلام کرده است که مدل جدید ریاضی این شرکت به نام DeepseekMath-V2 موفق شده تا در آزمونهای سطح بالای ریاضی از جمله المپیاد بینالمللی ریاضی (IMO 2025) و المپیاد ریاضی چین (CMO 2024) به سطح مدال طلا دست پیدا کند. این مدل همچنین در آزمون مشهور پاتنام امتیاز خارقالعاده ۱۱۸ از ۱۲۰ را کسب کرده و این در حالی است که بهترین عملکرد انسانی ۹۰ امتیاز گزارش شده است.
به گزارش دیکودر، دیپسیک در مقاله منتشر شده به هیچگونه ابزار ماشین حساب یا استفاده از کد خارجی اشاره نکرده که نشان میدهد این فرایند تنها از طریق زبان طبیعی صورت گرفته است. شرکت توضیح داده که مدلهای هوش مصنوعی گذشته، معمولا بدون اینکه کار و فرایند حل مساله را به درستی انجام دهند، به پاسخ درست میرسیدند.
برای رفع این مشکل، DeepseekMath-V2 از یک فرآیند چندمرحلهای استفاده میکند که شامل دو بخش است. در بخش اول یک راست آزمایی توسط Verifier صورت میگیرد و اثبات اولیه مورد ارزیابی قرار میگیرد. در مرحله دوم اما Meta-verifier نقدهای مرحله قبلی یعنی Verifier را مورد ارزیابی قرار میدهد تا ایرادهای واقعی مشخص شوند.
این ساختار به مدل اجازه میدهد راهحل خود را در زمان اجرا نقد و اصلاح کند، بدون اینکه نیازی به ابزارهای بیرونی مانند ماشینحساب یا محیطهای برنامهنویسی باشد. در این حالت تمامی ارزیابیها و راهحلها در قالب زبان طبیعی انجام میشود.
برای مسائل دشوارتر، مدل با افزایش زمان محاسبه و تولید نسخههای متعدد از اثباتها، بهترین پاسخ را با اطمینان بالا انتخاب میکند. گفتنی است که DeepseekMath-V2 بر پایه معماری Deepseek-V3.2-Exp-Base توسعه یافته است.
رقابت تنگاتنگ با اوپنایآی و گوگل
دیپسیک در حالی طی یک مقاله از موفقیت مدل خود در حوزه ریاضی خبر داده است که بهتازگی گزارشهایی درباره دستاورد مشابه آزمایشگاههای آمریکایی مانند اوپنایآی و گوگل دیپمایند را نیز مشاهده کردهایم؛ مدلهایی که به سطح مدال طلا در المپیاد ریاضی رسیدهاند اما جزئیاتشان محرمانه مانده است.
این عملکردها نشان میدهد که مدلهای زبانی نسل جدید در حال نزدیک شدن به توانایی حل مسائل پیچیده، انتزاعی و چندمرحلهای هستند؛ مهارتهایی که تا همین اواخر «در انحصار انسانها» تلقی میشد.
با این حال گرچه شرکتهای آمریکایی جزئیات معماری و روشهای خود را منتشر نکردهاند، دیپسیک استاندارد متن باز خود برای مدلها را در حوزه تحقیقات نیز پیاده سازی کرده و تصمیم گرفته بخش زیادی از اطلاعات فنی مدل را در دسترس عموم قرار دهد. این حرکت نهتنها به نمایش قدرت فنی این شرکت کمک میکند، بلکه ضربهای مستقیم به اقتصاد مدلهای تجاری در غرب است.
مطابق گزارش اکونومیست، بسیاری از استارتآپهای آمریکایی برای کاهش هزینهها، از مدلهای چینی اوپنسورس استفاده میکنند و این امر فشار رقابتی را بر اوپنایآی و دیگر شرکتهای بزرگ هوش مصنوعی این کشور افزایش داده است.
در نگاه کلی نیز دو اقتصاد برتر جهان یعنی آمریکا و چین اکنون رقابت خود در بخش هوش مصنوعی را به فراتر از مدلهای گسترش دادهاند و نه تنها توسعه دهندگان هوش مصنوعی با یکدیگر در جدال هستند، بلکه بخش مهم دیگر زیرساخت آنها است که حالا ممکن است جنسی متفاوت از یکدیگر پیدا کند. هرچه دیپسیک سریعتر مرزهای توانمندی مدلها را جابهجا کند، بهطور غیرمستقیم به شرکتهای آمریکایی نیز کمک میکند تا ادامه مسیر توسعههای پرشتاب خود را توجیه کنند.
انتشار DeepseekMath-V2 بیانگر این است که شکاف میان شرق و غرب در هوش مصنوعی نهتنها کاهش یافته، بلکه ممکن است چین در برخی حوزهها از جمله ریاضیات پیشرفته، در آستانه پیشی گرفتن از رقبای غربی قرار گیرد.
