رونمایی از هوش مصنوعی Grok-1.5 Vision ایلان ماسک برای درک تصاویر و اسناد
استارتاپ جدید ایلان ماسک هوش مصنوعی چندحالتهی Grok 1.5V را با توانایی درک تصاویر معرفی کرد.
استارتاپ xAI از هوش مصنوعی جدید Grok 1.5V رونمایی کرد. این شرکت میگوید هوش مصنوعی جدید تواناییهای فراتر از درک متن دارد و میتواند اسناد، نمودارها و عکسها را بفهمد.
هوش مصنوعی جدید xAI در معیارهای کلیدی از رقبای پیشرو، بهتر عمل میکند. Grok 1.5V در مجموعهدادههای RealWorldQA با ارزیابی بیش از ۷۰۰ تصویر واقعی همراه با سؤال، نسبت به رقبایی ازجمله GPT-4V برتری پیدا کرد. این مجموعهداده توانایی هوش مصنوعی را در درک سناریوهای بصری پیچیده، ارزیابی و پیشرفت آن را اندازهگیری میکند.
درک چندحالتهی Grok 1.5V از طریق مثالهایی مانند تبدیل نقاشی کودک به داستان قبل از خواب نشان داده شد. در تستهای انجامشده، Grok 1.5V توانست الگوهای رفتاری را توضیح دهد، جداول را به فرمت CSV تبدیل کند و مشکلات مربوط به تزئینات چوب را تنها براساس تصاویر تشخیص دهد. xAI معتقد است که چنین وظایف متنوعی پتانسیل Grok-1.5V را برای کاربردهای متنوع نشان میدهند.
ایلان ماسک xAI را در جولای ۲۰۲۳ (تیر و مرداد ۱۴۰۲) راهاندازی کرد. ماسک در آن زمان گفت که هدف شرکت جدیدش ساخت هوش مصنوعی شفافتر و پاسخگوتر است تا بتواند بهتر با انسانها کار کند.
یکی از مسائل مهم در مورد هوش مصنوعی، ورود آن به حوزههای مختلف است. برخی میگویند هوش مصنوعی پایانی برای نیروی کار انسانی خواهد بود، برخی دیگر از تواناییهای هنری آن متنفرند و ادعا میکنند که واقعاً هنر نیست و برخی دیگر شکایت دارند که دانشآموزان نباید از آن برای انجام تکالیف استفاده کنند.
در ماههای آینده xAI میخواهد تحقیقات خود را روی چندین حوزهی کلیدی متمرکز کند. هدف این شرکت بهبود قابلیت تجسم و توانایی استدلال چندحالتهی Grok است. دسترسی به نسخهی بتای گراک در ابتدا محدود به کاربران سرویس اشتراکی ایکس پریمیوم خواهد بود.