مدلهای زبانی بزرگ در درک گفتار انسانی بهسطح قابلقبولی رسیدهاند و بهنظر میرسد اکنون تمرکز این فناوری روی ارتباطات با حیوانات معطوف شده است.
تصور کنید بتوانیم با استفاده از گوشی هوشمند، آنچه را که پرندگان به یکدیگر میگویند رمزگشایی کنیم یا بفهمیم فیلهای آفریقایی به یکدیگر چه میگویند. خبر خوب این است که ظاهراً زمان زیادی تا رسیدن به فناوری تشخیص گفتار حیوانات باقی نمانده و درواقع این موضوع، بخشی از آیندهی فناوری پروژهی گونههای زمین (ESP) است.
ESP سازمانی غیرانتفاعی است که آزا راسکین، مؤسس آزمایشگاه موزیلا و بریت سلویل از اعضای تیم بنیانگذار توییتر آن را تأسیس کردهاند. هدف این سازمان، رمزگشایی ارتباطات غیرانسانی با استفاده از هوش مصنوعی است.
درک افکار درونی حیوانات خانگی میتواند جذاب باشد. البته مزیتهای درک ارتباطات حیوانات بسیار فراتر از گوش دادن به مکالمهی میان سگهای خانگی با سگهای همسایهها است. درواقع قابلیت رمزگشایی ارتباطات حیوانات، پیامدهای مستقیمی روی حفاظت از محیطزیست و سیارهی ما دارد.
رمزگشایی ارتباطات حیوانات میتواند به توسعهی ابزارهایی منجر شود که میتوانند به تحقیقات حفاظت از محیطزیست کمک کنند. دانشمندان قادر خواهند بود با اطلاع از ویژگیهای کشفنشدهی حیوانات، روش ارتباط گونههای خاص، نحوهی شکار، غذا خوردن، ایجاد ارتباط با دیگر حیوانات و روش پردازش اطلاعات دریافتی از محیط اطراف آنها را کشف کنند.
آیا یک گربهی وحشی از ماهیت انسانها اطلاع دارد؟ آیا حافظهی فیل میتواند به انتقال داستانهای زندگی آنها از نسلی به نسل دیگر کمک کند؟
ما میتوانیم ازطریق تکنیکهای یادگیری ماشینی، رمزگشایی دادههای بیوآکوستیک و سپس ترجمهی این اطلاعات به زبان طبیعی انسان، اطلاعات بسیار زیادی از ارتباطات حیوانات بهدست آوریم. این دادهها میتوانند به تلاشهای بشر برای محافظت از محیطزیست و همچنین تحقیقات علمی قابلاطمینان درمورد گونههای مختلف جانوری و ارزیابی جمعیت حیاتوحش کمک کنند. البته دستیابی به این هدف همانقدر که جذاب و نوآورانه بهنظر میرسد، واقعاً سخت است.
بسیاری از تحقیقات مرتبط با رمزگشایی ارتباطات حیوانی، براساس مدلهای زبانی بزرگ انجام میشود که روش کارکرد آنها دقیقاً مشابه مدلهایی است که برای بهبود عملکرد گوگل Bard یا ChatGPT مورد استفاده قرار میگیرند. ابزارهای هوش مصنوعی مولد، تسلط بسیار خوبی در درک زبان دارند؛ زیرا یادگیری ماشینی میتواند زبانهای مختلف، سبکها و زمینههای متفاوت را بهخوبی درک کرده و پاسخهای مناسبی ارائه دهد.
ZDNet مینویسد، مدلهای زبانی بزرگ در طول بسیاری از مراحل آموزش، با حجم بسیار زیادی از دادهها تغذیه میشوند. این مدلها ورودیهای مختلف را برای درک ارتباطات میان کلمهها و معنی آنها یاد میگیرند. اساساً حجم بالای دادههای متنی از منابع مختلف مثل وبسایتها، کتابها، تحقیقات و غیره دردسترس این مدلها قرار میگیرد.
مدلهای زبانی بزرگ در مرحلهی بعد تحتنظر مربیان انسانی قرار میگیرند و با آنها گفتوگو میکنند تا بدینترتیب مفاهیم مختلف را بهتر یاد بگیرند و زمینههای گفتوگو را بهتر درک کنند. این مرحله همچنین باعث میشود مدلهای زبانی بزرگ از احساسات انسانی مطلع شده و روش کارکرد زبان را بهطور دقیق را یاد بگیرند.
اگرچه زبان انسانها در نواحی مختلف جهان با یکدیگر تفاوت دارد اما همهی آنها، ارتباط میان مردم را امکانپذیر میکنند. از آنجا که هوش مصنوعی براساس هوش انسانی توسعه داده شده است، ایجاد مدل برای پردازش زبان طبیعی بشر بسیار آسانتر از ساخت مدلهایی است که ارتباطات میان حیوانات را درک میکنند.
بزرگترین چالشی که ESP برای رمزگشایی ارتباطات حیوانات با آن مواجه شده، نبود دادههای اساسی است. هیچ زبان نوشتاری حیوانی برای آموزش این مدلها وجود ندارد و فرمتهای ارتباطی متفاوت بین گونهها، چالش دیگری ایجاد میکند.
ESP در حال جمعآوری اطلاعات از حیوانات وحشی سرتاسر جهان است. محققان همچنین درحال ضبط ویدیو و صداهای حیوانات هستند. این دادهها اولین گام برای ساخت مدلهای پایهای است که توانایی رمزگشایی گفتار طیف وسیعی از گونههای جانوری را ارائه خواهند داد.
اینترنت اشیاء (IoT) نیز به افزایش حجم دادههای سبکهای ارتباطی مختلف میان حیوانات کمک میکند. تنوع زیاد دوربینهای ارزانقیمت، دستگاههای ضبط صدا و غیره یعنی دانشمندان میتوانند دادهها را از نقاط مختلف جهان جمعآوری و آنها را برای تجزیهوتحلیل آماده کنند.
راسکین یکی از بنیانگذاران ESP میگوید احتمالاً طی ۱۲ تا ۳۶ ماه آینده به فناوری موردنیاز برای ایجاد صداهای مولد و جدید دست خواهیم یافت و در آن زمان میتوان از تکنولوژی مذکور برای رمزگشایی ارتباطات حیوانات استفاده کرد.