در پی فعال شدن SafeSearch گوگل در ایران، ویدئوی قدیمی از صحبتهای مدیر شبکه سه در توییتر دستبهدست میشود که میگوید «سرچ گوگل بهطور manual تنظیم میشود.» این ادعا چقدر صحت دارد؟
این روزها، فضای اینترنت ایران با پیادهسازی SafeSearch و جستوجوی امن اجباری در موتور جستوجوی گوگل و بینگ دوباره ملتهب شده است. SafeSearch قابلیتی است که گوگل برای ایجاد محیطی نسبتاً امن در اینترنت برای کودکان در نظر گرفته و فعال کردن آن برعهدهی والدین است تا از کودکان خود دربرابر تهدیدات آنلاین محافظت کنند.
اما در ایران این قابلیت بهطور اجباری و به صورت پیشفرض برای تمام کاربران فعال شده که بهگفتهی عیسی زارعپور، وزیر ارتباطات، نتیجهی خواستهی خانوادهها بوده است. بااینحال، در نظرسنجی زومیت درباره اجباری شدن جستوجوی امن گوگل و بینگ، ۸۷٫۴۷ درصد از ۴۷۶۴ شرکتکننده با اجرای این طرح مخالف بودند.
از آن سو، خبر همکاری ایران و روسیه برای توسعهی گزینههای جایگزین اپلیکیشنهای غربی، رفع فیلتر یاندکس در ایران و قطعی موقت اینترنت ثابت در تهران دست به دست هم داد تا ویدئوی کوتاهی از صحبتهای جنجالی علی فروغی، مدیر شبکه سوم سیما بعد از چهار سال دوباره در توییتر بین کاربران دستبهدست شود.
او در این ویدئو مدعی است که سرچ گوگل manual یا همان بهطور دستی تنظیم میشود و اینطور مثال میآورد که وقتی کاربری دارد عکس برج میلاد را جستوجو میکند، گوگل بنا به دلایلی به او «ده تا چیز مسئلهدار» هم نشان میدهد.
برخی معتقدند این طرز فکر زمینهساز تصمیم دولت به فعال کردن اجباری SafeSearch شده است تا از کاربران دربرابر مواجه شدن با نتایج «مسئلهدار» حفاظت کند. اما آیا این ادعا درست است؟
وقتی برای آشنایی با سازوکار موتور جستوجوی گوگل به سند آن مراجعه میکنیم، همان چند کلمهی ابتدایی جملهی اول پاسخ سؤال ما را مشخص میکند:
Google Search is a fully-automated search engine
گوگل موتور جستوجوی خود را تمام خودکار معرفی میکند و توضیح میدهد که فرایند جستوجو در وبسایتها و اضافه کردن اطلاعات آنها به پایگاه داده توسط برنامهها و باتهایی به نام خزندهی وب (Web Crawler) انجام میشود.
گوگل سازوکار موتور جستوجوی خود را در سه مرحله توضیح میدهد که بهطور کامل توسط الگوریتمها و باتها انجام میشود: خزیدن در اینترنت، ایندکس کردن وبسایتها، نمایش نتایج به کاربر.
خزندههای وب گوگل، باتهای کاملاً خودکاری هستند که تصویر ارتشی از عنکبوتها را در ذهن تداعی میکنند. این باتها طبق برنامهای منظم در سطح اینترنت پخش میشوند و بهجستوجوی وبسایتهای جدید و محتوای بهتازگی منتشرشده میگردند تا آنها را به موتور جستوجوی گوگل اضافه کنند.
دربارهی سازوکار این باتها در مقالهی خزنده وب چیست و چگونه کار میکند؟ بهطور کامل توضیح داده شده؛ اما بهطور کلی، این باتها مبتنی بر الگوریتم هستند که بهطور مرتب بهروزرسانی شده و از سمت مجموعهی عظیمی از کامپیوترهای مستقر در گوگل برای پیدا کردن URLها و محتوای جدید بسیج میشوند.
جمعآوری اطلاعات وبسایتها برعهدهی خزندههای وب گوگل است
بعد از مرحله خزیدن و جمعآوری کاملاً خودکار اطلاعات، نوبت ایندکس کردن فرا میرسد. در این مرحله، برنامههای گوگل با پردازش و آنالیز محتوای متنی و تگهای کلیدی از جمله عنوان و متنهای جایگزینی که برای تصاویر و ویدئوها نوشته شدهاند، سعی میکنند از محتوای وبسایت شما سر دربیاورند؛ مثلاً این برنامهها به گوگل در فهم اینکه زومیت یک وبسایت تکنولوژی است، کمک میکنند تا نتایج مرتبطی را به کاربرانی که دنبال محتوای تکنولوژی هستند، نشان دهد. بههمینخاطر، متخصصان سئو به صاحبان وبسایتها توصیه میکنند در تعیین تگها و متنهای جایگزین تصاویر دقت زیادی به خرج دهند، چراکه گوگل عموماً براساس همین نشانهها مرتبط بودن نتایج جستوجو را تعیین میکند. مثلاً اگر برای تصویری از برج میلاد، متن جایگزین برج آزادی را بنویسید، برنامههای گوگل ممکن است آن را در دستهبندی عکس برج آزادی قرار داده و زمانی که کاربر در جستوجوی تصویری از برج آزادی است، به اشتباه با تصویر برج میلاد روبهرو شود.
تمام اطلاعات جمعآوریشده توسط باتها و آنالیزشده توسط برنامههای دیگر گوگل در گوگل ایندکس ذخیره میشوند که درواقع پایگاه دادهی عظیمی است که در هزاران کامپیوتر میزبانی میشود. البته تمام محتوای منتشرشده در اینترنت به پایگاه دادهی گوگل راه پیدا نمیکنند؛ مثلاً اگر محتوای وبسایت کیفیت پایینی داشته باشد یا خود صاحب وبسایت دسترسی خزندههای وب را بسته باشد، گوگل آنها را در نتایج جستوجو نخواهد آورد.
مرتبط بودن نتایج با عبارت براساس صدها فاکتور تعیین میشود
و درنهایت، زمانی که کاربر عبارتی را در گوگل سرچ میکند، کامپیوترهای گوگل وبسایتهای ایندکسشده در پایگاه دادهی این شرکت را برای پیدا کردن صفحات مرتبط جستوجو میکنند و نتایجی را که بیشترین کیفیت و ارتباط را با درخواست کاربر دارند، نشان میدهند. مرتبط بودن نتایج با عبارت جستوجو شده نیز براساس صدها فاکتور مختلف تعیین میشود؛ از جمله موقعیت مکانی کاربر، زبان استفادهشده برای سرچ و دستگاهی که از آن جستوجو انجام میشود (دسکتاپ یا گوشی). برای مثال، نتایج جستوجوی «تعمیرگاه دوچرخه» در گوگل برای کاربری در پاریس و کاربر دیگری در هنگکنگ متفاوت خواهد بود، چون گوگل با در نظر گرفتن موقعیت مکانی کاربر، تعمیرگاه نزدیک محل زندگی او را نشان میدهد.
درست است که گوگل فرشته نیست و این روزها بهخاطر قدرت و نفوذ بیحدومرزش، زیر ذرهبین لوایح ضدانحصاری آمریکا قرار گرفته است؛ اما دستکاری تعمدی گوگل برای نشان دادن نتایج غیرمرتبط با جستوجوی کاربر نوعی خودکشی شغلی است که موقعیت این غول دنیای فناوری را بهخطر میاندازد. در واقع دلیل اینکه گوگل توانست بهسرعت رقبا را کنار زده و رهبری بازار جستوجوی اینترنتی را بهدست بگیرد، بهخاطر کارآمدی الگوریتمها و تواناییاش در تطبیق خود با خواستههای کاربر است. اگر گوگل قرار بود بهجای نشان دادن آنچیزی که کاربر در جستوجویش است، «ده تا چیز مسئلهدار» را به او نشان دهد، بیشک اکنون محبوبترین و معتبرترین موتور جستوجوی دنیا نبود.