BERT: بهروز رسانی جدید گوگل برای فهمیدن زبان آدمیزاد
خبرها حاکی از آن است که باز هم سروکلۀ یک آپدیت جدید در موتور جستجوی گوگل پیدا شده است. نیل پاتل میگوید: «آپدیت برت گوگل، بزرگترین بهروزرسانی گوگل بعد از الگوریتم رنکبرین است.»
خود گوگل هم اعلام کرده که الگوریتم جدید از هر ۱۰ جستجو یکی را تحت تأثیر قرار میدهد؛ پس با این حساب ۱۰ درصد از نتایج نشان داده شده نسبت به قبل تغییر خواهند کرد. اگر این اتفاق بیفتد، حق با نیل پاتل است و ما شاهد یکی از بزرگترین آپدیتهای گوگل در سیستم جستجو خواهیم بود.
در واقع شاید ورود آپدیت برت به جمع الگوریتمهای گوگل آنقدر سروصدا به پا نکرده و خیلی هم حس نشده باشد، اما آنقدر مهم است که قرار است آیندۀ جستجوها را تحت تاثیر خود قرار دهد.
در مقاله امروز نوین همراه ما باشید تا آپدیت Google Bert را بررسی کنیم و ببینیم که کار اصلی آن چیست، چه سایتهایی را تحت تاثیر قرار میدهد و برای کنار آمدن با آن باید چه کار کنیم!
آپدیت BERT چیست؟
هدف موتور جستجوی گوگل همیشه یک چیز بوده و هست: رساندن بهترین نتایج به دست کاربران!
آپدیت گوگل برت نیز برای همین بهوجود آمده است. برت کمک میکند تا سیستم جستجو بتواند بهتر از قبل زبان انسان را درک کند.
شاید بگویید که گوگل قبل از این هم از راههای مختلفی (از جمله جستجوی معنایی (Semantic Search) و الگوریتم رنک برین (Rank Brain)) برای فهمیدن معنا و مفهوم عبارتهای سرچ شده، استفاده میکرد؛
پس Bert قرار است چه کار خاصی انجام دهد؟
در اصل، گوگل با اضافه کردن آپدیت برت میخواهد سر از ریزهکاریهای زبان ما دربیاورد. تمرکز آپدیت برت روی نکات ریز دستوری، جملات و کلماتی که در محاوره بهکار میروند و به خصوص روی عبارتهای طولانی یا Long Tail Keywords است.
مدل BERT میتواند مفهوم کلی یک کلمه را با بررسی کلماتی که قبل و بعد از آن آمدهاند، پیدا کند، حروف اضافه جمله را بررسی کند و هدف کاربر از کل جمله را تشخیص دهد.
قبل از BERT، بعد از BERT
برای اینکه بدانیم این آپدیت چگونه کار میکند وبعد از به وجود آمدنش چه تغییراتی در نتایج سرچ گوگل ایجاد شده، نیاز به چند مثال «قبل از عمل، بعد از عمل» داریم که بهسادگی بفهمیم منظور گوگل از ریزهکاریهای زبانی چیست.
راستی اگر میبینید که مثالها مربوط به سرچ فارسی نیستند، بهخاطر این است که فعلاً این آپدیت برای سایتهای انگلیسی زبان فعال شده است. (و البته به زودی نجات دهنده کاربران در دیگر زبانها هم خواهد شد.)
مثال اول: ریزهکاریهای زبانی
گوگل میگوید هنگامی که کاربران عبارت «۲۰۱۹ brazil traveler to usa need a visa» را جستجو میکردند، موتور جستجو روی کلمات اصلی تمرکز داشت و تلاش میکرد نتایجی را به کاربر نشان دهد که شامل این کلمات یا مترادف آنها باشد. اما نتیجه درست بر عکس چیزی بود کاربر دنبالش میگشت. چرا؟ بهخاطر اینکه در این عبارت علاوه بر کلمات اصلی و معنی آنها، کلمه ربط «TO» و رابطهاش با کلمات دیگر برای درک مفهوم جمله بسیار مهم است.
تا قبل از BERT، گوگل این نکات زبانی و اهمیت این ارتباط را نمیفهمید و نتایجی شامل اطلاعاتی راجع به «سفر آمریکاییها به برزیل» را نشان میداد، در صورتی که کلمه ربط «TO» نشان میدهد که جستجو درباره سفرکنندگان برزیلی به آمریکاست.
حالا با BERT، سیستم جستجو قادر است این تفاوتهای کوچک را درک کند و بداند که کلمات رایجی مثل «TO» از اصول مهم زبان به شما میرود و اگر به آن توجه نکند، ممکن است نتیجه ۱۸۰ درجه با مفهوم اصلی فرق داشته باشد. چیزی که کاربر اصلاً دوست ندارد با آن مواجه شود!
مثال دوم: توجه به معنی تمام جمله
بیایید عبارت جستجو شده بعدی را هم ببینیم. قبلاً وقتی عبارت «do estheticians stand a lot at work» میشد، سیستم جستجو با استفاده از روش شناسایی کلمات کلیدی، کلمه کلیدی «Stand-alone» در نتایج را با کلمه «Stand» در این عبارت تطبیق میداد و نتایجی شامل این کلمه کلیدی را به کاربر پیشنهاد میکرد.
حالا مدل BERT گوگل میتواند بفهمد که بقیه جمله درباره شغل صحبت میکند، پس احتمالاً مفهوم «Stand» در اینجا به معنای تقاضای فیزیکی برای یک شغل است؛ بنابراین محتوای درستتری را به کاربر نشان میدهد.
مثال سوم: فهمیدن جملات محاوره
به این جمله دقت کنید: «Can you get medicine for someone pharmacy»
این یکی، شبیه جستجوهای خودمان است که هرچه به ذهنمان میرسد در یک جمله تایپ میکنیم و انتظار داریم گوگل بیچاره، منظورمان را خیلی سریع حدس بزند. کاربر در اینجا جمله را ناقص نوشته و با یک کلمه Farmacy خواسته بگوید که منظورش از آن شخص کیست.
همانطور که میبینید برت توانسته جمله را با جزئیاتی که فقط یک انسان درک میکند، بفهمد و نتیجه دوم را پیدا کند.
مثال چهارم: BERT در Featured Snippet
گوگل همیشه و همه جا به فکر کاربر است. برای همین کار BERT اینجا تمام نشده و بخش پاسخهای ویژه یا featured snippets هم به دست BERT بررسی میشود.
در ادامه گوگل مثالی هم از اسنیپت آورده تا بگوید ریزبینی برت در تمام قسمتهای محتوا وارد شده و قرار است از این به بعد با وسواس هرچه تمامتر جستجو را به نتیجه برساند.
در این مثال نتیجه قبل و بعد از BERT برای عبارت «Parking on a hill with no curb» به معنی «روی تپه بدون محدودیت پارک کنید» نشان داده شده است. قبلاً این عبارت سیستم جستجوی گوگل را گیج میکرد.
گوگل خودش اعتراف میکند که موتور جستجو بیش از حد بر کلمه «Crub» دقت میکرد و کلمه «no یا بدون» را نادیده میگرفت؛ در حالی که این کلمه برای پاسخگویی مناسب به این سؤال خیلی مهم بود!
همانطور که میبینید گوگل قبلاً نتایج پارک کردن با محدودیت (a crub) را به او نشان میداد که عملاً به درد کاربر نمیخورد.
یک مثال فارسی هم ببینیم
شبیه مثال گوگل، ما هم یک جستجوی فارسی انجام دادیم؛ البته چون این به روزرسانی هنوز به زبان فارسی نرسیدهاست، ما نمیتوانیم تغییر این نتایج را با اعمال BERT ببینیم؛ ولی به هر حال اشکالات آن همچنان واضح است.
همانطور که میبینید در زبان فارسی هم موتور جستجو رابطه کلمه تهران و مشهد را متوجه نمیشود و کلمه «به» بین این دو را درک نمیکند. برای همین در بیشتر نتایج به جای «مشهد به تهران»، اطلاعات «تهران به مشهد» را لیست میکند.
نکته: احتمال این وجود دارد که با گسترش الگوریتم Bert، دیگر بحث نیمفاصله گذاشتن یا نگذاشتن در متنهای فارسی خاتمه پیدا کند و گوگل خودش بتواند نیمفاصله در زبان فارسی را تشخیص دهد و بفهمد!
آیا رنک برین (Rank Brain) هنوز زنده است؟
در اکتبر سال ۲۰۱۵ بود گوگل اولین هوش مصنوعی خود یعنی «رنک برین» را برای فهمیدن مفهوم عبارتهایی که جستجو میشد، معرفی کرد. این الگوریتم دنبال معنی و مفهوم کلماتی که هر روز جستجو میشد میگشت تا بتواند منظور شما را از تک تک واژههای تایپ شده بفهمد (حتی آنهایی که تا آن زمان در محتوای وب قرار نگرفته بود).
بعد از آن با چیزهایی که از سؤال کاربر دستگیرش میشد، محتوای ایندکس شده گوگل را بررسی میکرد و نتیجه را به کاربر نشان میداد. (بهتر است دقیق آن را در مقاله رنک برین بخوانید).
Bert قطعاً جای رنک برین را نگرفته و قرار نیست بگیرد، چون هر کدام وظیفه جداگانهای دارند؛ برت هم مثل همه آپدیتها در سیستم رتبهبندی گوگل قرار گرفته و در کنار رنک برین کار میکند و هدف جفتشان پیدا کردن بهترین نتیجه برای کاربر است.
رنک برین هنوز هم میتواند مفهومهای مرتبط و خوبی برای سرچها پیدا کند، اما هر جا که گوگل احساس کند که یک عبارت با استفاده از BERT میتواند بهتر شود، سریع او را وارد میدان میکند. مثل همان مثال سفر بزریلیها به آمریکا!
در حقیقت برای فهمیدن یک عبارت جستجوشده ممکن است چند روش همزمان استفاده شود که برت هم شاملشان باشد.
BERT و دوستان در خدمت کاربر
اینکه هر چند وقت یکبار گوگل، آپدیت و تکنیک جدیدی برای درک زبان کاربر معرفی میکند، عجیب نیست؛ چون میخواهد به درک عمیقی از قصد کاربر برسد و جستجویی قدرتمندتر بر مبنای زبان طبیعی (زبان محاوره انسانها) داشته باشد.
هدف گوگل در یک کلام قدرت بیشتر موتور جستجو و ارائه نتایج و کامل و دقیق به کاربر است و تا امروز روشهای زیادی را به کار گرفته است. به عنوان مثال:
- اگر شما هنگام تایپ یک کلمه در گوگل، غلط املایی داشته باشید، سیستمهای املایی گوگل میتواند کلمه درست را حدس بزنند و چیزی که لازم داشتید را برایتان پیدا کند.
- اگر جملهای را نصفه تایپ کنید گوگل زحمت حدس زدن بقیه جمله را برایتان میکشد و اگر خوش شانس باشید ادامه جمله شما در حدسیات گوگل وجود خواهد داشت.
- اگر از عبارتی استفاده کنید که نتیجهای برایش نباشد، دست خالی ردتان نمیکند و مترادفها و یا مفاهیم نزدیکی که در محتواهای وب موجود است را به شما نشان خواهد داد.
برت هم یک سیگنال دیگر است که برای فهمیدن جزئیات زبان کاربر استفاده میشود و بسته به چیزی که سرچ میکنید، یک یا ترکیبی از این سیگنالها به کار گرفته میشود تا یک نتیجه مرتبط را برای شما پیدا کند.
چرا طوفان GOOGLE BERT حس نشد؟
با اینکه یک هفته از شروع کار آپدیتی میگذرد که قرار بود بزرگترین تغییر در جستجوی گوگل باشد، ولی گزارشات سایتهای انگلیسی نشان داده که خیلیها ترافیک سایتشان تغییری نکرده است.
باری شوارتز در این رابطه گفته است: بهروزرسانی BERT بیشتر برای فهمیدن زبان طبیعی عبارتهای طولانی یا Long Tail و زبان محاوره استفاده میشود که معمولاً مورد هدف سئو نیستند.
کلمات کلیدی طولانی معمولاً ترافیک کمتری نسبت به عبارتهای کوتاه به سایت میفرستند.
مثلاً فرض کنید که در رقابت سئو، یکی از کلمات هدفتان که از نوع Long Tail هم هست، روزانه ۱۰ ورودی و دیگری روزانه ۱۰۰۰ ورودی از جستجوب گوگل دارد؛ خب بدیهی است که اگر کلمه کلیدی اولی تعداد ورودیهایش کمی بالا و پایین هم شود، خیلی نتایج آن محسوس نخواهد بود!
اما ممکن است از لیست همه نتایجی که شما را به اشتباه نشان کاربر میداد، حذف شوید که در این صورت شاهد تغییرات زیادی در ورودی خود خواهید بود!
آیا میتوان سایت را برای BERT بهینه کرد؟
از همان روزی که گوگل BERT را معرفی کرد، فوج فوج مقاله و اظهار نظر منتشر شد که چگونه برای برت سایت خود را بهینه کنیم؟ چگونه از افت رتبه در امان باشیم؟
همه شدند متخصص زبان طبیعی و دایه عزیزتر از مادر که سایت شما را با عبارتهای طولانی آشتی دهند تا از در امتیازدهی Bert هم رتبه بهتری بگیرید.
اما اینها همه افسانهای بیش نیست.
گوگل با برت خود کاری میکند که زبان آدمیزاد را بفهمد و نتیجه بهتری را نشان دهد. قرار نیست شما چیزی برای برت توضیح دهید یا زبان خود را اصلاح کنید تا برای گوگل بهینه باشد.
خود آقای دنی سالیوان از گوگل میگوید که هیچ راهی وجود ندارد که سایت خود را برای برت بهینه کنید، برای همین به ما پیشنهاد میکند اگر میخواهید در بررسیهای این الگوریتم هم سربلند بیرون بیایید، کار خاصی انجام ندهید؛ فقط سعی کنید با تولید محتوای باکیفیت، پاسخ کاربرانتان را کامل و درست بدهید و دریک کلام، محتوای خود را برای یک انسان بنویسید!
«اگر شما سایتی هستید که بهترین محتوا را برای کاربر مینویسید، یعنی شما در حال حاضر برای برت گوگل بهینه هستید.»چرا برت باید برایتان مهم باشد؟
ما باید حواسمان به این آپدیت باشد، نه فقط برای اینکه که گوگل گفت این «بزرگترین تغییر در جستجوها در پنج سال گذشته و یکی از بزرگترین جهشهای رو به جلو در تاریخ جستجو است»؛ برای اینکه ۱۰ درصد از جستجوها قرار است تحت تاثیر تکنیک جدید گوگل قرار بگیرد.
خلاصه که حواستان به میزان ترافیک سایتتان باشد؛ چون قرار است در آینده شاهد تغییرات زیاد و شاید غیرقابل باوری باشید.
راستی، اگر تغییراتی در آمار سایتتان دیدهاید که فکر میکنید به آپدیت برت گوگل مربوط است، حتماً اطلاعاتی هم در اختیار ما قرار دهید. میدانید که، ما همیشه مشتاق شنیدن تجربیات و حرفهای شما هستیم :)!
نوشته BERT: بهروز رسانی جدید گوگل برای فهمیدن زبان آدمیزاد اولین بار در نوین. پدیدار شد.