الگوریتم RankBrain
الگوریتم RankBrain
الگوریتم RankBrain > همه چیز درباره الگوریتم رنک برین
گوگل با استفاده از فناوری یادگیری ماشین به نام RankBrain جهت ارائه نتایج جستجوی خود استفاده می کند.
“Danny Sullivan on June 23, 2016 at 1:01 pm”
گوگل از یک سیستم هوش مصنوعی یادگیری ماشینی به نام “RankBrain” برای کمک به مرتب سازی نتایج جستجو استفاده می کند. چگونه این سیستم با سیستم رتبه بندی کلی گوگل سازگاری دارد؟
اطلاعات پوشش داده شده در زیر از سه منبع اصلی تهیه شده و با مرور زمان بروزرسانی شده است:
اولین مورد، داستان Bloomberg است که اخبار مربوط به RankBrain را شکسته است. دوم ، اطلاعاتی که هم اکنون گوگل مستقیماً در اختیار searchengineland قرار داده است. سوم ، دانش ما و بهترین فرضیات در جاهایی که گوگل جوابی ارائه نمی دهد. جدا از اطلاعات کلی در زمینه ، در صورت لزوم استفاده از این منابع ، روشن خواهیم شد.
RankBrain چیست؟
به گزارش بلومبرگ و تایید شده توسط گوگل، RankBrain نامی است که گوگل برای یک سیستم هوش مصنوعی یادگیری ماشین برای
یادگیری ماشین چیست؟
یادگیری ماشین جایی است که یک کامپیوتر به جای اینکه توسط انسان هدایت شود یا برنامه نویسی مفصلی بر روی آن انجام گیرد ، خود می آموزد که چگونه کاری انجام دهد.
هوش مصنوعی چیست؟
هوش مصنوعی ، جایی است که یک کامپیوتر می تواند به اندازه یک انسان هوشمند باشد. به معنای دستیابی به دانش هم از طریق تدریس و هم ایجاد ارتباطات جدید بر اساس دانش خود است.
هوش مصنوعی واقعی فقط در رمان های علمی تخیلی وجود دارد. در عمل ، از AI برای اشاره به سیستم های رایانه ای استفاده می شود که برای یادگیری و برقراری ارتباط طراحی شده اند.
هوش مصنوعی با یادگیری ماشین چه تفاوتی دارد؟ از نظر RankBrain ، به نظر می رسد آنها نسبتاً مترادف هستند. ممکن است شما هر دو مورد را بطور متقابل بشنوید ، یا ممکن است بشنوید که یادگیری ماشین برای توصیف نوع رویکرد هوش مصنوعی مورد استفاده قرار می گیرد.
بنابراین RankBrain راهی جدید است که گوگل نتایج جستجو را رتبه بندی می کند؟
خیر، RankBrain بخشی از الگوریتم جستجوی کلی گوگل است ، یک برنامه رایانه ای است که برای مرتب سازی در میلیارد ها صفحه ای که در مورد آنها می شناسد استفاده می شود و مواردی را که برای نمایش داده های خاص مناسب ترین است ، پیدا می کند.
نام الگوریتم جستجوی Google چیست؟
همانطور که در گذشته گزارش دادیم ، به آن Hummingbird گفته می شود. سالهاست که الگوریتم کلی نام رسمی ندارد. اما در اواسط سال 2013 ، گوگل آن الگوریتم را مجدداً تنظیم کرد و نام آن را Hummingbird گذاشت.
بنابراین RankBrain بخشی از الگوریتم جستجوی Hummingbird است؟
این درکی است که ما داریم که Hummingbird الگوریتم جستجوی کلی است. دقیقاً مانند یک ماشین که کلی موتور درون آن هست. که خود موتور از قطعات مختلفی مانند فیلتر روغن ، پمپ سوخت ، رادیاتور و غیره ساخته شود. به همین ترتیب ، Hummingbird بخش های مختلفی را در بر می گیرد که RankBrain یکی از جدیدترین آنها است.
به طور خاص ، ما می دانیم که RankBrain بخشی از الگوریتم کلی Hummingbird است زیرا مقاله بلومبرگ روشن می کند که RankBrain الگوریتم کلی محسوب نمی شود زیرا همه جستجوها را انجام نمی دهد.
Hummingbird همچنین شامل بخش های دیگری با نام های آشنا برای کسانی که در فضای سئو هستند می باشد: مانند Panda : Penguin و Payday طراحی شده برای مبارزه با اسپم ، Pigeon طراحی شده برای بهبود نتایج محلی ، Top Heavy طراحی شده برای خنثی کردن صفحات با آگهی سنگین ، Mobile Friendly طراحی شده برای صفحات تلفن همراه و Pirate برای مبارزه با نقض حق نسخه برداری طراحی شده اند.
من فکر کردم الگوریتم گوگل “PageRank” خوانده می شود
PageRank بخشی از الگوریتم کلی Hummingbird است که روشی خاص برای اعتبار دادن به صفحات بر اساس پیوندهای سایر صفحات می باشد.
PageRank خاص است زیرا این اولین نامی است که گوگل تاکنون به یکی از قسمت های الگوریتم رتبه بندی خود داده است ، در زمان شروع موتور جستجو ، در سال 1998.
پس این “سیگنال ها” که گوگل برای رتبه بندی از آنها استفاده می کند ، چطور؟
سیگنال ها مواردی هستند که گوگل برای تعیین نحوه رتبه بندی صفحات وب استفاده می کند. به عنوان مثال ، این کلمات را در یک صفحه وب می خواند ، بنابراین کلمات یک سیگنال هستند. اگر برخی از کلمات به صورت پررنگ باشد ، این ممکن است سیگنال دیگری باشد که ذکر شده است. محاسبات مورد استفاده به عنوان بخشی از PageRank ، به صفحه، یک امتیاز PageRank می دهد که به عنوان سیگنال استفاده می شود. اگر یک صفحه سازگار با تلفن همراه باشد ، این سیگنال دیگری است که ثبت شده است.
تمام این سیگنال ها توسط بخش های مختلفی در الگوریتم Hummingbird پردازش می شوند تا بفهمند Google در پاسخ به جستجوهای مختلف ، چه صفحاتی را نشان دهد.
چند سیگنال وجود دارد؟
گوگل نسبتاً مرتباً از داشتن بیش از 200 سیگنال رتبه بندی اصلی صحبت کرده است که ارزیابی می شود که به نوبه خود ، ممکن است تا 10،000 تغییر یا سیگنال فرعی داشته باشد. این به طور معمول فقط صدها عامل را بیان می کند. ( جدول دوره ای عوامل موفقیت سئو را همین حالا دریافت کنید زیرا یک راهنمای خوب برای کمک به رتبه بندی صفحات وب شماست که توسط موتورهای جستجو مانند گوگل استفاده می شود.)
الگوریتم RankBrain سومین سیگنال مهم است؟
درست است. RankBrain سومین عامل مهم برای رتبه بندی صفحات وب از مقاله بلومبرگ می باشد:
RankBrain یکی از “صدها” سیگنال است که وارد یک الگوریتم می شود که تعیین می کند چه نتیجه ای در صفحه جستجوی گوگل ظاهر می شود و در چه رتبه ای قرار گیرد. وی گفت که طی چند ماه استقرار ، RankBrain به سومین سیگنال مهم در نتیجه جستجوی کوئری تبدیل شده است.
سیگنال های اول و دوم مهم چیست؟
وقتی این داستان در ابتدا نوشته شده است ، گوگل به ما نمی گوید. فرض ما این بود:
حدس شخصی من این است که لینک ها مهمترین سیگنال هستند ، روشی که گوگل آن لینک ها را به صورت رای دهی شمارش می کند. این سیستم همچنین قدیمی شده است ، همانطور که در لینک های خودم آورده ام: “صندوق رأی” شکسته شده که از گذشته توسط Google و Bing استفاده شده است.
در مورد دومین سیگنال مهم ، من حدس می زنم که “کلمات” باشند که در جستجوگر تایپ می کنیم که متناسب با آن باید صفحات فرود خوبی ایجاد کرده باشیم.
در مارس 2016 ، گوگل نشان داد که دو عامل اول محتوا و لینک ها بودند. بنابراین سه عوامل مهم در رتبه بندی گوگل وجود دارد.
الگوریتم RankBrain دقیقاً چه کاری انجام می دهد؟
از طریق ارسال ایمیل با گوگل ، من متوجه شدم که RankBrain عمدتاً به عنوان روشی برای تفسیر جستجوهایی که افراد ارائه می دهند می باشد. جهت یافتن صفحاتی است که ممکن است کلمات دقیقی را که جستجو می شود نداشته باشند.
آیا گوگل قبلاً به دنبال راهی برای یافتن صفحات فراتر از جستجوی دقیق نرفته بود؟
بله ، گوگل صفحات فراتر از شرایط دقیق شخصی را که مدت طولانی وارد آن می شود پیدا کرده است. به عنوان مثال ، سالها پیش ، اگر چیزی مانند “shoe” را وارد می کردید ، ممکن است گوگل صفحاتی را که شامل “shoes” می باشد را پیدا نمیکرد زیرا اینها از نظر فنی دو کلمه متفاوت هستند. اما “stemming” به گوگل اجازه داده است که باهوش تر شود ، بفهمد که shoes نوعی shoe است ، درست مانند “running” نوعی “run” است.
گوگل همچنین هوشمندانه های مترادفی را بدست آورد ، به طوری که اگر به جستجوی “sneakers” می پرداختید ، می فهمید که منظور شما “running shoes” نیز هست. حتی برخی از مدل های مفهومی را بدست آوردند تا بدانند که صفحات شرکت فناوری “Apple” در مقابل میوه ” سیب » می باشد.
گراف دانش Knowledge Graph چیست؟
گراف دانش ، که در سال 2012 راه اندازی شد ، راهی بود که گوگل در مورد ارتباطات بین کلمات باهوش تر شد. از همه مهمتر ، توانست متوجه شود که با سرچ یک کلمه چه جوری string یا رشته آن را کامل کند. این بدان معنی است که گوگل می فهمد وقتی شخصی کلمه “Obama” را سرچ می کند ، منظورش رئیس جمهور ایالات متحده ، باراک اوباماست. یک شخص واقعی با ارتباط با افراد دیگر ، مکان ها و چیزهای دیگر.
گراف دانش یک پایگاه داده از حقایق در مورد چیزهای جهان و روابط بین آنها است. به همین دلیل است که می توانید مانند “when was the wife of obama born” را جستجو کنید و در مورد میشل اوباما مانندتصویر زیر ، بدون استفاده از نام او ، پاسخی دریافت کنید:
چگونه الگوریتم RankBrain در بهینه سازی کوئری کمک می کند؟
روشهایی که گوگل در حال حاضر از آن برای تصحیح کوئری استفاده می کند ، به طور کلی به شخصی وابسته است. یا اینکه لیست های حذف یا مترادفی ایجاد کرده تا بین اشیاء پایگاه داده ها ارتباط برقرار کند. یقیناً اتوماسیون وجود دارد. اما تا حد زیادی به کار انسان بستگی دارد.
مشکل این است که گوگل روزانه به سه بیلیون جستجو می پردازد. در سال 2007 ، گوگل اعلام كرد كه 20 تا 25 درصد از این کوئری ها قبلاً دیده نشده بودند. در سال 2013 ، این تعداد را به 15 درصد کاهش داد ، که در مقاله بلومبرگ استفاده شد و گوگل برای ما دوباره تأیید کرد. اما 15 درصد از سه بیلیون هنوز تعداد زیادی کوئری است که هرگز توسط یک جستجوگر انسان وارد نشده است – 450 میلیون در روز.
از جمله این موارد می توان کوئری های پیچیده ، چند کلمه ای ، یا کوئری های “long-tail” را نام برد. RankBrain به منظور کمک به تفسیر هرچه بهتر این کوئری ها و ترجمه موثر آنها ، در پشت صحنه به روشی ، طراحی شده است تا بهترین صفحات را برای جستجوگر پیدا کند.
همانطور که گوگل به ما گفت ، می تواند الگویی بین جستجوهای پیچیده به ظاهر بی ارتباط با هم ببیند تا درک کند که چگونه آنها واقعاً با یکدیگر مشابه هستند. این یادگیری ، به نوبه خود ، این امکان را به شما می دهد تا جستجوهای پیچیده آینده و اینکه آیا آنها مربوط به موضوعات خاص هستند را بهتر بشناسد. از همه مهمتر ، از آنچه گوگل به ما گفته است ، می تواند گروهی را به جستجوگر نشان دهد که از همه بیشتر دوست دارد.
گوگل نمونه هایی از گروه های جستجو را ارائه نکرده است. حتی جزئیاتی از نحوه حدس زدن RankBrain در بهترین صفحات را ارائه نمی دهد. اما مورد اخیر احتمالاً به این دلیل است که اگر بتواند جستجوی مبهم را به چیزی خاص تر تبدیل کند ، می تواند پاسخ های بهتری را به شما برگرداند.
به طور مثال:
در حالی که گوگل گروههای جستجو را ارائه نداده است ، مقاله Bloomberg نمونه ای از جستجو را در اختیار شما قرار می دهد:
What’s the title of the consumer at the highest level of a food chain
عنوان مصرف کننده در بالاترین سطح یک زنجیره غذایی چیست
برای یک شخص غیرمترقبه مانند خودم ، “consumer” به نظر می رسد که به کسی مراجعه کند که چیزی را خریداری کند. با این حال ، این یک اصطلاح علمی برای چیزی است که مواد غذایی را مصرف می کند. در یک زنجیره غذایی نیز میزان مصرف کنندگان وجود دارد. این مصرف کننده در بالاترین سطح قرار دارد؟ این title “شکارچی predator” است.
وارد کردن این کوئری به گوگل پاسخهای خوبی را ارائه می دهد ، حتی اگر خود کوئری بسیار عجیب به نظر برسد:
حال در نظر بگیرید نتایج مشابه برای جستجو مانند “top level of the food chain” ، همانطور که در زیر آمده است:
تصور کنید که RankBrain آن سؤال طولانی و پیچیده اصلی را به این سؤال بسیار کوتاهتر متصل می کند ، که احتمالاً بیشتر انجام می شود. این را می فهمد که بسیار شبیه هم هستند. در نتیجه ، گوگل می تواند از آنچه می داند در مورد دریافت پاسخ برای جستجوی متداول تر کمک کند ، برای بهبود آنچه در مورد غیر معمول ارائه می دهد ، کمک کند.
بگذارید تأکید کنم که من نمی دانم که RankBrain این دو جستجو را به هم وصل می کند. فقط می دانم که گوگل مثال اول را آورد. این به سادگی تصویری از نحوه استفاده از RankBrain من برای اتصال جستجوی غیر معمول به یک جستجوی معمولی به عنوان روشی برای بهبود امور است.
آیا بینگ نیز می تواند این کار را با RankNet انجام دهد؟
در سال 2005 ، مایکروسافت با استفاده از سیستم یادگیری ماشین خود به نام RankNet ، به عنوان بخشی از موتور جستجوی بینگ امروزی خود ، فعالیت خود را آغاز کرد. در حقیقت اخیراً از محقق اصلی و خالق RankNet تقدیر به عمل آمد. اما با گذشت سالها ، مایکروسافت به سختی در مورد RankNet صحبت کرده است.
همچنین جالب است که وقتی همین جستجو را در بینگ قرار دادم ، Bing نیز به من نتایج خوبی داد که در بین آن ها نتایجی که گوگل نیز برگردانده بود را ارائه کرد.
مثال دیگری دارید؟
گوگل یک مثال تازه را به ما داده است: “How many tablespoons in a cup?” گوگل گفت که RankBrain در استرالیا نتایج متفاوتی را در مقابل ایالات متحده برای آن پرس و جو کرده است زیرا اندازه گیری در هر کشور با وجود نامهای مشابه متفاوت است.
من سعی کردم این کار را با جستجو در Google.com در مقابل Google استرالیا تست کنم. من خودم تفاوت زیادی ندیدم. حتی بدون RankBrain ، نتایج فقط به دلیل “قدیمی بودن” برای حمایت از صفحات سایتهای شناخته شده استرالیا برای کسانی که از گوگل استرالیا استفاده می کنند متفاوت است.
آیا الگوریتم RankBrain واقعاً کمک می کند؟
وجود دو مثال بالا گواهی بر بزرگی RankBrain است ، اما من واقعاً معتقدم که احتمالاً تأثیر بزرگی را ایجاد کرده است ، همانطور که گوگل ادعا می کند. این شرکت نسبت به آنچه در الگوریتم رتبه بندی خود قرار دارد ، نسبتاً محافظه کار است. این آزمایشات کوچک را تمام وقت انجام می دهد. اما این فقط تغییرات بزرگی را ایجاد می کند که اعتماد به نفس زیادی داشته باشد.
ادغام RankBrain ، در حدی که ظاهراً سومین سیگنال مهم است ، یک تغییر بزرگ است. فکر نمی کنم گوگل کاری را انجام دهد مگر اینکه واقعاً اعتقاد داشته باشد که کمک می کند.
چه زمانی الگوریتم RankBrain شروع شد؟
گوگل به ما گفت که در اوایل سال 2015 به طور تدریجی RankBrain وجود داشته است و اکنون چند ماه است که کاملاً زنده و جهانی است.
چه کوئری هایی را تحت تاثیر قرار میدهد؟
در اکتبر سال 2015 ، گوگل به بلومبرگ گفت که “کسری بسیار بزرگ” از 15 درصد پرس و جوهایی که معمولاً هرگز آن را نمی بیند توسط RankBrain پردازش شده است. به طور خلاصه ، 15 درصد یا کمتر.
در ژوئن سال 2016 ، خبری منتشر شد مبنی بر این که RankBrain برای هر کوئری که گوگل از آن استفاده می کند ، استفاده می شود. داستان ما را در مورد آن ببینید:
گوگل برای هر جستجو از RankBrain استفاده می کند و بر رتبه بندی تعداد زیادی از آنها تأثیر می گذارد.
آیا الگوریتم RankBrain همیشه در حال یادگیری است؟
Google به ما گفت ، تمام یادگیری هایی که RankBrain انجام می دهد آفلاین است. به آن، دسته ای از جستجوهای سلسله مراتبی داده می شود و یاد می گیرد که پیش بینی هایی از این موارد انجام دهد.
این پیش بینی ها آزمایش شده اند و در صورت اثبات خوب ، آخرین نسخه RankBrain به صورت زنده اجرا می شود. سپس چرخه یادگیری-آفلاین و آزمون تکرار می شود.
آیا الگوریتم RankBrain بیشتر از پالایش کوئری انجام می دهد؟
به طور معمول ، چگونگی تصفیه کوئری ( از طریق حذف ، مترادف یا RankBrain ) یک فاکتور یا سیگنال رتبه بندی در نظر گرفته نشده است.
سیگنال ها به طور معمول عواملی هستند که به محتوا گره خورده اند ، مانند کلمات موجود در یک صفحه ، پیوندهایی که به صفحه می روند ، چه صفحه ای در سرور مطمئن باشد و موارد دیگر. آنها همچنین می توانند با کاربر گره خورده باشند ، مانند مکان جستجوگر یا سابقه جستجو و مرور آنها.
بنابراین وقتی گوگل از RankBrain به عنوان سومین سیگنال مهم صحبت می کند ، آیا واقعاً به عنوان یک سیگنال رتبه بندی محسوب می شود؟ بله گوگل برای ما تأیید کرد که یک مؤلفه وجود دارد که در آن RankBrain مستقیماً به نوعی در رتبه بندی صفحه نقش دارد.
دقیقا چطور؟ آیا نوعی “RankBrain score” وجود دارد که می تواند کیفیت را ارزیابی کند؟ شاید ، اما به نظر می رسد بسیار زیاد محتمل است که RankBrain به نوعی به گوگل در طبقه بندی بهتر صفحات بر اساس محتویات موجود کمک می کند. RankBrain ممکن است بتواند آنچه را که در مورد صفحه است نسبت به سیستم های موجود گوگل انجام دهد.
چگونه می توانم در مورد الگوریتم RankBrain اطلاعات بیشتری کسب کنم؟
گوگل به ما گفت افرادی که می خواهند در مورد کلمه “vectors” بیاموزند – نحوه ارتباط کلمات و عبارات که از طریق منطق ریاضی به هم متصل شده اند – باید این پست وبلاگ را بررسی کنند ، که در مورد این که سیستم چگونه (که در این مقاله نامی از RankBrain نبرده است) مفهموم پایتخت کشورها را فقط با اسکن مقالات جدید یاد میگیرد ، صحبت میکند.
یک مقاله تحقیقاتی طولانی تر وجود دارد که این در اینجا می باشد. شما حتی می توانید با استفاده از ابزار word2vec گوگل با پروژه یادگیری ماشین خود بازی کنید. علاوه بر این ، گوگل مانند مایکروسافت ، دارای مقالات یادگیری هوش مصنوعی و یادگیری ماشین است.
همچنین حتما مقاله ما را ببینید ، چگونه یادگیری ماشینی کار می کند ، همانطور که توسط گوگل توضیح داده شده است.
نویسنده : پریسا احمدی
پاسخ