יום שבת, 9 במרץ 2013

איך גוגל מטמיעים שינוי אלגוריתם ?

תרשים של אלגוריתם Pagerank (PR) Wiki image
תרשים של אלגוריתם Pagerank 
גוגל מבצעים יותר מ 500 שינויים במנוע החיפוש במהלך שנה אחת, כל אלגוריתם מורכב ממאות פרמטרים שונים שנבדקים ביחס לסיווג ספציפי של חיפושים או אף לחיפוש ספציפי, המטרה העיקרית של התהליך ליצור תוצאות חיפוש שיהיו הכי רלוונטיות לגולש שמחפש אותם.


מעל 500 שינויים אלגוריתם בשנה - כמה ניסויים נעשים לפני השקת האלגוריתם ?


גוגל מעידים שהשקת אלגוריתם חדש או שיפור אלגוריתם קיים בדרך כלל מתחיל כתוצאה מרעיון, רעיון של מהנדסים או עובדי גוגל שנתקלו בתוצאות חיפוש שהיו מאוד לא רלוונטיות או לא מדויקות ביחס לשאילתא ספציפית. לאחר מכן יוצרים סקיצה רחבה שמכילה את פרמטרים שלדעתם יכולים להשפיע על החיפוש ולשפר אותו, כלומר עם איזה פרמטרים צריך להתעסק, לשנות או לשפר כדי שתוצאות החיפוש לשאילתא הזו תהפוך לרלוונטית יותר.

מדובר בתהליך סיזיפי מאוד. במהלך 2010 נעשו מעל 20,000 ניסויים שונים באלגוריתמים של מנוע החיפוש, חלקם אף הושקו כשינויי אלגוריתם. לכן אתם יכולים לראות שבכל חודש נעשים בין 40-60 שינויי אלגוריתם קטנים יותר ופעם בחודש או פעמיים משיקים שינויי אלגוריתם משמעותי יותר.

מהו תהליך העבודה של השקת אלגוריתם ?


תהליך העבודה של השקת אלגוריתם כולל בתוכו עבודה של צוותים של גוגל, מדרגי איכות חיצוניים, סביבת בדיקה (ארגז חול) ואלגוריתמים קיימים. גוגל פותחים "ארגז חול" או סביבת בדיקה שחלק קטן מהתנועה של המחפשים מופנית ישירות לשם, כלומר בזמן ניסוי ייתכן שחלק מהחיפושים שלכם מופנים לסביבת הבדיקה הזו - במידה ויצא לכם לראות תוצאות הזויות לחלוטין בשבוע אחד ובשבוע השני הכול חזר לקדמותו, ייתכן שהופניתם לסביבת בדיקה של גוגל. כלומר ללא יודעין מחפשים שונים מהווים חלק בלתי נפרד מהניסוי לשינויי אלגוריתם, בעבר גוגל היו מצהירים על סביבות הבדיקה הללו ואף מבקשים מכם להשתמש בהם ולהביע את דעתכם על תוצאות החיפוש.

לאחר שיש סביבת בדיקה, מתחילים להריץ שינויים או שיפורים בפרמטרים שמרכיבים את האלגוריתמים שייתכן שמשפיעים על תוצאת החיפוש הספציפית, כחלק מהתהליך מדרגי האיכות החיצוניים שגוגל שוכרים מקבלים דפי תוצאות אחד מול השני, אחד עם השינויים ואחד בלי השינויים ומדרגי האיכות קובעים על ידי תהליך של סינון איזה עמוד לדעתם הוא עם תוצאות החיפוש הרלוונטיות ביותר.

התהליך הינו תהליך סיזיפי ביותר, בו מטמיעים שינויים מסוימים בודקים את התוצאות, מעבירים את השינוי שוב וכו' וכו', תהליך הטמעת שינוי אחד יכול להיות דרך מספר רב של ניסויים בכל פעם.

גוגל מצהירים מהי מטרת שינוי האלגוריתם - תמיד לאחר השינוי


לאחר השינויים הללו גוגל משחררים רשימה של שינויים שבוצעו באלגוריתמים של מנוע החיפוש, ומציינים מהי מטרת השינוי. תמיד יש לשינוי שם קוד ולאחר מכן שורה או שורה וחצי של "מהי מטרת השינוי" (הרי לכם דוגמא לשינויים כאלו שנעשו בעבר) , אנו לא יכולים לדעת מה בוצע בפועל אלא אם כן נבצע ניסוי משלנו וננתח את השינויים שבוצעו, בעבר הדבר היה קל יותר כי היו הרבה פחות שינויים, כיום לאור העובדה שכל חודש מוטמעים בין 40-60 שינויים באלגוריתמים, המצב נעשה כמעט בלתי אפשרי לבדיקה.

ניתן לבדוק ולבצע ניסויים על פרמטר ספציפי בלבד, או להתרחק מהפרמטרים הספציפיים ולבחון לעומק ניתוח נתונים על פרמטרים רחבים יותר, כמו תוכן איכותי, כמות קישורים, איכות קישורים, מדדי איכות של מותג (Brand signals) ועוד.
במחקר שהעלתי לא מזמן בבלוג הרשמי של החברה לאחר חודשים רבים של ניתוח נתונים והתבססות על מחקרים נוספים, ישנן מסקנות ברורות על הכיוון שאליו גוגל הולכים ועל הפרמטרים המשמעותיים יותר בשנת 2013-2014, הכיוון של גוגל ברור.


אין תגובות:

פרסום תגובה