יום שישי, 18 ביוני 2010

גוגל קפאין - ההשקה הרישמית

בדצמבר 2009 עלה לראשונה קפאין לאוויר, אלגוריתם שנועד לשפר את מהירות הסריקה, גמישות הסריקה והמידע הנשמר אודות העמודים, וכמובן שיפור מהירות הדירוגים בכל נושא הזנב הארוך (קשור לMAYDAY אבל אינו תלוי ישירות בעדכון זה).

קפאין בניגוד לשינויים אחרים מהווה שינוי תשתיתי מהשורש, שינוי מהותי בצורה שגוגל מאנדקסים את הדפים על גבי הרשת. שינוי ממשי ומהותי בדרך שהרשת נסרקת ומתאנדקסת. הרצון של גוגל להפוך את הרשת למהירה יותר מביא עימו קשיים שהיה צורך להתגבר עליהן וקפאין עונה בדיוק על צרכים אלו. 

השיפורים המהותיים של קפאין, יאפשרו לגוגל לאנדקס את העמודים בצורה מהירה יותר, כלומר דפים שנסרקו יתאנדקסו מהר יותר וידורגו מהר יותר.  הצורה שבה הרשת הייתה מתאנדקסת לפני ההשקה של קפאין הייתה מסורבלת יותר ואיטית יותר.

העכביש של גוגל היה סורק חלקים נכבדים מהרשת קודם כל, ורק לאחר הסריקה שומר את כל נתונים שאסף למרכז מידע אחד ומתחיל לאנדקס את הנתונים. הדבר היה יוצר אינדקוס של חלק מהמידע בעוד חלק אחר אינו מאונדקס עוד וכמות המידע שגוגל יכולים לשמור על כל עמוד היא מוגבלת לפרמטרים מסוימים, צורת עבודה זו הייתה יוצרת פערים בין מרכזי המידע (במיקומים) מה שידוע בקידום אתרים כ"ריקוד גוגל", ומגבלות מהותיות בעקבות נפח קטן יחסית של מידע הנשמר על כל עמוד.

האלגוריתם החדש של קפאין, מאפשר לגוגל לסרוק עמודים בצורה נפרדת ולאנדקס אותם מיידית תוך שמירת מידע רב יותר על אותו עמוד (שיפור הרלוונטיות). ברגע שגוגל סורקים עמודים, שומרים עליו את המידע הנחוץ ומאנדקסים אותו מיידית במרכזי המידע, האתר יהיה מאונדקס בצורה יעילה יותר ומהירה יותר.

שיפור כמות המידע שגוגל מסוגלים לשמור על כל עמוד לאחר הסריקה משפר את היכולת של גוגל לקבוע מדד לרלוונטיות, וככל שמידע יותר ממוקד ויעיל ישמר בסריקה כך המאמץ שלנו משתלם.  מה שכן נעשה שיפור משמעותי בגמישות המידע שנשמר ובצורה שבה גוגל מעבדים את המידע הזה.

ככלות הכל, נראה שגוגל עושים צעדים משמעותיים להפוך את הרשת למהירה יותר ונקייה יותר, ונעשית עבודה יסודית מאד בכל הנוגע לפיתוח סריקות יעילות יותר ושיפור דירוג העמודים הרלוונטיים ברשת.


ההצהרה הרשמית של מאט קאטס על קפאין :

אין תגובות:

פרסום תגובה