שלא כמו ארכיטקטורות נפוצות בקרב מערכות ושרתים המיועדים לשלוט בתנועה גדולה, ארכיטקטורת האשכולות של גוגל מבוססת על תוכנה חזקה ומחשבים אישיים רבים. יש האומרים כי מדובר על למעלה מ 15,000 מחשבים אישיים שלוקחים חלק בתופעה הזו שנקראת גוגל. בואו ניצלול לתוך הקרביים של החיפוש בגוגל.
הארכיטקטורה של מערכת גוגל מספקת יציבות ברמת התוכנה על ידי רפליקציות – שיכפולים של שירותים בקרב מכונות חישוב שונות. גוגל גם מאד גאים במערכת הטיפול והניפוי של שגיאות בצורה אוטומטית. המערכת מטפלת באיומים ובתקלות (באגים) תוך כדי עבודה.
כאשר גולש מזין מילה ולוחץ על 'חיפוש', תחילה מתבצעת בדיקת הדומיין – המתחם ממנו הוא מגיע ומוסקות מסקנות גיאוגרפיות אודות המשתמש. עם מידע זה, הוא מופנה לכתובת רשת מסוימת, המותאמת ביותר – כך על פי המערכת – לצרכיו. כדי לספק שירותים לכמויות חיפוש ואיחזור מידע, מפוזרים השירותים השונים של המערכות השונות באשכולות. בכל אשכול כמה אלפי מכונות והפיזור הגיאוגרפי הפיזי של אותן מכונות, מאפשר לגוגל להציג תוכנית התאוששות מאסונות מושלמת (רעידות אדמה, נפילות מתח גדולות וכו').
כאשר דפדפן המשתמש כבר יודע לאן הוא ניגש, הוא מפנה את ה'שאלה' שלו לאשכול הנבחר. מערך חומרה באשכול עצמו מנתב את הבקשה למספר משרתי הרשת של גוגל והם מבצעים את המשימה בעצמם. כל מילה משויכת למסמך קשור (לרוב, זה יהיה יותר אפילו הרבה יותר מאחד) ויש הצלבת הקשרים בין המילים למסמכים שנבחרו ודירוג רלוונטיות. דירוג הרלוונטיות משפיע על סדר התוצאות בדף תוצאות החיפוש של גוגל.
קביעת הרלוונטיות של מסמכי הרשת שנבחרו היא הליבה של המערכת והיא העוסקת בכמויות אדירות של מידע. חלק גדול מהחישוב עצמו, מתבצע עוד לפני שהתבצע תיחקור והוא מופיע בצורה ויזואלית במדד האתרים של גוגל – דירוג דף. כדי להימנע מהשהייה ארוכה, מפוצל האינדקס בחתכים שונים וכך מתקבלת תוצאה מהירה עם אפשרות להמשיך ולקבל תוצאות נוספות.
לאחר עיבוד הבקשה, נוצר הדף שמוחזר למשתמש. הדף מכיל מידע שקיבל משרתים המכילים העתקים של הרשת כולה. לאחר הפקת כותרות ותיאורים מתוכן ותגיות האתרים, מתקבלת רשימת אתרים רלוונטית לתחקור המשתמש.
TheRaveN SEO
No comments:
Post a Comment