פתרונות חיפוש לעסקים - Google
ובכן , החברה האהובה עליי Google - עושה את זה שוב. [ האזכורים הראשונים למערכת זו הראו לי לפני כשנה וחצי או שנתיים ... אבל לא זכור לי שפורסם באתר של גוגל באופן רשמי ] , אבל אם תיכנסו ל
לינק הזה תוכלו לראות את אחד הפיתוחים היותר מעניינים של גוגל לעולם הLarge Scale Enterprise ולעולם מנועי חיפוש הנתונים וfריית הנתונים העסקיים.
למעשה מה שעשו גוגל ( אגב , Yahoo + IBM וחברות אחרות מפתחים פתרונות מקבילים , וכמו כן יש פתרונות מבית Microsoft אשר זו מטרתם גם כן וכמובן מנוע X1 המושלם מכל בחינה , אבל אני איש של גוגל ... מה לעשות ) הוא לקחת את המנוע האדיר שהם פיתחו , וליצור מערכות INDEXING למידע ארגוני , אשר כל משתמש יכול לרכוש ולנטוע מערכת חיפוש מתקדמת ביותר , בארגון שלו , באתר שלו , או עבור לקוחות שלו. והיתרונות בולטים , מכונת הGOOGLE MINI יכולה ברישוי הכי זול שלה ( 1995$ ) לחפש ולבצע INDEXING למעל 50,000 מסמכים - כלומר זהו פתרון זול וסביר לכל ארגון אשר מעוניין במנגנון לניתוב , סינון פילטור ויצירת מאגר נתונים על סמך מסמכים. והפתרון האולטימטיבי לשילוב בתוך אתר אינטרנט או אינטראנט ארגוני.
החלק שקשור פה לאבטחת המידע אולי נראה חבוי , אבל אני פחדן מספר אחד כאשר זה נוגע לארכוב נתונים ארגוניים על מערכות כמו גוגל אשר נראות קצת כמו חורים שחורים ולא ידועים כאשר זה מגיע ל"איך זה עובד והאם המידע נשלח החוצה ?" , טוב זו סוגיה שאפשר לסגור במערכות הפנימיות , כי זו אכן מערכת פנימית.
היופי הוא שכל נושא המידע החבוי והנעלם בארגון ( והמערכת תחפש בכל מקום שיגדירו לה , בין אם בתחנות קצה , שרתים או אפליקציות ( אפשר לקנות CONNECTORS לכמעט כל מוצר ) הכל הופך להיות גלוי וקל לחיפוש ומציאת נתונים רלוונטיים , הרי כל מי שאי פעם חיפש בגוגל יבין למה אני מתכוון.
אגב , המערכת הכי גדולה שאני מצאתי אצלם נכון להיום נקראת GB-8008 ויכולה לחפש במעל 30 מליון מסמכים . הצעה שלי ליאהו ולשאר , קנו כמה כאלה , ותפסיקו לבזבז זמן על פיתוח מנוע נוסף ש"יתחרה" במנוע המדהים של גוגל.
אהבתי.
למי שפספס - הנה שוב הלינק אני מציע לשוטט שם קצת.
Labels: architecture, solution, technology
שווה!! ויעיל מאוד לארגונים גדולים רק תיקון קטן: כריית נתונים או כריית מידע = data mining ולא קריית נתונים :)
Posted by Anonymous | 6:58 PM
תיקנתי
תודה .
Posted by barry | 7:01 PM
אני אשמח לקרוא המלצה שלך למוצר טוב שנבדק שיודע לבצע url filtering (והוא לא bluecoat :)
Posted by Anonymous | 7:12 PM
תמיד תוכל להשאיר פרטים ליצירת קשר , או לקרוא את המאמר הבא לפי בקשתך
Posted by barry | 7:17 PM
תודה!
Posted by Anonymous | 7:24 PM
היי בארי,
גוגל לא יודע לאנדקס קבצים. הוא צריך מקור שמתחיל בHTTP.
IBM, YAHOO וSHAREPOINT מטפלים גם בקבצים ברשת. לא יודע לגבי YAHOO אבל SHAREPOINT מציג בתוצאות של החיפוש רק מה שמותר לראות לפי הרשאות על הקובץ - זה אומר שלא תוכל לראות ולמצוא למה שאין גישה פיזית...
Posted by Anonymous | 7:36 PM
היי מקס,
שים לב , לגוגל יש פתרון של Desktop Enterprise אשר בעצם מייצר את הממשק מול השרתים והאפליקציות , לא נכון לומר שהוא יוצר אינדקסים רק לHTTP , כי אם תשים לב - ישנן חברות MIDDLEWARE אשר מפתחות CONNECTORS מותאמים לאפליקציות ושרתי קבצים במיוחד בכדי שיהיה אפשר לבצע INDEXING עם הGOOGLE APPLIANCE
Posted by barry | 7:41 PM
בארי ,GOOGLE DESKTOP - זה אומר של כל התחנות ינסו לאנדקס תוכן מתי שבא להן. חוץ מזה צריך להתקין את זה בכל תחנה ולתחזק את זה.
אם אנחנו מדברים על שרת התקן כמו GOOGLE MINI אז הייתי מצפה שהוא יהיה המקום המרכזי לבנית האינדקס...
Posted by Anonymous | 8:04 PM
שים לב להבדלים הקטנים
ראשית , הDesktop Enterprise אינו מאנדקס מתי שבא לו , אלא על ידי ניהול מרכזי.
שנית , ואני אומר שוב , כי כנראה הייתי צריך לכתוב עם ניקוד ... יש C O N N E C T O R S
אשר בדיוק תפקידם הוא לבצע את אותו קישור למערכות נוספות ולבצע את הINDEXING על ידי הGOOGLE MINI או הFULL SCALE.
שים לב לעמוד http://www.google.com/enterprise/gsa/features.html
תחת Enterprise Content כמובן
יש התייחסות ,קבצים שונים , מסדי נתונים , שרתי פרוקסי , שרתי דואר , תמיכה מלאה בשרתי SHAREPOINT ועוד צורות שונות ומערכות שונות אשר ניתן לבצע להן INDEXING.
Posted by barry | 8:08 PM
כתבתי את זה בצורה קצת לוחמנית , אני מתנצל אם זה נשמע תוקפני , זו לא הכוונה בנוסח הדברים
Posted by barry | 8:10 PM
מה שמעניין בגוגל - במקום אחד הם אומרים ש"Natively crawl CIFS file servers as simply and easily as crawling web pages" ובמקום אחר ש"Yes. You can index file systems by setting up an HTTP interface. NT file systems can do this with IIS, and NFS file systems can do this using Apache". נראה שבצורה כזאת או אחרת כן אפשר לאנדקס גם קבצים ברשת. אני מניח שכל אחד יבחר מה שמתאים לו כפיתרון :) מי שלא רוצה לשלם לגוגל או מיקרוסופט יקח IBM\YAHOO כיזה בחינם.
Posted by Anonymous | 9:23 PM
I think when Google and Amazon will shake hands again to bundle their respective services and
roll out a new searcing profiling and indexing product - the world waited with baited breath
it will be the beginning of a new age...:)
Posted by Anonymous | 7:36 AM