« Home | המקום שבו אנחנו מתחילים להיכשל - הירוקים » | אבטחת מידע למנהלים - לפני המכונות » | שדרוג המשרד הביתי שלי - Multiplicity » | 802.1x - אנדרלמוסיה בHIGH-END » | האם UTM-1 תומך חלונות ? » | MSN Messenger רק קצת יותר נקי » | קצת Blog-Tagging . » | אבטחת מידע SMB » | תמונות מהכנס » | כנס Fortinet 2007 בישראל - סיכום »

פתרונות חיפוש לעסקים - Google


ובכן , החברה האהובה עליי Google - עושה את זה שוב. [ האזכורים הראשונים למערכת זו הראו לי לפני כשנה וחצי או שנתיים ... אבל לא זכור לי שפורסם באתר של גוגל באופן רשמי ] , אבל אם תיכנסו ל
לינק הזה תוכלו לראות את אחד הפיתוחים היותר מעניינים של גוגל לעולם הLarge Scale Enterprise ולעולם מנועי חיפוש הנתונים וfריית הנתונים העסקיים.

למעשה מה שעשו גוגל ( אגב , Yahoo + IBM וחברות אחרות מפתחים פתרונות מקבילים , וכמו כן יש פתרונות מבית Microsoft אשר זו מטרתם גם כן וכמובן מנוע X1 המושלם מכל בחינה , אבל אני איש של גוגל ... מה לעשות ) הוא לקחת את המנוע האדיר שהם פיתחו , וליצור מערכות INDEXING למידע ארגוני , אשר כל משתמש יכול לרכוש ולנטוע מערכת חיפוש מתקדמת ביותר , בארגון שלו , באתר שלו , או עבור לקוחות שלו. והיתרונות בולטים , מכונת הGOOGLE MINI יכולה ברישוי הכי זול שלה ( 1995$ ) לחפש ולבצע INDEXING למעל 50,000 מסמכים - כלומר זהו פתרון זול וסביר לכל ארגון אשר מעוניין במנגנון לניתוב , סינון פילטור ויצירת מאגר נתונים על סמך מסמכים. והפתרון האולטימטיבי לשילוב בתוך אתר אינטרנט או אינטראנט ארגוני.

החלק שקשור פה לאבטחת המידע אולי נראה חבוי , אבל אני פחדן מספר אחד כאשר זה נוגע לארכוב נתונים ארגוניים על מערכות כמו גוגל אשר נראות קצת כמו חורים שחורים ולא ידועים כאשר זה מגיע ל"איך זה עובד והאם המידע נשלח החוצה ?" , טוב זו סוגיה שאפשר לסגור במערכות הפנימיות , כי זו אכן מערכת פנימית.

היופי הוא שכל נושא המידע החבוי והנעלם בארגון ( והמערכת תחפש בכל מקום שיגדירו לה , בין אם בתחנות קצה , שרתים או אפליקציות ( אפשר לקנות CONNECTORS לכמעט כל מוצר ) הכל הופך להיות גלוי וקל לחיפוש ומציאת נתונים רלוונטיים , הרי כל מי שאי פעם חיפש בגוגל יבין למה אני מתכוון.

אגב , המערכת הכי גדולה שאני מצאתי אצלם נכון להיום נקראת GB-8008 ויכולה לחפש במעל 30 מליון מסמכים . הצעה שלי ליאהו ולשאר , קנו כמה כאלה , ותפסיקו לבזבז זמן על פיתוח מנוע נוסף ש"יתחרה" במנוע המדהים של גוגל.

אהבתי.

למי שפספס - הנה שוב הלינק אני מציע לשוטט שם קצת.

Labels: , ,

Syndication : Digg It  Add to Technorati Favorites  Stumble It  Worth Reading 

שווה!! ויעיל מאוד לארגונים גדולים רק תיקון קטן: כריית נתונים או כריית מידע = data mining ולא קריית נתונים :)

תיקנתי
תודה .

אני אשמח לקרוא המלצה שלך למוצר טוב שנבדק שיודע לבצע url filtering (והוא לא bluecoat :)

תמיד תוכל להשאיר פרטים ליצירת קשר , או לקרוא את המאמר הבא לפי בקשתך

תודה!

היי בארי,
גוגל לא יודע לאנדקס קבצים. הוא צריך מקור שמתחיל בHTTP.
IBM, YAHOO וSHAREPOINT מטפלים גם בקבצים ברשת. לא יודע לגבי YAHOO אבל SHAREPOINT מציג בתוצאות של החיפוש רק מה שמותר לראות לפי הרשאות על הקובץ - זה אומר שלא תוכל לראות ולמצוא למה שאין גישה פיזית...

היי מקס,

שים לב , לגוגל יש פתרון של Desktop Enterprise אשר בעצם מייצר את הממשק מול השרתים והאפליקציות , לא נכון לומר שהוא יוצר אינדקסים רק לHTTP , כי אם תשים לב - ישנן חברות MIDDLEWARE אשר מפתחות CONNECTORS מותאמים לאפליקציות ושרתי קבצים במיוחד בכדי שיהיה אפשר לבצע INDEXING עם הGOOGLE APPLIANCE

בארי ,GOOGLE DESKTOP - זה אומר של כל התחנות ינסו לאנדקס תוכן מתי שבא להן. חוץ מזה צריך להתקין את זה בכל תחנה ולתחזק את זה.
אם אנחנו מדברים על שרת התקן כמו GOOGLE MINI אז הייתי מצפה שהוא יהיה המקום המרכזי לבנית האינדקס...

שים לב להבדלים הקטנים
ראשית , הDesktop Enterprise אינו מאנדקס מתי שבא לו , אלא על ידי ניהול מרכזי.

שנית , ואני אומר שוב , כי כנראה הייתי צריך לכתוב עם ניקוד ... יש C O N N E C T O R S
אשר בדיוק תפקידם הוא לבצע את אותו קישור למערכות נוספות ולבצע את הINDEXING על ידי הGOOGLE MINI או הFULL SCALE.

שים לב לעמוד http://www.google.com/enterprise/gsa/features.html
תחת Enterprise Content כמובן

יש התייחסות ,קבצים שונים , מסדי נתונים , שרתי פרוקסי , שרתי דואר , תמיכה מלאה בשרתי SHAREPOINT ועוד צורות שונות ומערכות שונות אשר ניתן לבצע להן INDEXING.

כתבתי את זה בצורה קצת לוחמנית , אני מתנצל אם זה נשמע תוקפני , זו לא הכוונה בנוסח הדברים

מה שמעניין בגוגל - במקום אחד הם אומרים ש"Natively crawl CIFS file servers as simply and easily as crawling web pages" ובמקום אחר ש"Yes. You can index file systems by setting up an HTTP interface. NT file systems can do this with IIS, and NFS file systems can do this using Apache". נראה שבצורה כזאת או אחרת כן אפשר לאנדקס גם קבצים ברשת. אני מניח שכל אחד יבחר מה שמתאים לו כפיתרון :) מי שלא רוצה לשלם לגוגל או מיקרוסופט יקח IBM\YAHOO כיזה בחינם.

I think when Google and Amazon will shake hands again to bundle their respective services and
roll out a new searcing profiling and indexing product - the world waited with baited breath
it will be the beginning of a new age...:)

Post a Comment

About

    My Name is Barry Shteiman, im a devoted tech junkie, and this is my blog.
    E: barry.shteiman -at- gmail.com
    Twitter : bshteiman

Tags & Categories

Mailing List & RSS

Stay Updated  
Add to Technorati Favorites