IPS הוא מטרה ותפקודים של מערכות אחזור מידע
IPS הוא מטרה ותפקודים של מערכות אחזור מידע

וִידֵאוֹ: IPS הוא מטרה ותפקודים של מערכות אחזור מידע

וִידֵאוֹ: IPS הוא מטרה ותפקודים של מערכות אחזור מידע
וִידֵאוֹ: РЭРЗ | Ростовский электровозоремонтный завод (ГК «ЛокоТех») 2024, אַפּרִיל
Anonim

קשה לאדם מודרני לדמיין חיים ללא אינטרנט וגישה כמעט מיידית למקורות מידע. המשתמש רק לעתים רחוקות חושב על האופן שבו מתבצע החיפוש אחר התוכן הרצוי ברשת. אבל זה מאוד מעניין.

מערכת אחזור מידע (IPS) היא מערכת תוכנה וחומרה מורכבת שבוחרת מידע לפי בקשת המשתמש. המידע נשמר בשרתים בצורה דיגיטלית, כפי שפעם היו ספרים על מדפי הספריות. המערכת מורכבת מתתי מערכות רבות. כל אחד מבצע את משימתו בתהליך עיבוד בקשת המשתמש ומתן מידע בטקסט או בקול. ריבוי המשימות לפתרון קובע את מורכבות הארכיטקטורה של מערכות אחזור מידע מודרניות (קיצור של מערכת אחזור המידע). מעין "קופסה שחורה": בקלט - טקסט הבקשה, מה שיש בפנים - לא ידוע, בפלט - מידע מקיף.

קובץ כרטיס בחיים האמיתיים
קובץ כרטיס בחיים האמיתיים

זרמים קלט

בקשות מידע שאדם יוצר בצורת טקסט על מסך הגאדג'ט שלו,מהווים חלק קטן מהבקשות המעובדות במנוע החיפוש. המערכים העיקריים של שאילתות החיפוש נוצרים על ידי רובוטים שמקבלים בקשה אנושית ומבצעים חיפוש רב-שלבי ומשוב עם המשתמש. מערכות אחזור מידע כוללות את גוגל, Yandex ואחרות ידועות, המעבדות מיליוני בקשות מדי יום.

אובייקטי חיפוש מקור

קבוצת האובייקטים הראשוניים המעניינים עבור החיפוש הם מסמכים, רשומות, סרטונים, תמונות ועוד. הם נוצרים מחוץ ל-IPS. מערכת אחסון ואחזור המידע הכללית צריכה להיות בעלת מערכת ביבליוגרפית מובנית - מעין קטלוג המאפשר חיפוש אחר כל סוג של אובייקטים.

אובייקטים או השינויים הדיגיטליים שלהם הופכים ל"משאב כניסה" ל-IPS. ביניהם נבחר המידע שהמשתמש צריך.

חפש מידע
חפש מידע

מקורות חיצוניים

תצוגת בחירת מידע משתמשת במקורות ידע חיצוניים. זה המידע שהמשתמש מחפש. שם הסרט, ציטוט מהספר ועוד. לחיפוש במחשב, מידע זה חייב להיות מתורגם לשאילתה בשפה אלגוריתמית. ב-IPS, זה נעשה באמצעות הבלוק ליצירה, אינדקס ופיתוח שאילתות.

באופן אידיאלי, שלושת התהליכים האלה - ייצוג, אינדקס ופיתוח שאילתות - צריכים להסתמך על מקורות ידע זהים, אבל בפועל, זה לא בר השגה.

יש לסקור ולעדכן כל הזמן מקורות ידע, והעדכון צריך להיות זההמסונכרן. ומקור ידע חיצוני תמיד מקדים באופן כרונולוגי את השימוש בו במנועי חיפוש עבור שאילתה, לפעמים בכמה שנים.

מערכת אחזור מידע
מערכת אחזור מידע

הופעות

ייצוגים של האובייקטים המקוריים מורכבים מנתוני קלט בשילוב כלשהו או שעבר טרנספורמציה בהתאם לכללים והאלגוריתמים של מערכת אחזור מידע מסוימת.

צפיות הן עותקים שעברו טרנספורמציה פחות או יותר של אובייקט החיפוש המקורי. באוסף הטקסטים המלאים הלא ערוכים, כל טקסט הוא הייצוג שלו. באוסף החפצים של תערוכות וחפצי מוזיאון, הייצוג יכול להיות תיאור משתנה של החפץ עם הדימוי שלו. במקרים מסוימים, ייתכן שהייצוג נגזר בחלקו מהאובייקט המקורי ובחלקו מהתיאור: במנועי חיפוש ביבליוגרפיים נגזרים ייצוגים מהאובייקט - למשל כותרת, שם המחבר ישולבו עם הביאור של היצירה.

למצוא את מה שאתה צריך
למצוא את מה שאתה צריך

אינדקס ניתן לחיפוש

מאחר ומידע במערכות אחזור מידע נשמר בצורה של ייצוג, הגיוני להניח שהחיפוש מתבצע בהתאם לייצוג ולאחר בחירה ניתן למשתמש. בפועל, זה לא המצב. לדוגמה, הקטלוגים הנוכחיים של הספרייה המקוונת מגבילים בדרך כלל חיפושים לכמה שדות: מחבר, כותרת וכתוביות בתצוגה המכילה שדות אחרים שלא בוצע בהם חיפוש. זו סיבה מספקת מדוע יש צורך להבחיןתצוגה ואינדקס הניתן לחיפוש, שהוא חלק החיפוש של התצוגה. זה מגדיר כל מה שצריך להיות ניתן לחיפוש. ניתן לפצל אינדקס הניתן לחיפוש, כמו התצוגה ואובייקט המקור, לתת-אינדקסים נפרדים כדי לספק חיפושים ממוקדים מדויקים יותר

למנועי חיפוש בדרך כלל יש מבנה סינטטי פנימי להתאמת תוצאות חיפוש חוקיות. מבנה זה הוא המרכיב השני באינדקס הניתן לחיפוש.

מבחינה נוהלית, ניתן ליישם את תהליך ההוספה לאינדקס בדרכים שונות: ניתן להשיג אינדקס הניתן לחיפוש על ידי:

  • תעתיק מילולית ייצוג שניתן לחיפוש;
  • על ידי העתקת פרטי התצוגה. זה עשוי להיות חלק מהתצוגות או כולן הקיימות פיזית רק כמקטעים, המופצים לפי הכללים ליצירת אינדקס לחיפוש, שייאסף בעת הצורך.
ניהול חיפוש
ניהול חיפוש

בקשות כללי עיצוב ובקשות רשמיות

הנדסת שאילתות היא פונקציה שמתווכת בין שאילתת משתמש לשאילתה רשמית. הוא הופך את השאילתה של המשתמש, ומתאים אותה עם מילוני פקודת האחזור, מפרט האינדקס והאינדקס לפני האחזור. עם שחר הפיתוח של IPS, תפקיד זה הוקצה באופן מסורתי למומחי IT מוסמכים.

פיתוח שאילתות מחשב שיכולות להתאים שאילתות מילון למערכת אינדקס הניתנת לחיפוש מכונה בדרך כלל מודול "קלט מילון".אוטומציה של פונקציה זו מבטיחה ומציעה הזדמנויות לשיטות חיפוש מומחים והסתברותיות.

בקשה רשמית הופכת לבקשה רשמית לאחר שבקשת המשתמש הומרה. דוגמאות לטרנספורמציות פורמליות כאלה כוללות חיתוך, החלפה, נורמליזציה, וקטוריזציה וטרנספורמציות אחרות של הייצוג ה"חיצוני" לייצוגים ה"פנימיים" של מחשב IPS (פענוח - מערכת אחזור מידע).

ערכות קישורי מסמכים שחולצו

קבוצת מקורות המידע המתקבלת היא באופן הגיוני תת-קבוצה של התצוגות שנוצרו על ידי כללי ההתאמה המוחלים על השאילתה הרשמית על ידי אינדקס הניתן לחיפוש.

בדרך כלל, אך לא בהכרח, קיים תהליך מיון נפרד עבור קבוצת המידע המשוחזר. קטלוגים של ספריות מקוונות בדרך כלל מסדרים מחדש סטים שהתקבלו בסדר אלפביתי לפי מחבר לפני הצגתם. במערכות אחזור מידע המייצרות דירוגים קפדניים, סדר הדירוג קודם לכל סידור מחדש.

ניתוח נתונים
ניתוח נתונים

זרמים פלט

פלט תוצאות החיפוש נעשה באופן מסורתי על התצוגה, לעתים קרובות יותר בצורה של זרם של אובייקטים לשימוש במקום אחר או למטרה אחרת, משלים את לולאת החיפוש הראשית. ניתן לשלוח זרמים כאלה למכשירי הדמיה, אחסון לעיבוד נוסף, או שימוש כזרמי קלט לשירותי בחירה אחרים.

מערכות אחזור מידע מאפשרות משוב מהפלט של כל תהליך בחירה. הפלט של כל תהליך יכול להיות משוב לתהליכים אחרים. משוב יכול לספק בסיס לשיקול דעת מומחה בכל שלב.

מוּמלָץ: