פענוח: ניווט בנוף של זיכרון-שיחה מוגברת

היי כולם, תודה רבה לך על צפייה זה תשלום לפי צפייה וידאו של. מג ‘ יפט היא עבודת מחקר חדשה ומלהיבה במיוחד המגשרת בין מושגים במערכות הפעלה עם יישומי מודל שפה גדולים. זה כנראה הדבר הרומן סופר מרגש על זה הוא מחדש את הפרספקטיבה סביב אחזור דור מוגבר, כמו גם סוג של שימוש בכלי אל תוך פרספקטיבה זו של חשיבה על אל כמו המעבד, הקרנל מאחורי מערכת ההפעלה כי מחליק בזיכרון שלה דומה החלפת הדף וכל אלה סוגים של. אבל מהר לפני שאנחנו צוללים יותר לפרטים של מג ‘ י-פי-טי, ההגדרה הכללית היא שלמודלים גדולים של שפות יש מגבלה על כמות הטקסט שהם יכולים לעבד כקלט.

???? לחץ כאן כדי לעקוב אחר אתר RonenGG בחדשות Google ולעקוב אחרינו

חשיפת מנגנון הגדלת הזיכרון של ממג ‘ פט

תגיד שאתה פשוט משוחח הלוך ושוב עם אחד ממודלי השפה הגדולים האלה. בדרך כלל אתה יכול לקבל כמות די גדולה של הודעות. לדוגמה, ג ‘י-פי-טי-4 עם 8,000 אסימונים כקלט המרבי, אתה יכול לסחור ב-140 הודעות של כ-50 אסימונים הלוך ושוב לפני שהצ’ אט-בוט כבר לא יוכל לחשוב על שיחות שהיו לך בעבר. אז, נניח שפיטרת בצ ‘ אט לפני 2 חודשים ואמרת לו שיום ההולדת שלך הוא ה-11 באוקטובר. ואז חודשיים לאחר מכן, זה כבר לא זוכר מתי יום ההולדת שלך היה.

זה סוג של מסגור אותו בפרספקטיבה הזו של צ ‘אט בוט של כמה צ’ אטים אתה יכול לקיים הלוך ושוב עם אחד ממודלי השפה הגדולים הפופולריים האלה. אם אתה גם חושב על צ ‘ אט עם המסמכים שלך, אז אתה גם צריך לקבל את המידע הספציפי בחלון ההקשר אשר גם אוכל כמה אסימונים אלה. לפיכך, כמה הודעות אתה יכול לסחור קדימה ואחורה לפני שהוא יכול להפנות להודעות ישנות רק על ידי הסתכלות בחלון ההקשר.

כיצד להתקין את MacOS Monterey 12 על Mac לא נתמך, MacBook, iMac או Mac Mini

אחזור דור מוגבר התגלה כפתרון לכך, טכניקה סופר פופולרית שבה אתה משתמש בהטמעות וקטוריות ושאילתות חיפוש כדי לאכלס את הקלט רק במידע רלוונטי. אז הנה דוגמה ללא סמרטוט. דוגמה זו של זמן, אתה אומר, ” מה זה רטוק, תכונה בוויט?”והג’ י-פי-טי לא יודע מה זה. אבל אם במקום זאת אתה אומר, ” בבקשה הקרקע התשובה שלך במידע הבא, “ואז אתה שואל את זה,” מה זה רפק?”עכשיו הוא יודע לענות על השאלה. לכן, כאשר כל מה שהמשתמש רוצה לעשות הוא לדעת מה זה, אנחנו מקבלים משם עם זה די פשוט הגדרת סמרטוט שבו אנחנו יכולים פשוט לאחזר איזה מידע להשתמש בחלון ההקשר שלנו ולאחר מכן לענות על השאלה.

נניח שאנחנו צריכים רק 200 עד 300 אסימונים בדוגמה הספציפית הזו. אבל עכשיו בואו נדמיין שיחה ארוכה שבה המשתמש שואל שוב ושוב שאלות כיצד להשתמש ב-רפק עבור היישום הספציפי שלו. עלינו לאזן בין ניהול הזיכרון של היסטוריית השיחות הזו, כמו גם חיפושים ממסד הנתונים לאחזור שלנו.

הרעיון הגדול במג ‘ י-פי-טי, וזה סופר מרגש, הוא מה אם מודל השפה הגדולה היה מודע להגבלת חלון הקלט שלו ונקוט בפעולות בהתאם? אז הם מרחיבים את מודל השפה הגדולה בעזרת השימוש בכלי לדעת מתי להוסיף תוצאות אחזור או לומר דברים שהוא לומד מהשיחה לזיכרון העבודה שלו. בואו ניכנס לארכיטקטורה הכוללת של מגפט.

מערכת ההפעלה היא מערכת ההפעלה ליישומי סמרטוטים, המגשרת בין זיכרון לשימוש בכלי והתמקדות מסוימת זו בניהול זיכרון ההקשר הראשי. בלב מערכת ההפעלה, יש לנו את מעבד מודל השפה הגדול. אז יש לנו את ההקשר הווירטואלי. ההקשר העיקרי הוא מה שנמצא כרגע בקלט למודל השפה הגדולה כדי לחזות אותו. מה שנמצא בהקשר החיצוני הוא מסד הנתונים הווקטורי שלנו או מאגר הנתונים שלנו שבו אנו יכולים להחליף פנימה והחוצה עם ההקשר הראשי, כמו החלפת דפים במערכות הפעלה, כדי לקבל את ההקשר הרלוונטי שאנחנו צריכים כדי להשלים משימה מסוימת.

זהו חלק הזיכרון שלו, ואז הזיכרון מנוהל באמצעות פונקציות ושימוש בכלי. שימוש בכלי הוא רעיון סופר מרגש שבו אנו מחברים מודלים של שפה לדברים כמו מחשבונים או אולי ממשק משתמש מזג אוויר אם אתה רוצה לשאול אותו את השאלה, ” מה מזג האוויר בבוסטון עכשיו?”היא צריכה לשלוח את הבקשה החיצונית במקום להסתמך על המידע המאוחסן בפרמטרים שלה. במיוחד בדוגמה של ממשק המשתמש של מזג האוויר, אין זה סביר שאתה שומר על טריות מסד הנתונים הווקטורי שלך עם המידע המסוים הזה.

עדכוני השקעות בהייטק: תובנות שוק ודגשים בפרויקט

צלילה עמוקה: רעיונות הליבה מאחורי הממגפט

כנראה יש לך סוגים אלה של שירותים חיצוניים שעובדים לתוך תמונה זו גם כן. אבל יותר מעניין הם פונקציות אלה סביב קריאה וכתיבה זיכרון. קריאת זיכרון היא המקום בו אתה קורא ממסד הנתונים הווקטורי. אנו אומרים אחזור, שאילתת חיפוש. יש גם רעיונות סביב עימוד ושכתוב שאילתות במאמר זה, אבל נגיע לזה מאוחר יותר. זה הרעיון שבו אתה קורא זיכרון כדי להוסיף פוטנציאל להקשר הראשי באמצעות פונקציות אלה של מערכת ההפעלה כמו לצרף להקשר העבודה. אנחנו ניכנס לזה מאוחר יותר גם כן. אבל גם מעניין, יש לנו לכתוב זיכרון.

מכיוון שאתה מנהל את היסטוריית השיחות הזו, כשאני מדבר עם הצ ‘אט שלי במשך זמן רב, למג’ יפט יש את הפונקציות האלה בסביבה, אתה יודע, “קונור אמר לי הרגע שיום ההולדת שלו הוא 11 באוקטובר, אז תן לי להוסיף את זה לאחסון שלי.”אז יש לנו גם את הרעיון הזה של הפרעות ואירועים. אירועים הם מה שמפעיל מג ‘ י-פי-טי להתחיל לבצע עיבוד כלשהו. זה יכול להיות פשוט כמו שאני בא לשוחח עם ג ‘ י-פי-טי ואני אומר, “מה זה רטוק?”ואז זה מעורר את האירוע שמתחיל את כל העיבוד הזה. או לומר שאני מעלה מסמך או אומר שיש הודעת מערכת כמו, ” היי, חלון ההקשר שלך הוא ב 3,500 אסימונים. בואו נתחיל לקצץ אותו.”או שיש לך דברים כמו טיימר. כל חמש דקות, אולי זה מקצץ או משהו כזה. אז יש לך סוג כזה של רעיון סביב הפרעות ממערכות הפעלה שבהן אולי יש לך סוג של עיבוד אסינכרוני.

לדוגמה, למודל השפה הגדולה, אתה אומר, ” חקר כיצד פועל סלפראג.”סלפראג הוא מאמר דומה למג” ב שיצא בערך באותו הזמן. אז תגיד שאתה עושה את זה באופן אסינכרוני בזמן שאתה ממשיך בצ ‘ אט. ואז הוא קוטע ואומר, “היי, סיימתי את דו” ח המחקר הזה. אני צריך לעבוד את זה לתוך השיחה או מה עלי לעשות עם זה?”אז זו הסקירה הכללית של אופן הפעולה של מג” פ.

לקחתי את הציטוט הזה מצ ‘רלס פקר בפודקאסט של ניהול משפטים מדהים עם פרופסור ג’ וזף גונזלס, והוא ממסגר את הרעיון הזה של אם-ג ‘ י-פי-טי כסוכן שיודע להשתמש בכלי ניהול זיכרון. אני חושב שזו פשוט דרך מושלמת לתאר את זה. כיוון סופר מרגש עבור כל תחום זה של אחזור דור מוגבר הוא מעניק את מודל השפה הגדולה עם אפשרות לכתוב למסד הנתונים גם כן. במקרה הספציפי הזה, קרא את ההקשר העיקרי שלו. תמיד היה לך את הרעיון הזה לקרוא ממסד הנתונים של שמור וקטור ואז פשוט להכניס אותו בצורה עיוורת להקשר הראשי. אבל עכשיו יש לך שכבה זו באמצע שבה יש לך תוצאות חיפוש, ואז אתה אומר מה מתוצאות החיפוש אני הולך לשים לתוך ההקשר העיקרי שלי ואז סוג של לשמור שם כמו שאני ממשיך את השיחה. אני חושב שהציטוט הזה פשוט כל כך חזק, סוכן שיודע להשתמש בכלי ניהול זיכרון.

A Game Changer: חושפת את השבוע המדהים ביותר ב-AI News

הרעיון הכללי כאן הוא שאנחנו בונים מערכת הפעלה למודלים גדולים של שפות. שאלה מהירה שהייתי שואל את הקהל היא מה אתם חושבים על מסגור מסגרות כמו לאנג צ ‘ יין או לאמה אינדעקס בצורה כזו, לחשוב עליהן כמערכות הפעלה למודלים גדולים של שפות שמתזמרות את הקשר בין מודלים של שפות וכלים ומסדי נתונים וקטוריים וזיכרון. אז בצלילה עוד קצת, אנדרה קרפתי כתב גם ציוץ מעניין באמת על מערכות הפעלה ומערכות הפעלה מסוג זה.

זה רעיון די מעניין, אני חושב, לעשות את הצעד הבא בחשיבה לא רק על מערכות ניהול מידע ומסדי נתונים, אלא על מערכת הפעלה שלמה שמתזמרת דברים מסוג זה. מאנדרה קרפתי, עם הרבה חלקי פאזל, אני מניח שהפלתי לאחרונה תמונה שלמה יותר של מערכת ניהול תוכן לא כצ ‘ אט בוט אלא תהליך הליבה של מערכת הפעלה חדשה. אז מה שאנחנו רואים במג ‘ י-פי-טי הוא תהליך הגרעין שאומר שאני צריך לשנות את הזיכרון שלי, אני צריך להשתמש בכלי הזה, או שאני צריך להגיב לאירוע הזה. זה הקרנל ומערכת ההפעלה שרק זה מתזמר כיצד לנהל את הזיכרון שלו ולהשתמש בכלים. לדוגמה, היום הוא מתזמר קלט ופלט על פני שיטות, טקסט, אודיו, חזון, מתורגמן קוד היכולת לכתוב ולהפעיל תוכניות, גישה לאינטרנט דפדפן או הטבעה מסדי נתונים עבור קבצים אחסון זיכרון פנימי ואחזור.

כמה דוגמאות של סוג אחר של פונקציות זה יכול לעשות או זיכרון זה יכול לגשת. הרבה מושגי מחשוב עוברים. נכון לעכשיו, יש לנו ביצוע הליכי יחיד פועל ב 10 אסימונים הרץ לשנייה וליהנות להסתכל על רמת הרכבה ביצוע עקבות זרם על ידי. מושגים מאבטחת מחשבים עוברים עם התקפות, הגנות ופגיעויות מתעוררות. אני חושב שיש כל כך הרבה מידע, כל כך הרבה דברים מעניינים לחקור בטקסט הקטן הזה בלבד. הרעיון הזה של, אתה יודע, יש לנו הברגה אחת שבה יש לנו רק תהליך אחד של תואר שני במשפטים. אתה יודע, איפה שרוב, אני יודע לפחות שאני עושה את זה, הוא רישום תואר שני בטרמינל שלי ופשוט סוג של צופה בו עובר כי, אתה יודע, אתה משלם עבור האסימונים. אבל סוג זה של, אנו רואים דברים כמו אולי לאנג סמית ‘ הוא דוגמה טובה משרשרת לאנג של הדמיה של שרשראות הנחיה המורכבות הללו להבנת עקבות הביצוע הללו. אבל אני חושב שההקבלה הזו, אם יש לכם מקביליות כמו במשימות של תואר שני במשפטים, כמו שוב, הדוגמה של “מחקר עצמי”, ואז היא עושה את המחקר הזה ברקע ואז היא אומרת, ” היי, סיימתי.”יש כנראה כל כך הרבה הזדמנויות מזה.

אז לסיים, אני גם אוהב את האנלוגיה השכנה הקרובה ביותר של מערכת ההפעלה כי התעשייה מתחילה לעצב באופן דומה. מערכת הפעלה מגיעה עם אפליקציות ברירת מחדל, אך יש לה חנות אפליקציות. אתה אומר את שוק הצ ‘ אט ואת סוג של איך מתורגמן קוד מחובר עם קו. כאן יש לך אלמוגים. אז, כן, אנחנו בהחלט רואים סוג כזה של חנות אפליקציות סביב מודל השפה. ואז ניתן להתאים את רוב האפליקציות למספר פלטפורמות. שוב, התקן האלחוטי, נניח ו-8 צור מודול המראה כיצד ניתן גם להוציא את הדגם מחנות האפליקציות. ט. ל. ד. ר., להסתכל על ניהול מחשבים כצ ‘ אט-בוטים זה אותו דבר כמו להסתכל על מחשבים מוקדמים כמחשבונים. אנו רואים הופעה של פרדיגמת מחשוב חדשה לגמרי, וזה מוקדם מאוד.

זהו ציוץ סופר מרגש בכל ההקשר הזה של מערכות הפעלה ומערכות הפעלה. אז בואו נצלול לתוך קצת יותר במיוחד מה שהופך את המג ‘ י-פי-טי למערכת הפעלה, שהיא במיוחד סוג זה של ניהול זיכרון ככלי מודל שפה גדול. אז מה שהם מוסיפים במג ‘ י-פי-טי הוא שההקשר העובד מחליף פונקציות מסוג זה. אז יש לך סוג כזה של שיחה שבה אתה אומר, “שלום צ’ אד, ברוך הבא. אני נרגש לצאת איתך למסע הזה כדוקטורט במדעי המחשב, בלה, בלה, בלה.”ואז המשתמש אומר,” המידע הזה של יום ההולדת שלי הוא 11 באוקטובר, והעוגה האהובה עלי היא לבה שוקולד העוגה האהובה עלי.”אז זו דוגמה לאופן שבו היא לוקחת את היסטוריית השיחות והיא מחליטה מה חשוב לשים בהקשר שלה.

ניווט בנוף הזיכרון: שרשור זרימת הבקרה והתפקוד של ממג ‘ פט

באופן דומה, ייתכן שיש לה הודעת מערכת שאומרת, ” אזהרה, היסטוריית השיחות תגיע בקרוב לאורכה המרבי. אתה הופך את מודל השפה למודע להגבלת האסימון שלו.”תגיד,” היי, יש לך 3,500 אסימונים. נצטרך לדחוס את זה.”אז זה יהיה לדחוס אותו כדלקמן. זה לוקח את היסטוריית השיחה וזה תלוי בתכונת האישיות המרכזית הזו, נהנה מפעילויות אדרנלין מהירות כמו מירוצי פורמולה אחת ומפגשי משחק אינטנסיביים במדעי המחשב: לך. אז הוא עושה את זה כדי לדחוס את חלון ההקשר שלו. באופן דומה עם חיפוש, אנו אומרים חיפוש. מהר מאוד ניכנס לאחזור לעומת אחסון ארכיוני ואיך הם מבדילים את זה בעיתון.

אבל אתה מנהל את השיחה הזאת. “מה היה האמן שהזכרת שאתה יכול להיכנס אליו?”אז המשתמש שואל על, אתה יודע, היסטוריית שיחות. אז אתם בודקים את האחסון החיצוני שלכם, את מסד הנתונים הווקטורי שלכם, שבו אולי יש לכם שני סוגים של מסדי נתונים וקטוריים. אתה יכול לקבל כל מיני סוגים של מסדי נתונים וקטוריים, אבל לעת עתה, יש לך את האחסון של היסטוריית האירועים, כמו כל השיחות בינך לבין הצ ‘ אטבוט שלך, כמו גם לומר כמו מידע כללי כמו אם אתה משוחח עם המסמכים שלך, זו השיחה שניהלנו. אלה המסמכים. אז שני מסדי נתונים. אז נניח שאתה מחפש בהיסטוריית השיחות על מוזיקה. משם, זה מתאושש, אתה יודע, אתה מדבר על, אתה אוהב טיילור סוויפט. אז זה מוסיף את זה להקשר העבודה.

A Game Changer: חושפת את השבוע המדהים ביותר ב-AI News

באופן דומה, יש לנו גם להחליף. אז זה רעיון סופר מרגש שבו יש לך מידע חדש. אז נהגת לומר, אתה יודע ,” הייתי סופר לתוך סרטי אימה. ממליץ לי סרטי אימה.”ועכשיו הטעם שלך התפתח, אז עכשיו אתה לתוך קומדיה רומנטית. אז זה מחליף את ההקשר עם, ” אני צופה בסרטים אימים לקומדיות רומנטיות.”אז אני חושב שציטוט מעניין נוסף מהעיתון הוא לחשוב על זה, כי המג” פ מתעד את ההתקדמות שלו במשימה על ידי כתיבה לזיכרון העבודה שלו. אז זה עושה משימה ארוכה כמו ניתוח מסמכים. זה רק כותב לזיכרון העבודה שלו, אומר דברים חשובים שזה הולך לעזור לו עוד יותר. אז זה בערך כמו הרעיון הזה של זיקוק מושגי הליבה לתוך, אתה יודע, מה עוזר לך עם המחקר שלך או מה שאתה עושה.

אז בואו לצלול קצת יותר לתוך סוגי ההקשר. אז סוגים אלה של הקשר הם התוויות המפורשות של החלקים של חלון ההכנסה למודל השפה הגדולה. ואני חושב שזה סוג של הפרדה, הדבר המפורש הזה של אלה הם הוראות המערכת, זו היסטוריית השיחות, זה הקשר העבודה, אני חושב שיש רק כל כך הרבה יותר הזדמנות לחקור את זה סוג של הפרדה של החלקים של חלון הקלט. אז תגיד שיש לך סוג של זה, תגיד שאתה במסגרות מרובות סוכנים כמו אוטוגן, שם יש לך את המידע הזה על האישיות שלך, כמו, “אני מהנדס תוכנה. אני אוהב גואנג ודברים כאלה.”ואז יש לך גם, נניח, תיאור ברמה גבוהה של מה שאתה עובד עליו, כמו גם סוג זה של הקשר אחזור ואולי הקשר שיחה אחרון מיידי יותר עם מהנדסי התוכנה האחרים במסגרת מרובת הסוכנים ההיא.

אבל זה סוג של הפרדה של הקטגוריות של חלון הקלט ואיך אתה חושב על אחזור והגדלת כל חלק מסוים של זה. אז אנחנו מתחילים עם הוראות מערכת. אז הוראות מערכת, אתה יודע, אלה הם כמו מראש הפקודה היא כמו שאתה עוזר מועיל.

גלה את העתיד של משחקי אסטרטגיה בזמן אמת: הצצה ל-45 כותרים קרובים

אבל עכשיו שאתה עוזר מועיל, הדבר הזה הורחב עם התיאורים של הכלים שיש לך גישה אליהם. אתה מקבל את זה כמו מילון ג ‘ סון שאומר לך מה פונקציה עושה ואיך לעצב את טיעוני הקלט-פלט לשליחת בקשה לאותו ממשק משתמש. אז אם זה אומר, “היי, זה מחשבון, אתה יכול להשתמש בו כדי להוסיף מספרים להכפיל יחד,” זה יהיה איך היית מפעיל בקשה למחשבון. ההקשר השיחה הורחב עם היכולת לתקשר עם הכלים האלה בצורה יותר ניואנסית.

בהמשך להקשר העבודה, מג ‘ יפט מציגה את המושג של הוספת והחלפת פונקציות. לדוגמה, במהלך שיחה, אתה יכול להתחיל בהקדמה כללית, וכשהמשתמש משתף פרטים נוספים כמו יום ההולדת או ההעדפות שלו, אם-ג ‘ י-פי-טי מוסיף מידע זה באופן דינמי להקשר העבודה. זה מבטיח שהמודל מודע להקשר המתפתח ויכול להתאים את תגובותיו בהתאם.

באופן דומה, פונקציית ההחלפה נכנסת לפעולה כאשר יש שינוי בהעדפות המשתמש או במידע. אם, למשל, משתמש הביע בתחילה עניין בסרטי אימה, אך מאוחר יותר מזכיר אהבה חדשה לקומדיות רומנטיות, אם-ג ‘ י-פי-טי לא רק אוסף נתונים; הוא מחליף באופן פעיל מידע מיושן בהקשר העבודה שלו. יכולת הסתגלות זו היא היבט מכריע של האופן שבו מג ‘ י-פי-טי מנהלת את הזיכרון שלה כדי להישאר רלוונטית מבחינה קונטקסטואלית.

עכשיו, בואו להתעמק במושג החיפוש בתוך מגפט. כאשר משתמש מציב שאלה או מבקש מידע, מג ‘ יפט יכול לבצע חיפושים במסד הנתונים הווקטורי שלו. פעולת החיפוש בוחנת את היסטוריית השיחות או את האחסון החיצוני כדי לאחזר מידע רלוונטי. תהליך זה מסייע לזכור אינטראקציות בעבר ולספק תגובות מדויקות. ההבחנה בין זיכרון לאחסון ארכיוני הופכת משמעותית בהבנת האופן שבו מג ‘ יפט מטפל בסוגים שונים של שאילתות.

זיכרון כרוך בהחזרת מידע משיחות או אירועים אחרונים, כדי להבטיח שהמודל יכול להגיב לשאלות של משתמשים עם פרטים עדכניים ורלוונטיים מבחינה קונטקסטואלית. מצד שני, אחסון ארכיוני כולל מאגרי מידע רחבים יותר, כולל נתונים היסטוריים או מידע כללי. סיווג זה מאפשר למג ‘ י-פי-טי לייעל את החיפושים שלה בהתבסס על אופי החקירה של המשתמש.

ניסויים: שיפור עקביות ומעורבות

לסיכום, הגישה של מג ‘ י-פי-טי לניהול זיכרון כוללת אינטראקציה דינמית של פונקציות הוספה, החלפה וחיפוש בהקשרים העובדים והחיצוניים. המודל אוצר באופן פעיל את זיכרונו כדי להסתגל לכניסות המשתמשים המשתנות, ומבטיח שהוא שומר על מידע רלוונטי ומספק תגובות מדויקות ומודעות יותר להקשר.

ניהול זיכרון אדפטיבי זה הוא תכונה מרכזית שמבדילה את מערכת ההפעלה למודלים של שפות גדולות. על ידי שילוב פונקציות אלה, מג ‘ יפט לא רק מעבד מידע אלא גם מעצב באופן פעיל את הזיכרון שלו כדי לשפר את ההבנה ואת התגובה שלו באינטראקציות מתמשכות. ככל שאנו ממשיכים לחקור את היכולות של מודלים כמו מג ‘ י-פי-טי, פיתוח מערכות הפעלה למודלים גדולים של שפות פותח אפשרויות מרגשות לעתיד של הבנה ואינטראקציה של שפה טבעית.

לכן, במסגרת זו, יש לך את ההקשר הראשי, המפריד במפורש בין הוראות מערכת, הקשר שיחה וזיכרון עבודה. היסטוריית השיחה מטופלת כהיסטוריית אירועים, ומידע זה מתעדכן באופן דינמי באמצעות פונקציות כמו הוסף והחלף. אינטראקציה דינמית זו מבטיחה שהמודל יתאים את עצמו להקשר המתפתח.

עכשיו, הזכרת את הרעיון של סיכום רקורסיבי, שהוא היבט מרתק של מגה-בי-טי. התהליך כולל סיכום סדרת מסמכים בזה אחר זה, תוך שמירה על סיכום מקומי. בדרך זו, גם כאשר מדובר במספר רב של מסמכים, המודל יכול לעקוב אחר המידע החיוני ולהתאים את הקשר העבודה שלו בהתאם. סיכום רקורסיבי זה משתרע לאורך כל היסטוריית השיחות, ומאפשר ייצוג תמציתי וניתן לניהול יותר של המידע.

הלאה, יש את הקשר העבודה, בעצם משמש כשטח גירוד הזיכרון עבור מודל השפה. זה המקום שבו המודל קורא ומעבד את המידע שאוחזר, בין אם זה מתוצאות החיפוש או מהיסטוריית השיחה. הקשר העבודה הזה הוא חיוני להבנת המודל ולייצור התגובה.

עכשיו, בואו נדבר על אחסון חיצוני, שבו מסד הנתונים וקטור נכנס לשחק. ישנם שני סוגים של אחסון: אחסון זיכרון, המכיל יומני אירועים גולמיים כמו היסטוריית צ ‘ אט, ואחסון ארכיוני, המכיל אחסון כללי לקריאה-כתיבה כמו ויקיפדיה או מסמכים אחרים. הבחנה זו מאפשרת אחזור יעיל של מידע על סמך אופי שאילתת המשתמש.

היכולת של המודל לחפש בהקשר החיצוני שלו היא היבט מכריע. הוא יכול לבצע חיפושים במסד הנתונים הווקטורי שלו, או על בסיס זמן, חיפוש טקסט, או חיפוש מבוסס טמעה. פעולת חיפוש זו מבטיחה שהמודל יוכל לאחזר מידע רלוונטי הן מאינטראקציות אחרונות והן ממאגרי מידע רחבים יותר.

15 טכנולוגיות מתפתחות שישנו את העולם

עכשיו, כשזה מגיע לעריכה עצמית מכוונת ואחזור, זה המקום שבו המודל פעיל מגדיל את הקשר העבודה שלה. הוא מאחזר מידע, משקף אותו ומעדכן את ההקשר בהתאם. תהליך זה כולל זרימת בקרה, המופעלת על ידי אירועים כגון הודעות משתמש או הודעות מערכת. המודל מתאים באופן דינמי את הזיכרון שלו בהתבסס על האירועים האלה.

אופקים עתידיים: השפעת הממגפט על ייצור מוגבר לאחזור

המאמר מציג גם את הרעיון של פעולות חיפוש, כאשר המודל לא רק מחזיר ומשתמש בתוצאות המובילות אלא עוסק בפעולות כמו חיפוש בתוצאות חיפוש או עיצוב מחדש של שאילתות על בסיס התוצאות שנצפו. זה מוסיף שכבה נוספת של תחכום לאופן שבו המודל מתקשר עם מידע.

פענוח: ניווט בנוף של זיכרון-שיחה מוגברת

עכשיו, בואו ניגע בניסויים שנערכו עם מגה-בי-טי. ההערכה סובבת סביב יכולת המודל לשפר את עקביות השיחה ואת המעורבות. הוא משתמש במערך הנתונים של צ ‘אט רב-מפגשי, שבו המודל נבדק על שמירה על קוהרנציה וסיפוק דיאלוג מרתק בין מפגשי צ’ אט מרובים.

המושג” אבוד באמצע ” מטופל, ומבטיח שהמודל לא מתמקד רק בתוצאות החיפוש הראשונות או האחרונות אלא מנתח באופן פעיל מידע רלוונטי ומשתמש בו. ההכנסה של קבלת ערכי מפתח מקובעים מוסיפה שכבה נוספת של מורכבות, ובודקת את יכולת המודל להתמודד עם תרחישים של תשובות לשאלות מרובות קפיצות.

במונחים של עבודה עתידית, יש דגש על יישום מג ‘י-בי-טי לתחומים אחרים עם הקשר מסיבי, שילוב טכנולוגיות שונות של רמות זיכרון, שיפור זרימת הבקרה ומדיניות ניהול הזיכרון, וכוונון עדין של מודלים של קוד פתוח לשימוש בכלי מג’ י-בי-טי.

המאמר גם מתאר את החשיבות של אימון מודלים קונטקסט ארוכים יותר ומציע לחקור ייצור נתונים סינתטיים כפתרון ליצירת נתוני אימון עבור מודלים שיכולים לעבד אורך קונטקסט נרחב.

אז, זה סיכום של רעיונות הליבה והניסויים במג ‘ י-בי-טי, כמו גם כמה תובנות לגבי כיוונים עתידיים והשפעות פוטנציאליות על תחום הדור המוגבר לאחזור. אם יש לך שאלות ספציפיות או אם יש היבט מסוים שאתה רוצה לחקור עוד יותר, אל תהסס ליידע אותי!

Leave a Comment