E-Learning is gaining prominence, especially in lifelong learning, primarily through lecture videos. However, these videos often encompass multiple topics or serve various instructional roles within a single subject. In adaptive e-Learning, the smaller and granular the units, the more versatile presentations and personalized lectures are composed. Such units are known as Micro Learning Objects (MLOs). Consequently, the necessity emerges to segment these lecture videos into multiple MLOs, each fulfilling a distinct instructional role in a lecture. This article presents an automatic model leveraging advanced language models to segment lecture videos semantically into Micro Learning Objects (MLOs). Additionally, a new well-segmented dataset of educational videos (YT-EV) was introduced, in which the video is segmented according to a pre-defined timestamped agenda. The model is trained on general text datasets to understand LO segments and subsequently fine-tuned using transfer learning on video datasets to achieve better segmentation results. The experimental results showed an F1-score of value 0.657, which is considered promising and emphasizes the significance of text transcript-based video segmentation for enhancing adaptive e-Learning.
التعلم الإلكتروني يكتسب شهرة، خاصة في التعلم طويل المدى، وذلك بشكل رئيسي من خلال المحاضرات التي تحتوي مقاطع الفيديو. ومع ذلك، تغطي هذه المقاطع في كثير من الأحيان مواضيع متعددة أو تخدم أدوارًا تعليمية متنوعة ضمن موضوع واحد. في التعلم الإلكتروني التكيفي، كلما كانت الوحدات أصغر وأكثر تفصيلًا، كلما تم إعداد عروض ومحاضرات مخصصة أكثر مرونة. تُعرف مثل هذه الوحدات بأسماء كائنات التعلم الصغيرة Micro Learning Objects (MLOs). وبناءً على ذلك، يظهر الحاجة إلى تقسيم مقاطع فيديو المحاضرات هذه إلى MLOs متعددة، حيث يقوم كل منها بأداء دور تعليمي مميز في المحاضرة. يقدم هذا المقال نموذجًا تلقائيًا يستفيد من نماذج اللغة المتقدمة لتقسيم مقاطع فيديو المحاضرات بشكل دلالي إلى كائنات تعلم صغيرة (MLOs). بالإضافة إلى ذلك، تم تقديم مجموعة بيانات جديدة مجزأة جيدًا لمقاطع الفيديو التعليمية (YT-EV)، حيث يتم تقسيم الفيديو وفقًا لجدول زمني محدد مسبقًا. تم تدريب النموذج على مجموعات بيانات نصية عامة لفهم أقسام كائنات التعلم ومن ثم يتم ضبطه بشكل أفضل باستخدام التعلم عبر النقل على مجموعات بيانات الفيديو لتحقيق نتائج تقسيم أفضل. أظهرت النتائج التجريبية F1-score بقيمة 0.657، والتي تعتبر واعدة وتؤكد على أهمية تجزئة الفيديو المستندة إلى النص لتعزيز التعلم الإلكتروني التكيفي.