مايكروسوفت phi-4: أفضل نموذج لغة صغير الحجم
تم إطلاق أول نموذج لغة بحجم صغير في عام 2025، وهو phi-4. يُعتبر هذا النموذج الأفضل بين النماذج الصغيرة؛ حيث يحقق تحسينًا كبيرًا مقارنةً بالإصدار السابق phi-3. في هذه المقالة، سنستعرض أبرز ميزات phi-4 وكيفية استخدامه.
الميزات الرئيسية لنموذج phi-4
- تطوير من قبل مايكروسوفت للأبحاث يُعد نموذج phi-4 من النماذج المتقدمة التي تم تطويرها في مايكروسوفت للأبحاث. تم تصميمه ليكون نموذجًا مفتوحًا يقدم تحسينات كبيرة في معالجة النصوص. وبناءً على ذلك، يقدم هذا النموذج أداءً ممتازًا في العديد من التطبيقات.
- بيانات تدريب عالية الجودة تم تدريب النموذج باستخدام مجموعات بيانات صناعية، بالإضافة إلى مواقع الويب العامة التي تم تصفيتها، والكتب الأكاديمية، ومجموعات الأسئلة والأجوبة. وبالتالي، هذا التدريب عالي الجودة يساعد في تحسين دقة النموذج بشكل ملحوظ. كما أن استخدام هذه البيانات يساعد في زيادة قدرة النموذج على معالجة المعلومات المعقدة.
- تحسين دقيق ومحاذاة متقدمة استخدم phi-4 تقنيات التدريب المشرف (SFT) و تحسين التفضيلات المباشرة (DPO) لضمان محاذاة دقيقة مع تحسينات في الأمان. ومن خلال هذه العمليات، يضمن phi-4 أن يكون النموذج أكثر أمانًا وفعالية في التعامل مع البيانات.
- بنية معمارية متقدمة يعتمد phi-4 على بنية ترانسفورمر التي تحتوي على 14 مليار معلمة. بالنظر إلى هذه البنية، يعتبر النموذج نموذجًا كثيفًا يعتمد فقط على فك التشفير. نتيجة لذلك، يسمح له هذا النموذج بمعالجة النصوص بشكل فعال وسريع، مما يجعل أداءه استثنائيًا في المعالجة اللغوية.
- طول السياق الممتد يدعم phi-4 نافذة سياق تصل إلى 16 ألف رمز، وهو مثالي لمعالجة النصوص الطويلة. وبالتالي، يصبح النموذج مثاليًا للمشروعات التي تتطلب تحليل نصوص معقدة أو طويلة.
- عملية تدريب فعالة تم تدريب النموذج على 9.8 تريليون رمز خلال 21 يومًا باستخدام 1920 وحدة H100-80G من وحدات المعالجة، مما يجعل عملية تدريبه فعالة للغاية. لذلك، يتمتع phi-4 بقدرة عالية على معالجة كميات ضخمة من البيانات.
- قدرات الإدخال والإخراج المتنوعة يقبل النموذج المدخلات النصية ويُنتج مخرجات نصية عالية الجودة. ومن هنا، يمكن استخدامه في العديد من التطبيقات العملية التي تتطلب جودة وموثوقية في النتائج. بالإضافة إلى ذلك، يمكنه التفاعل بشكل جيد مع مجموعة متنوعة من أنواع المدخلات.
بيانات التدريب لنموذج phi-4
تجمع مجموعة البيانات الخاصة بتدريب phi-4 بين البيانات التي تم استخدامها في تدريب phi-3، مع التركيز على الوثائق العامة المتاحة، والبيانات التعليمية عالية الجودة، والرموز البرمجية. علاوة على ذلك، تشمل البيانات أيضًا مواد صناعية جديدة تشبه الكتب المدرسية، التي تهدف إلى تعليم الرياضيات، البرمجة، والتفكير، والمعرفة العامة.
بالإضافة إلى ذلك، تتضمن البيانات مجموعة بيانات محادثات عالية الجودة تم تصميمها لتعكس تفضيلات البشر في مجالات مثل اتباع التعليمات، الصدق، والأمانة. بهذا الشكل، يضمن phi-4 تدريبًا شاملاً ومتنوعًا يعزز من فعاليته في التفاعل مع المستخدمين.
الأداء والقياسات
الاختبار المجمع الشهير (MMLU):
حقق phi-4 درجة 84.8، متفوقًا على phi-3، و Qwen 2.5، و GPT-4o-mini. ونتيجة لذلك، يُظهر phi-4 أداءً متفوقًا في المعايير المعتمدة عالميًا.
العلوم (GPQA):
حقق phi-4 درجة 56.1، متفوقًا بشكل كبير على النماذج الأخرى مثل phi-3 و Qwen 2.5. وبالتالي، يعتبر phi-4 خيارًا قويًا في مجال العلوم.
الرياضيات (MGSM و MATH):
- في MGSM، حقق phi-4 درجة 80.6، مما يجعله أفضل من phi-3 وقريبًا من Llama-2–70B.
- في MATH، سجل phi-4 80.4، متفوقًا بشكل كبير على phi-3 و GPT-4o-mini. وبالتالي، يظهر phi-4 تفوقًا كبيرًا في الرياضيات.
توليد الكود (HumanEval):
حقق phi-4 درجة 82.6، متفوقًا على phi-3 و Qwen 2.5. ومن ثم، يمكن القول أن phi-4 يقدم أفضل أداء في توليد الأكواد.
التفكير (DROP):
سجل phi-4 درجة 75.5، متفوقًا على phi-3 و GPT-4o-mini، مما يعكس فعاليته في مهام التفكير.
المعرفة الواقعية (SimpleQA):
على الرغم من أن درجة phi-4 في هذا المجال منخفضة، إلا أنها قابلة للمقارنة مع النماذج الصغيرة الأخرى مثل Qwen 2.5. وهذا يشير إلى أن phi-4 يظل نموذجًا قويًا في العديد من المجالات.
بالمجمل، يظهر phi-4 أداءً ممتازًا في العديد من المجالات المهمة مثل العلوم، الرياضيات، توليد الكود، والتفكير، مما يجعله أفضل نموذج لغة صغير في هذه المقارنة.
كيفية استخدام النموذج؟
إذا كنت لا تمتلك المعدات الكافية لتشغيل النموذج، يمكنك تجربته على Huggingface Spaces. من خلال هذه المنصة، يمكنك التفاعل مع النموذج واختباره بسهولة. وبالتالي، يمكنك الاستفادة من قوة phi-4 حتى دون الحاجة إلى بنية تحتية متقدمة.