
أصبحت Unsloth الإطار الوحيد الذي يدرب نماذج gpt-oss بـ (RL): مجاني على Colab
أصبحت Unsloth الإطار الوحيد الذي يدرب نماذج gpt-oss بـ (RL): مجاني على Colab 🤯🚀
أصبح بإمكان المطورين الآن تشغيل تدريب التعلم المعزز (RL) على نماذج OpenAI gpt-oss عبر أداة Unsloth، مع Notebook تشغيل جاهزة على Google Colab توفر نواة تدريب أسرع !!
✴️ يعتبر Unsloth الإطار الوحيد الذي يدعم التعليم التعزيزي الرباعي 4-bit لـ gpt-oss.
✴️ يمكنك Unsloth من تدريب gpt-oss-20b باستخدام GRPO على ذاكرة فيديو (VRAM) بسعة 15 جيجابايت، (وهو مجاني على Colab.)
✴️ يعمل الاستدلال الجديد من Unsloth بشكل أسرع على أي وحدة معالجة رسومات (GPU)، بما في ذلك A100 وH100 وT4 القديمة؛ ويتوافق gpt-oss-120b مع ذاكرة فيديو (VRAM) بسعة 80 جيجابايت.
لمحة سريعة عن الفوائد العملية ::
✴️ استدلال أسرع يصل إلى 3× مقارنةً بالتطبيقات الحالية.
✴️ استخدام VRAM أقل بنحو 50% في استهلاك الذاكرة.
✴️ سياق أطول ودعم 8× أضعاف سياق أطول في إعدادات معينة بدون خسارة دقة.
روابط 🔗👇
تتبع دليل Unsloth لتقنيات GRPO ::
https://docs.unsloth.ai/new/gpt-oss-reinforcement-learning
https://colab.research.google.com/github/unslothai/notebooks/blob/main/nb/gpt-oss-(20B)-GRPO.ipynb
استخدم مذكرة Colab جاهزة لبدء تجربة سريعة قبل الانتقال إلى بيئة محلية أو سحابية ::