أصبحت Unsloth الإطار الوحيد الذي يدرب نماذج gpt-oss بـ (RL): مجاني على Colab

أصبحت Unsloth الإطار الوحيد الذي يدرب نماذج gpt-oss بـ (RL): مجاني على Colab 🤯🚀

أصبح بإمكان المطورين الآن تشغيل تدريب التعلم المعزز (RL) على نماذج OpenAI gpt-oss عبر أداة Unsloth، مع Notebook تشغيل جاهزة على Google Colab توفر نواة تدريب أسرع !!

✴️ يعتبر Unsloth الإطار الوحيد الذي يدعم التعليم التعزيزي الرباعي 4-bit لـ gpt-oss.

✴️ يمكنك Unsloth من تدريب gpt-oss-20b باستخدام GRPO على ذاكرة فيديو (VRAM) بسعة 15 جيجابايت، (وهو مجاني على Colab.)

✴️ يعمل الاستدلال الجديد من Unsloth بشكل أسرع على أي وحدة معالجة رسومات (GPU)، بما في ذلك A100 وH100 وT4 القديمة؛ ويتوافق gpt-oss-120b مع ذاكرة فيديو (VRAM) بسعة 80 جيجابايت.

لمحة سريعة عن الفوائد العملية ::

✴️ استدلال أسرع يصل إلى 3× مقارنةً بالتطبيقات الحالية.
✴️ استخدام VRAM أقل بنحو 50% في استهلاك الذاكرة.
✴️ سياق أطول ودعم 8× أضعاف سياق أطول في إعدادات معينة بدون خسارة دقة.

روابط 🔗👇
تتبع دليل Unsloth لتقنيات GRPO ::
https://docs.unsloth.ai/new/gpt-oss-reinforcement-learning

https://colab.research.google.com/github/unslothai/notebooks/blob/main/nb/gpt-oss-(20B)-GRPO.ipynb

استخدم مذكرة Colab جاهزة لبدء تجربة سريعة قبل الانتقال إلى بيئة محلية أو سحابية ::

mkbusiness