من bin. إلى GGUF: عندما يصبح تشغيل الـ LLM على الأجهزة الطرفية المحدودة (Edge) ممكنًا
كانت تخزن النماذج سابقًا بصيغة .bin أو .pt باستخدام torch.save() لكنها عانت من مشكلة أمان خطيرة؛ثم جاءت Safetensors لتحسين الأمان، لكنها بقيت ثقيلة على المعالجات .. !! أصبحت GGUF (المستخدمة مع GGML) اليوم مغير حقيقي لقواعد اللعبة: ✴️ تنسيق ثنائي لنماذج مُكممة (quantized).✴️ تحميل وتنفيذ أسرع.✴️ متوافقة مع llama.cpp – Ollama – LMStudio – vLLM […]