نموذج DeepSeek.. كل ما نريده هو حماية المنتجات الصينية لـChatGPT

أصدر مختبر الذكاء الاصطناعي الصيني DeepSeek Family نماذج R1 بموجب ترخيص جديد تم افتتاحه من معهد ماساتشوستس القوى، حيث يحتوي على نسخة أكبر منها على 671 مليار معلمة، وزعم الشركة أن النموذج يعمل بمستويات مماثلة لنموذج محاكاة المنطق (SR) الخاص بـOpenAI o1، نموذج وراء روبوت الدردشة ChatGPT ، في العديد من معايير الرياضيات والترميز.
كما أنه جزء من بحوث الإصدارات الرئيسية DeepSeek-R1-Zero وDeepSeek-R1، حيث نشر DeepSeek ستة إصدارات أصغر من “DeepSeek-R1-Distill” بقيمة 1.5 مليار إلى 70 مليار معلمة.
وتستند هذه النماذج إلى بنيات مفتوحة المصدر موجودة مثل Qwen وLlama، مدربة باستخدام البيانات التي يمكن الحصول عليها من نموذج R1 الكامل.
يمكن تشغيل أصغر نسخة على جهاز كمبيوتر محمول، في حين يتطلب نموذجًا كاملاً للحوسبة أكبر بكثير.
قال الباحث المستقل في مجال الذكاء الاصطناعي سيمون ويليسون لآرس في رسالة نصية: “إن تشغيلها ممتع للغاية، ومشاهدتها تفكر في أمر مضحك”.
مختبر ويليسون أحد كبار الشركاء المشاهير في منشور على مدونته: “يبدأ كل عضو بعلامة تحتوي على سلسلة من المقترحات المستخدمة في توليد الأشكال”، مشيرًا إلى أنه حتى بالنسبة للمطالبين الصغار، يخرج نموذجًا داخليًا مكثفًا قبل موافقة.
الاستدلال المحاكى فى العمل
يعمل نموذج R1 بشكل مختلف عن النماذج النموذجية الكبرى (LLMs) من خلال دمج ما يسميه الناس في الصناعة الاسترالية في الصناعة.
تجربة سلسلة محاكاة من ذرات تشبه الإنسان بينما يعمل النموذج من خلال حل للاستعلام.
ظهرت هذه الفئة من ما قد تنطلق عليه “نماذج النماذج المحاكية”، أو نماذج SR باختصار، عندما أطلقت نماذج OpenAI العائلية o1 في سبتمبر 2024.
وقد نشرت شركة OpenAI جائزة رئيسية تحمل اسم “o3” في ديسمبر، وعلى عكس نماذج LLM التقليدية، لمدة شهرين SR هذه مشكورًا لإنتاج الاستجابات، وما يزيد هذا الوقت الإضافي من الأداء في العلوم التي تتضمن الرياضيات والفيزياء العلمية.
ويثير تقديم نموذج للانتباه بسبب اللحاق السريع بـ OpenAI، ولهذا السبب، أعلن DeepSeek أن R1 تفوقت على o1 من OpenAI في العديد من الأشخاص الذين يحبون الاختبارات، بما في ذلك AIME (اختبار الاستدلال الرياضي)، وMATH-500 (مجموعة من الاختبارات اللفظية)، وتم التحقق من SWE-bench (أداة تقييم البرامج).
يجب التعامل مع معايير الذكاء الاصطناعي بحذر، ولم يتم التحقق من هذه بشكل مستقل بعد.
وتشير تقارير موقع echCrunch إلى أن ثلاثة مختبرات صينية، DeepSeek وAlibaba وMoonshot AI’s Kimi، صدرت الآن نماذج تقول إنها تتطابق مع قدرات o1، حيث قامت DeepSeek بمعاينة R1 لأول مرة في نوفمبر.
لكن نموذج DeepSeek الجديد يأتي مع مشكلة إذا تم تشغيله في الإصدار المستضاف على السحابة، نظرًا لأصول الصين الأصلية، فلن يولد R1 إجابات حول مواضيع معينة مثل استقلال تايوان، لأنه يجب أن “يجسد الاشتراكية الأساسية”، وفقًا لقوائم الإنترنت الصينية.
تأتي هذه التصفية من حزب إضافي لا تعدده مشكلة إذا تم النموذج خارج الصين، وحتى تشغيل مع ما يمكن، كتب دين بول، باحث الذكاء الاصطناعي في جامعة جورج ماسون، على X، “إن الأداء المذهل لنماذج DeepSeek (الإصدارات الأصغر من r1) “يعني أن المفكرين وين سيستمرون في الاستخدام على نطاق واسع وتشغيلهم على الأجهزة المحلية، بعيدًا عن أعين أي نظام تحكم من أعلى إلى أسفل”.