أخبار التقنية

DeepSeek-R1.. نموذج ذكاء اصطناعى جديد يتحدى OpenAI ضد أقل وأداء أعلى



أعلنت شركة DeepSeek الصينية يوم الاثنين عن تخصيص نموذجها الجديد DeepSeek-R1، الذي ظل نموذجًا متقدمًا للصناعة الذكية يعتمد على التفكير الإيجابي.

هذا النموذج هو النسخة الكاملة من النموذج المفتوح المصدر الذي تم إطلاقه في البداية في نسخة بسعر رخيص من قبل البريد الإلكتروني، ويمكن الآن تنزيل النموذج الجديد من جديد عبر برمجة التطبيقات (API) التي تستمر تكاملًا سلسًا مع التطبيقات الأخرى.

ولذلك فإن DeepSeek-R1 ليُنافس نموذج o1 من OpenAI في العديد من المجالات التي تتطلب التفكير والمعالجة المعقدة، وأشار إلى أن النموذج الجديد قد يتفوق على o1 في بعض المؤشرات مثل الرياضيات والبرمجة والهام المعتمدة على التفكير، كما أشارت DeepSeek إلى أن تكلفة الاستخدام طراز DeepSeek-R1 أقل بنسبة 90-95% مقارنةً بالطراز o1 من OpenAI.

التطورات الجديدة والتكلفة المنخفضة

تتضمن سلسلة جديدة من الأدلة، DeepSeek-R1 وDeepSeek-R1-Zero، حيث تم تطويرهما إلى نموذج لغوي واسع النطاق (LLM) من الشركة نفسها والتي تدعى DeepSeek V3، وتم بناء هذه الارتباطات باستخدام تأسيس “المزيج بين الخبراء” (MoE)، والتي تعمل على دمج عدة نماذج صغيرة فعالة فعالة للأداء وهي نموذج أكبر على الوظائف المتقدمة، وتتيح هذه البنية الجديدة لتقليل التكاليف فيها.

يُذكر أن DeepSeek-R1 متاح للتنزيل عبر منصة Hugging Face، بترخيص من معهد ماساتشوستس للتكنولوجيا (MIT) الذي يتيح استخدامه في الأكاديمية الأكاديمية والتجارية، ولمن لا يستطيع تشغيل النموذج المحلي، ويمكنه أيضًا استخدام واجهة برمجة التطبيقات (API) للنموذج.

تكلفة استخدام DeepSeek-R1 مقارنة بـ OpenAI

من النقاط البارزة التي تميزت DeepSeek-R1 هي أبرزه بشكل ملحوظ. حيث يُسجل نموذج الإدخال 0.14 دولار لكل مليون رمز، بينما تُكلف المخرجات 2.19 دولار لكل مليون رمز، مقارنة، مقارنة API الخاصة بـ OpenAI o1 بحوالي 7.5 دولار لكل مليون رمز مدخلات و60 دولارًا لكل مليون مخرج رمز، مما يجعل DeepSeek-R1 خيارًا أكثر تكلفة للمستخدمين والمطورين.

الأداء والتفوق على *OpenAI *o1

على الرغم من أن التمييز في الأداء بين DeepSeek-R1 وo1 قد يكون مفيدًا، إلا أن الشركة لاحظت أن نتائج السيولة الداخلية تميزت النموذج الجديد على o1 في السيولة وضرورة مثل “اختبار الرياضيات الأمريكي” (AIME)، “Math-500”، ومعيار “مقعد سويسري”. تُعتبر هذه الاختبارات من بين الأكثر تحديًا في العالم الإنجازات، وتظهر قدرة التفوق في هذه المجالات DeepSeek-R1 على تقديم أداء متقدم.

من جهة أخرى، أوضح الفريق الفني في DeepSeek أنه استخدم أسلوب التعلم التعزيزي (التعلم المعزز – RL) في تحسين النموذج دون الحاجة إلى تعديل الفاشلي أو “التعلم الإشرافي” (SFT). استخدام التعلم التعزيزي النقي في هذا السياق سابقًا في مشاريع الذكاء الصناعي الواسعة المصدر، حيث ينتج نموذجًا لحل المشكلات المعقدة باستخدام “سلسلة التفكير” (Chain-of-Thought-CoT).

التوجهات المستقبلية في الذكاء الصناعي

معدات DeepSeek لتحقيق النتائج في تطوير نماذج ذكاء صناعي جديدة تعتمد على تقنيات متقدمة مثل التعلم التعزيزي، بما في ذلك تفعيل القدرات المهنية والتفكير الوظيفي. ويتجه هذا التوجه إلى منافسة قوية مع تجسيد اللاعبين في صناعة الذكاء مثل OpenAI وGoogle DeepMind.

تعمل الشركة على وجودها في سوق الذكاء الصناعي من خلال تقديم نماذج عالية الأداء لحماية منخفضة، ما يغلق المجال أمام العديد من التطبيقات والأكاديميات التي يمكن الاستفادة من هذه التأثيرات.

قد لا يُنظر إلى DeepSeek-R1 كنموذج ذائع الصيت مثل o1 من OpenAI، ولكن أداؤه المتميز وتكلفته المنخفضة يمكن أن تختار خياراته من المطورين والباحثين في الذكاء الصناعي. ومع استمرار هذه التكنولوجيا، فإن المنافسة بين الشركات الكبرى في هذا المجال ستستمر في الدفع حيث تنمو بشكل كبير في العديد من المجالات الحيوية مثل الرياضيات والبرمجة وتعلم السيبراني.

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى