موقع شبرون للتقنية وأخبار العالم- متابعات تقنية:
كرجل أبيض في أمريكا بدون لهجة إقليمية واضحة ، يمكنني ببساطة أن أفترض أن تقنيات المستهلك الحديثة – مثل المساعد الافتراضي وكاميرا هاتفي – ستعمل بسلاسة خارج الصندوق. أفترض هذا لأنهم يفعلون ذلك. هذا بسبب أن المهووسين الذين يصممون ويبرمجون هذه الأجهزة بأغلبية ساحقة يشبهونني ويبدون مثلي تمامًا – حتى لو كانوا أكثر بياضًا قليلاً. الأشخاص ذوو الامتياز والإضافيون لا يتمتعون بنفس الامتياز.
لن تعمل روبوتات الدردشة المستقبلية وأنظمة الذكاء الاصطناعي المرئية إلا على تفاقم هذا التحيز ما لم يتم اتخاذ خطوات اليوم لضمان معيار معياري للعدالة والسلوك المنصف من هذه الأنظمة. لمعالجة هذه المشكلة ، طور باحثو Meta AI وأصدروه ، مصممًا “لمساعدة الباحثين على تقييم رؤية الكمبيوتر ونماذج الصوت الخاصة بهم للتأكد من دقتها عبر مجموعة متنوعة من الأعمار والأجناس ولون البشرة الظاهر وظروف الإضاءة المحيطة.” يوم الخميس ، كشفت الشركة النقاب عن المحادثات غير الرسمية الإصدار 2 ، والتي تعد بفئات تصنيف أكثر دقة من سابقتها.
تضمنت مجموعة بيانات CC الأصلية 45000 مقطع فيديو من أكثر من 3000 موضوع مدفوع عبر العمر والجنس ولون البشرة الظاهر وظروف الإضاءة. تم تصميم مقاطع الفيديو هذه ليتم استخدامها من قبل باحثين آخرين في مجال الذكاء الاصطناعي ، وتحديداً أولئك الذين يعملون مع أنظمة الذكاء الاصطناعي التوليدية مثل ChatGPT أو الذكاء الاصطناعي المرئي مثل تلك المستخدمة في مرشحات الوسائط الاجتماعية وميزات التعرف على الوجه ، لمساعدتهم على التأكد من أن إبداعاتهم تتصرف بنفس الطريقة سواء كان المستخدم يبدو مثل Anya Taylor-Joy أو Lupita Nyong’o ، سواء كانوا يشبهون Colin Firth أو Colin Quinn.
منذ ظهور المحادثات غير الرسمية لأول مرة قبل عامين ، عملت Meta “بالتشاور مع خبراء داخليين في مجالات مثل الحقوق المدنية” ، وفقًا لإعلان يوم الثلاثاء ، لتوسيع مجموعة البيانات وتحسينها. شارك البروفيسور باسكال فونج ، مدير مركز أبحاث الذكاء الاصطناعي ، بالإضافة إلى باحثين آخرين من جامعة هونغ كونغ للعلوم والتكنولوجيا ، في مراجعة الأدبيات لبيانات الحكومة والصناعة لإنشاء فئات التعليقات التوضيحية الجديدة.
يتضمن الإصدار 2 الآن 11 فئة (سبعة تم الإبلاغ عنها ذاتيًا وأربعة تعليقات توضيحية للباحثين) و 26467 مناجاة فيديو تم تسجيلها بواسطة ما يقرب من 5600 موضوع في سبع دول – البرازيل والهند وإندونيسيا والمكسيك وفيتنام والفلبين والولايات المتحدة. على الرغم من عدم وجود العديد من مقاطع الفيديو الفردية في مجموعة البيانات الجديدة ، إلا أنها تحتوي على تعليقات توضيحية بشكل أكبر. كما يشير ميتا ، كان التكرار الأول يحتوي على عدد قليل فقط من الفئات: “العمر ، وثلاث فئات فرعية من الجنس (أنثى ، ذكر ، وغيرهم) ، لون البشرة الظاهر والإضاءة المحيطة” ، وفقًا لمدونة يوم الخميس.
“لزيادة عدم التمييز والإنصاف والسلامة في الذكاء الاصطناعي ، من المهم أن يكون لديك بيانات شاملة وتنوع ضمن فئات البيانات حتى يتمكن الباحثون من تقييم مدى نجاح نموذج معين أو منتج مدعوم بالذكاء الاصطناعي في العمل مع مجموعات سكانية مختلفة ،” روي أوستن ، وقال نائب الرئيس ونائب المستشار العام للحقوق المدنية في ميتا في البيان. “تلعب مجموعة البيانات هذه دورًا مهمًا في ضمان مراعاة التكنولوجيا التي نبنيها للجميع منذ البداية.”
كما هو الحال مع معظم أبحاث الذكاء الاصطناعي العامة حتى الآن ، تطلق Meta محادثات عادية الإصدار 2 كمجموعة بيانات مفتوحة المصدر لأي شخص لاستخدامها وتوسيعها – ربما لتشمل علامات مثل “الإعاقة ، واللكنة ، واللهجة ، والموقع ، وإعداد التسجيل ، “كما ألمحت الشركة يوم الخميس.
اكتشاف المزيد من موقع شبرون
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.