مقالات التقنية

بناء شامل البرمجة اللغوية العصبية | VentureBeat


تحقق من جميع الجلسات عند الطلب من قمة الأمن الذكي هنا.


كل يوم ، يستمتع الملايين من متحدثي اللغة الإنجليزية القياسيين بالمزايا التي توفرها نماذج معالجة اللغة الطبيعية (NLP).

ولكن بالنسبة لمتحدثي اللغة الإنجليزية الأمريكية الأفريقية (AAVE) ، فإن التقنيات مثل أنظمة GPS التي تعمل بالصوت ، والمساعدات الرقمية ، وبرامج تحويل الكلام إلى نص غالبًا ما تكون مشكلة لأن نماذج البرمجة اللغوية العصبية الكبيرة غالبًا ما تكون غير قادرة على فهم الكلمات أو توليدها في AAVE. والأسوأ من ذلك ، غالبًا ما يتم تدريب النماذج على البيانات المأخوذة من الويب وتكون عرضة لدمج التحيز العنصري والجمعيات النمطية المنتشرة على الإنترنت.

عندما يتم استخدام هذه النماذج المتحيزة من قبل الشركات للمساعدة في اتخاذ قرارات عالية المخاطر ، يمكن للمتحدثين في AAVE أن يجدوا أنفسهم مقيدين بشكل غير عادل من وسائل التواصل الاجتماعي ، أو يُحرمون بشكل غير لائق من الوصول إلى فرص الإسكان أو القروض ، أو يعاملون بشكل غير عادل في إنفاذ القانون أو النظم القضائية.

على مدار الثمانية عشر شهرًا الماضية ، ركزت أخصائية التعلم الآلي (ML) جازميا هنري على إيجاد طريقة لدمج AAVE بشكل مسؤول في نماذج اللغة. بصفتها زميلة في معهد ستانفورد للذكاء الاصطناعي المرتكز على الإنسان (HAI) ومركز الدراسات المقارنة في العرق والعرق (CCSRE) ، فقد أنشأت مجموعة مفتوحة المصدر تضم أكثر من 141000 كلمة AAVE لمساعدة الباحثين والبناة على التصميم. نماذج شاملة وأقل عرضة للتحيز.

حدث

قمة الأمن الذكي عند الطلب

تعرف على الدور الحاسم للذكاء الاصطناعي وتعلم الآلة في الأمن السيبراني ودراسات الحالة الخاصة بالصناعة. شاهد الجلسات عند الطلب اليوم.

مشاهدة هنا

“أملي في هذا المشروع هو أن اللغويين الاجتماعيين والحاسوبيين وعلماء الأنثروبولوجيا وعلماء الكمبيوتر وعلماء الاجتماع وغيرهم من الباحثين سوف يندفعون ويحثون هذه المجموعة ، ويجرون أبحاثًا معها ، ويتصارعون معها ، ويختبرون حدودها حتى نتمكن من تنمية هذا في تمثيل حقيقي لـ AAVE وتقديم ملاحظات ورؤى حول خطواتنا التالية المحتملة من خلال الخوارزميات ، “قال هنري.

في هذه المقابلة ، تصف العوائق المبكرة في تطوير قاعدة البيانات هذه ، وقدرتها على مساعدة اللغويات الحاسوبية على فهم أصول AAVE ، وخططها بعد جامعة ستانفورد.

كيف تصف الإنجليزية الأمريكية الأفريقية العامية؟

بالنسبة لي ، AAVE هي لغة المثابرة والارتقاء. إنها نتيجة اللغات الأفريقية التي يُعتقد أنها ضاعت أثناء هجرة تجارة الرقيق التي تم دمجها في اللغة الإنجليزية لإنشاء لغة جديدة يستخدمها أحفاد تلك الشعوب الأفريقية.

كيف أصبحت مهتمًا بتضمين AAVE في نماذج البرمجة اللغوية العصبية؟

عندما كان طفلاً ، كان والداي يتحدثان أحيانًا بلغتهما الأم. بالنسبة لوالدي الكاريبي ، كان هذا هو العام الجامايكي ، وبالنسبة لأمي كان جولا جيتشي ، الموجود في المناطق الساحلية لكارولينا وجورجيا. كانت كل لغة عبارة عن لغة كريول ، وهي لغة جديدة تم إنشاؤها عن طريق مزج لغات مختلفة.

بدا أن الجميع يفهم أن والدي كانا يتحدثان لغة مختلفة ، ولم يشك أحد في ذكائهم. لكن عندما رأيت أشخاصًا في مجتمعي يتحدثون AAVE ، والتي أعتقد أنها لغة كريول أخرى ، كان بإمكاني أن أقول إن هناك عارًا ووصمة عار مرتبطة بها – شعور أننا إذا استخدمنا هذه اللغة في الخارج ، فسيتم الحكم علينا كونها أقل ذكاءً. عندما بدأت العمل في علم البيانات ، تساءلت عما سيحدث إذا حاولت جمع البيانات على AAVE ودمجها في نماذج البرمجة اللغوية العصبية حتى نتمكن حقًا من البدء في فهمها وتحسين أداء هذه النماذج.

كيف تطور مشروعك ، وما هي العقبات التي واجهتك؟

كان هناك الكثير من العقبات ، وفي النهاية كان علي تغيير هدفي. تتطور AAVE بسرعة أكبر بكثير من العديد من اللغات وغالبًا ما تقلب اللغة الإنجليزية الموحدة رأسًا على عقب ، مما يعطي الكلمات معاني جديدة تمامًا. على سبيل المثال ، غالبًا ما يتم تعريف كلمة “جنون” على أنها تعني “غاضب”. ومع ذلك ، في AAVE ، غالبًا ما يستخدم ليعني “جدًا” ، كما هو الحال في “مجنون مضحك”.

يمكن أيضًا تحديد AAVE إلى حد كبير من خلال الموقف ، والمتحدث ، والنبرة المستخدمة ، والأشياء التي لا تأخذها نماذج معالجة اللغة في الاعتبار. قررت في النهاية إنشاء مجموعة من AAVE ، والتي تم تقسيمها إلى أربع مجموعات. تتضمن المجموعة الغنائية كلمات تصل إلى 15000 أغنية لـ 105 فنانين تتراوح من Etta James و Muddy Waters وصولاً إلى Lil Baby و DaBaby.

تتضمن مجموعة القيادة خطبًا من أفراد ذوي أهمية تتراوح من فريدريك دوغلاس وسوجورنر تروث إلى مارتن لوثر كينج وكيتانجي براون جاكسون. كانت مجموعة الكتب الأكثر صعوبة في التجميع ، لأن الأمريكيين من أصل أفريقي ممثلون تمثيلا ناقصًا بشكل كبير في القانون الأدبي ، لكنني قمت بتضمين أعمال من مجموعات أرشيف الكتب السوداء التاريخية من الجامعات.

أخيرًا ، تعد مجموعة الوسائط الاجتماعية الأكثر قوة وتنوعًا وتتضمن نصوص فيديو ومنشورات مدونة و 15000 تغريدة ، تم جمعها جميعًا من قادة الفكر الأسود.

كيف تتمنى أن يتم استخدام مشروعك؟

أعلم أنه بدأ استخدام الجسد ، لكني لا أعرف حتى الآن من قبل من أو لأي غرض. آمل أن يلهم هذا العمل التمهيدي الباحثين لدخول هذا الفضاء والتشكيك فيه ودفعه إلى الأمام للتأكد من تمثيل AAVE باللغات المستخدمة في البرمجة اللغوية العصبية. قد يكون اللغويون الاجتماعيون والحاسوبون قادرين على استخدام هذا للمساعدة في تحديد ما إذا كانت AAVE هي في الواقع لغتها أو لهجتها الخاصة والبحث عن روابط بينها وبين اللغات الأفريقية الأخرى ، خاصة تلك التي لم يتم تسجيلها أو حفظها في التاريخ الغربي.

كبرنا ، تعلمنا ما أخذ من أسلافنا المستعبدين ومن نسلهم. قد يكون AAVE هو الدليل على أن كل شيء لم يتم انتزاعه وأننا كنا قادرين على الاحتفاظ ببعض من كنا في الطريقة التي نتواصل بها مع بعضنا البعض. هذه المعرفة لديها القدرة على إزالة العار وضخ الكبرياء. عندما أقول “ما الأمر يا أخي؟” أنا لست غير ذكي. أنا استراتيجي وأدعو أسلافنا بهذه المحادثة.

فهو لا يعكس المجتمع الأوسع فحسب ، بل إنه يميز بشكل فعال ضد هذا المجتمع. من المرجح أن تؤدي النماذج اللغوية الكبيرة التي تكافح من أجل فهم الكلمات أو توليدها في AAVE إلى تفاقم الصور النمطية عن السود عمومًا ، ويتم تدوين هذه الارتباطات المتحيزة ضمن هذه النماذج. عندما يتم تسويقها ، يمكن أن تؤدي هذه النماذج – وتحيزاتها – إلى اتخاذ الشركات قرارات غير عادلة تؤثر على حياة المتحدثين بـ AAVE. يمكن أن ينتج عن ذلك كل شيء بدءًا من تحرير الأفراد لوسائل التواصل الاجتماعي الخاصة بهم أو إزالتها بشكل غير متناسب من المنصات إلى التمييز في مجالات مثل الإسكان والمصارف وإنفاذ القانون والأنظمة القضائية.

ما الذي يجب أن يفكر فيه مطورو البرمجة اللغوية العصبية أثناء قيامهم ببناء الأدوات؟

كانت هناك بعض نماذج البرمجة اللغوية العصبية الشائعة التي تتضمن الكثير من التحيز. تعمل الشركات على تقليص هذه النماذج الإشكالية ، ولكن غالبًا ما يتبع ذلك التركيز على تخفيف المخاطر بدلاً من التخفيف من التحيز. بدلاً من محاولة إيجاد حلول ، ستتبع الشركات أحيانًا نهج قول “دعونا لا نتطرق إلى AAVE أو أي شيء له علاقة بالسواد مرة أخرى ، لأننا لم نفعل ذلك بالشكل الصحيح في المرة الأولى.”

بدلاً من ذلك ، يجب أن يسألوا كيف يمكنهم القيام بذلك بشكل صحيح الآن. هذا هو الوقت المناسب لبناء نماذج أفضل ، والتي تعمل على تحسين العمليات ، والتي تأتي بطرق جديدة للعمل مع لغات مثل AAVE ، لذلك لا تستمر الشركات الكبيرة في إدامة الضرر.

ما هي خططك للمضي قدمًا وأنت تغادر ستانفورد؟

بدأت وظيفة جديدة في Microsoft ، حيث سأعمل كمهندس تطبيقي كبير لفريق الأنظمة المستقلة مع Project Bonsai. نعمل على زيادة قدرات التعلم المعزز العميق بشيء نسميه “تعليم الآلة” ، وهو في الأساس تعليم الآلات كيفية أداء المهام التي يمكن أن تجعل البشر أكثر إنتاجية ، وتحسن السلامة ، وتسمح باتخاذ القرارات المستقلة باستخدام الذكاء الاصطناعي. يمنحني هذا العمل فرصة لتحسين حياة الناس ، وأنا ممتن جدًا لإتاحة هذه الفرصة لي.

بيث جنسن كاتبة مساهمة في معهد ستانفورد للذكاء الاصطناعي الذي يركز على الإنسان.

ظهرت هذه القصة في الأصل على Hai.stanford.edu. حقوق الطبع والنشر 2023

صانعي القرار

مرحبًا بك في مجتمع VentureBeat!

DataDecisionMakers هو المكان الذي يمكن للخبراء ، بما في ذلك الأشخاص الفنيون الذين يقومون بعمل البيانات ، مشاركة الأفكار والابتكارات المتعلقة بالبيانات.

إذا كنت تريد أن تقرأ عن الأفكار المتطورة والمعلومات المحدثة ، وأفضل الممارسات ، ومستقبل البيانات وتكنولوجيا البيانات ، انضم إلينا في DataDecisionMakers.

يمكنك حتى التفكير في المساهمة بمقال خاص بك!

قراءة المزيد من DataDecisionMakers

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى