منوعات تقنية

يجب على ChatGPT و Dall-E AI وضع علامة مائية على نتائجهما

موقع شبرون للتقنية والأخبار- متابعات تقنية:

صورة لدونالد ترامب أثناء القبض عليه تم إنشاؤها بواسطة Dall-E أو Midjourney AI

صورة: ديفيد أك (AP)

بعد وقت قصير من تسريب شائعات عن لائحة الاتهام الوشيكة للرئيس السابق دونالد ترامب ، ظهرت صور على الإنترنت يُزعم أنها تُظهر اعتقاله. بدت هذه الصور وكأنها صور إخبارية ، لكنها كانت مزيفة. كانت تم إنشاؤها بواسطة نظام ذكاء اصطناعي توليدي.

الذكاء الاصطناعي التوليدي ، في شكل مولدات صور مثل DALL-Eو ميدجورني و انتشار مستقر، ومولدات النصوص مثل باردو الدردشةو شينشيلا و LLaMAانفجرت في المجال العام. من خلال الجمع بين خوارزميات التعلم الآلي الذكية ومليارات الأجزاء من المحتوى الذي ينشئه الإنسان ، يمكن لهذه الأنظمة أن تفعل أي شيء بدءًا من إنشاء صورة واقعية بشكل مخيف من تعليق ، وتوليف خطاب بصوت الرئيس جو بايدن ، واستبدال صورة شخص بآخر في مقطع فيديو. ، أو كتابة افتتاحية متماسكة من 800 كلمة من موجه العنوان.

حتى في هذه الأيام الأولى ، يمكن للذكاء الاصطناعي التوليدي إنشاء محتوى واقعي للغاية. وجدت أنا وزميلي صوفي نايتينجيل أن الشخص العادي هو كذلك غير قادر على التمييز بشكل موثوق صورة لشخص حقيقي من شخص تم إنشاؤه بواسطة الذكاء الاصطناعي. على الرغم من أن الصوت والفيديو لم يمروا بالكامل عبر الوادي الخارق – صور أو نماذج لأشخاص مقلقة لأنهم قريبون من الواقع ولكنهم ليسوا واقعيين تمامًا – فمن المحتمل أن يتم ذلك قريبًا. عندما يحدث هذا ، ويكون مضمونًا تمامًا ، سيصبح تشويه الواقع أسهل بشكل متزايد.

في هذا العالم الجديد ، سيكون من السهل إنشاء مقطع فيديو لرئيس تنفيذي يقول إن أرباح شركته انخفضت بنسبة 20٪ ، مما قد يؤدي إلى خسارة المليارات في حصة السوق ، أو إنشاء مقطع فيديو لزعيم عالمي يهدد بعمل عسكري ، مما قد يؤدي إلى حدوث أزمة جيوسياسية ، أو إدراج صورة أي شخص في مقطع فيديو جنسي صريح.

https://www.youtube.com/watch؟v=gLoI9hAX9dw

أصبحت التكنولوجيا اللازمة لصنع مقاطع فيديو مزيفة لأشخاص حقيقيين متاحة بشكل متزايد.

إن التقدم في الذكاء الاصطناعي التوليدي سيعني قريبًا أن المحتوى المزيف والمقنع بصريًا سينتشر عبر الإنترنت ، مما يؤدي إلى نظام إيكولوجي للمعلومات أكثر فوضوية. والنتيجة الثانوية هي أن المنتقدين سيكونون قادرين بسهولة على رفض أدلة الفيديو الفعلية المزيفة لكل شيء من عنف الشرطة وانتهاكات حقوق الإنسان إلى زعيم عالمي يحرق وثائق سرية للغاية.

بينما يحدق المجتمع في برميل ما هو شبه مؤكد مجرد بداية هذه التطورات في الذكاء الاصطناعي التوليدي ، هناك تدخلات معقولة ومجدية تقنيًا يمكن استخدامها للمساعدة في التخفيف من هذه الانتهاكات. كعالم كمبيوتر متخصص في الطب الشرعي للصور، أعتقد أن الطريقة الرئيسية هي وضع العلامات المائية.

العلامات المائية

هناك فترة طويلة تاريخ وضع العلامات على المستندات وغيرها من العناصر لإثبات صحتها ، وبيان الملكية والتزوير. اليوم ، Getty Images ، أرشيف صور ضخم ، يضيف علامة مائية مرئية لجميع الصور الرقمية في الكتالوج الخاص بهم. يتيح ذلك للعملاء تصفح الصور بحرية مع حماية أصول Getty.

العلامات المائية الرقمية غير المحسوسة هي أيضًا تستخدم لإدارة الحقوق الرقمية. يمكن إضافة العلامة المائية إلى صورة رقمية ، على سبيل المثال ، التغيير والتبديل في كل 10 بكسل للصورة بحيث يكون لونها (عادةً رقم في النطاق من 0 إلى 255) ذو قيمة زوجية. نظرًا لأن هذا التغيير والتبديل في البكسل طفيف جدًا ، فإن العلامة المائية غير محسوسة. ونظرًا لأنه من غير المحتمل أن يحدث هذا النمط الدوري بشكل طبيعي ، ويمكن التحقق منه بسهولة ، فيمكن استخدامه للتحقق من مصدر الصورة.

حتى الصور ذات الدقة المتوسطة تحتوي على ملايين البكسل ، مما يعني أنه يمكن تضمين معلومات إضافية في العلامة المائية ، بما في ذلك المعرف الفريد الذي يشفر برنامج الإنشاء ومعرف المستخدم الفريد. يمكن تطبيق نفس النوع من العلامات المائية غير المحسوسة على الصوت والفيديو.

العلامة المائية المثالية هي غير محسوسة وأيضًا مرنة للتلاعب البسيط مثل الاقتصاص وتغيير الحجم وضبط الألوان وتحويل التنسيقات الرقمية. على الرغم من أن مثال العلامة المائية للون البكسل ليس مرنًا لأنه يمكن تغيير قيم الألوان ، فقد تم اقتراح العديد من استراتيجيات العلامات المائية القوية – وإن لم تكن منيعة – لمحاولات إزالتها.

العلامات المائية ومولدات صور AI المجانية

يمكن أن تكون هذه العلامات المائية مخبوزة في أنظمة الذكاء الاصطناعي التوليدية عن طريق وضع علامة مائية على جميع بيانات التدريب ، وبعد ذلك سيحتوي المحتوى الذي تم إنشاؤه على نفس العلامة المائية. هذه العلامة المائية المخبوزة جذابة لأنها تعني أن أدوات الذكاء الاصطناعي التوليدية يمكن أن تكون مفتوحة المصدر – كمنشئ للصور انتشار مستقر هو – دون مخاوف من إمكانية إزالة عملية العلامة المائية من برنامج مولد الصور. الانتشار المستقر له وظيفة مائية، ولكن نظرًا لأنه مفتوح المصدر ، يمكن لأي شخص ببساطة إزالة هذا الجزء من الكود.

OpenAI هو تجربة نظام للعلامة المائية إبداعات ChatGPT. لا يمكن بالطبع تعديل الأحرف في فقرة مثل قيمة البكسل ، لذلك تتخذ العلامة المائية النصية شكلاً مختلفًا.

يعتمد الذكاء الاصطناعي القائم على النص على إنتاج الكلمة التالية الأكثر منطقية في جملة. على سبيل المثال ، بدءًا من جزء الجملة “يمكن لنظام الذكاء الاصطناعي …” ، سيتنبأ ChatGPT بأن الكلمة التالية يجب أن تكون “تعلم” أو “توقع” أو “فهم”. يقترن بكل من هذه الكلمات احتمال يتوافق مع احتمال ظهور كل كلمة بعد ذلك في الجملة. تعلم ChatGPT هذه الاحتمالات من النص الكبير للنص الذي تم التدريب عليه.

يمكن وضع علامة مائية على النص الذي تم إنشاؤه عن طريق وضع علامات سرية على مجموعة فرعية من الكلمات ثم تحيز اختيار كلمة لتكون كلمة ذات علامات مترادفة. على سبيل المثال ، يمكن استخدام الكلمة المميزة “فهم” بدلاً من “فهم”. من خلال التحيز الدوري لاختيار الكلمات بهذه الطريقة ، يتم تمييز النص بعلامة مائية بناءً على توزيع معين للكلمات الموسومة. لن يعمل هذا النهج مع التغريدات القصيرة ولكنه فعال بشكل عام مع نص مكون من 800 كلمة أو أكثر اعتمادًا على تفاصيل العلامة المائية المحددة.

يمكن لأنظمة الذكاء الاصطناعي التوليدية ، وأعتقد أنه ينبغي لها ، وضع علامة مائية على كل محتوياتها ، مما يتيح سهولة التعرف على المصب ، والتدخل إذا لزم الأمر. إذا لم تفعل الصناعة ذلك طواعية ، يمكن للمشرعين تمرير اللوائح لفرض هذه القاعدة. وبطبيعة الحال ، لن يمتثل الأشخاص عديمو الضمير لهذه المعايير. ولكن إذا قام حراس البوابة الرئيسيون عبر الإنترنت – متاجر تطبيقات Apple و Google و Amazon و Google و Microsoft Cloud Services و GitHub – بفرض هذه القواعد عن طريق حظر البرامج غير المتوافقة ، فسيتم تقليل الضرر بشكل كبير.

توقيع محتوى أصيل

لمعالجة المشكلة من الطرف الآخر ، يمكن اعتماد نهج مماثل للمصادقة على التسجيلات السمعية والبصرية الأصلية عند نقطة الالتقاط. يمكن لتطبيق الكاميرا المتخصص التوقيع بشكل مشفر على المحتوى المسجل أثناء تسجيله. لا توجد وسيلة للتلاعب بهذا التوقيع دون ترك دليل على المحاولة. ثم يتم تخزين التوقيع في قائمة مركزية للتوقيعات الموثوقة.

على الرغم من عدم انطباقه على النص ، يمكن التحقق من المحتوى السمعي البصري على أنه من صنع الإنسان. ال الائتلاف من أجل إنشاء المحتوى والمصادقة (C2PA) ، وهو جهد تعاوني لإنشاء معيار لمصادقة الوسائط ، أصدر مؤخرًا مواصفات مفتوحة لدعم هذا النهج. مع انضمام المؤسسات الكبرى بما في ذلك Adobe و Microsoft و Intel و BBC والعديد من المؤسسات الأخرى إلى هذا الجهد ، فإن C2PA في وضع جيد لإنتاج تقنية مصادقة فعالة ومنتشرة على نطاق واسع.

لن يمنع التوقيع المشترك والعلامة المائية للمحتوى الذي تم إنشاؤه بواسطة الإنسان والمحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي جميع أشكال إساءة الاستخدام ، ولكنه سيوفر قدرًا من الحماية. يجب تعديل أي ضمانات وصقلها باستمرار حيث يجد الخصوم طرقًا جديدة لتسليح أحدث التقنيات.

بنفس الطريقة التي يحارب بها المجتمع أ معركة دامت عقودًا ضد التهديدات الإلكترونية الأخرى مثل البريد العشوائي والبرامج الضارة والتصيد الاحتيالي ، يجب أن نعد أنفسنا لمعركة مطولة بنفس القدر للدفاع ضد أشكال مختلفة من إساءة الاستخدام التي تُرتكب باستخدام الذكاء الاصطناعي التوليدي.

هل تريد معرفة المزيد عن الذكاء الاصطناعي وروبوتات المحادثة ومستقبل التعلم الآلي؟ تحقق من تغطيتنا الكاملة لـ الذكاء الاصطناعي، أو تصفح أدلةنا إلى أفضل مولدات فنية مجانية لمنظمة العفو الدولية و كل ما نعرفه عن ChatGPT الخاص بـ OpenAI.


هانى فريد، أستاذ علوم الكمبيوتر ، جامعة كاليفورنيا، بيركلي

تم إعادة نشر هذه المقالة من المحادثة بموجب رخصة المشاع الإبداعي. إقرأ ال المقالة الأصلية.

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى