أعلنت شركة جوجل عن إطلاق تكنولوجيا SynthID لتمييز النصوص، التي طورتها لمساعدتها في التعرف على النصوص المولدة بواسطة الذكاء الاصطناعي، كمصدر مفتوح من خلال مجموعة أدوات Google Responsible Generative AI Toolkit.
وقال بوشميت كوهلي، نائب رئيس الأبحاث في جوجل ديب مايند، في تصريح لمجلة MIT Technology Review، الآن سيتمكن مطورو الذكاء الاصطناعي الآخرون من استخدام هذه التكنولوجيا لمساعدتهم في اكتشاف ما إذا كانت مخرجات النصوص قد جاءت من نماذج لغوية كبيرة خاصة بهم، مما يسهل على المزيد من المطورين بناء الذكاء الاصطناعي بشكل مسؤول.
وأصبحت علامات التمييز أدوات ذات أهمية متزايدة مع استخدام النماذج اللغوية الكبيرة لنشر المعلومات المضللة السياسية، وتوليد محتوى جنسي، وغيرها من الأغراض الخبيثة.
تجارب حالية
وبدأت ولاية كاليفورنيا بالفعل في جعل تمييز الذكاء الاصطناعي إلزامياً، بينما بدأت الحكومة الصينية في تطبيقه العام الماضي، ومع ذلك، لا تزال هذه الأدوات قيد التطوير.
وتساعد تكنولوجيا SynthID، التي تم الإعلان عنها في أغسطس الماضي، في جعل المخرجات المولدة بواسطة الذكاء الاصطناعي قابلة للاكتشاف من خلال إضافة علامة مائية غير مرئية إلى الصور، والصوت، والفيديو، والنصوص أثناء توليدها.
وتوضح جوجل أن النسخة النصية من SynthID تعمل من خلال جعل المخرجات النصية أقل احتمالية قليلاً بطريقة يمكن اكتشافها بواسطة البرمجيات ولكن ليس من قبل البشر.
آلية العمل
ويعمل نموذج اللغات الكبيرة على توليد النصوص واحدة تلو الأخرى، إذ يمكن أن تمثل هذه المخرجات حرفًا أو كلمة أو جزءًا من عبارة، لإنتاج تسلسل نصي مترابط، يتوقع النموذج العنصر التالي الأكثر احتمالاً، ويتم بناء هذه التوقعات على الكلمات السابقة ودرجات الاحتمالية المعينة لكل عنصر محتمل.
على سبيل المثال، مع العبارة فاكهتي الاستوائية المفضلة هي __. قد يبدأ النموذج في إكمال الجملة باستخدام العناصر مانجو، ليتشي، بابايا، أو دوريان، حيث يتم إعطاء كل عنصر درجة احتمالية.
وعندما تكون هناك مجموعة متنوعة من العناصر للاختيار من بينها، يمكن لـ SynthID تعديل درجة الاحتمالية لكل عنصر متوقع، في الحالات التي لا تؤثر على جودة ودقة وإبداع المخرجات.
عشرات الاحتمالات
وتتكرر هذه العملية عبر النصوص المنتجة، لذا قد تحتوي جملة واحدة على عشر درجات احتمالية معدلة أو أكثر، بينما قد تحتوي الصفحة على المئات. يعتبر نمط الدرجات النهائي الناتج عن اختيارات الكلمات للنموذج مقترنًا بالدرجات المعدلة هو العلامة المائية.
وتدعي جوجل أن النظام، الذي تم دمجه بالفعل في دردشة Gemini، لا يؤثر على جودة ودقة وإبداع وسرعة النصوص المولدة، وهي قضايا كانت تزعج أنظمة التمييز في الماضي.
وتؤكد جوجل أنه يمكن أن يعمل على نصوص قصيرة تصل إلى ثلاث جمل، فضلاً عن النصوص التي تم قصها أو إعادة صياغتها أو تعديلها. ومع ذلك، يواجه صعوبة مع النصوص القصيرة والمحتوى المعاد كتابته أو المترجم، وحتى الردود على الأسئلة الواقعية.
وكتبت جوجل في منشور مدونة في مايو: لا يُعتبر ‘SynthID’ حلاً سحريًا لتحديد المحتوى المولد بواسطة الذكاء الاصطناعي. [لكنها] تشكل لبنة أساسية مهمة لتطوير أدوات أكثر موثوقية للتعرف على الذكاء الاصطناعي ويمكن أن تساعد الملايين من الناس في اتخاذ قرارات مستنيرة حول كيفية تفاعلهم مع المحتوى المولد بواسطة الذكاء الاصطناعي.