نشرت صحيفة "
فايننشال تايمز" تقريرا قالت فيه إن الباحثين دربوا "الذكاء الاصطناعي" على "البيانات
المركبة" لكي تكتشف
جرائم الحرب في
سوريا.
وقالت الصحيفة في تقرير ترجمته
"عربي21" إن هذا الأسلوب مستخدم لتعليم سيارات تيسلا وأليكسا الذي صنعته
أمازون ودُرب على جمع أدلة حول الأسلحة المستخدمة ضد المدنيين.
وأضافت أن الباحثين في المنظمة السورية لحقوق
الإنسان "مينومينك" واجهوا عقبة كأداء، فقد كان لديهم 3500000 ساعة
مسجلة على الفيديو واحتوت على أدلة عن جرائم الحرب، تتراوح من الهجمات الكيماوية
إلى استخدام الأسلحة الممنوعة، ولم يكن باستطاعتهم البحث فيها أو تمشيطها للبحث عن
الأدلة الدامغة.
وكانت منظمة "مينومينك" راغبة
باستخدام الذكاء الاصطناعي للبحث في لقطات الفيديو في الأرشيف السوري، وهو مستودع
لتسجيلات على منصات التواصل الاجتماعي والبحث عن أدلة بشأن استخدام قنبلة
"عنقودية"، يطلق عليها أر بي كي- 250، وهي عبارة عن قذيفة معدنية تحتوي
على مئات المتفجرات، وإن تم استخدامها ضد المدنيين. وعادة ما تظل قذائف أر بي
كي-250 غير منفجرة وقد تتسبب بمخاطر حتى بعد نهاية الحرب بعقود.
لكن برنامج الذكاء الاصطناعي يحتاج إلى مئات
الصور لـ أر بي كي-250 حتى يستطيع التعرف على السلاح ومن كل زاوية وفي أي وضع،
سواء دمرت جزئيا أو ظلت تحت الأنقاض، وصور كهذه غير متوفرة.
ولهذا طلبت المنظمة من أدم هارفي، عالم
الكمبيوتر والفنان في برلين استخدام تقنية باتت شائعة مع شيوع استخدام الذكاء
الاصطناعي أي استخدام بيانات مصنعة/مركبة وليست صورا حقيقية. وقضى هارفي والباحثون
عامين لبناء 10.000 صورة مقلدة على الكمبيوتر لقنبلة بي أي كي-250، ثم استخدموا
هذه الصور لتدريب برنامج ذكاء اصطناعي.
وفي تشرين الثاني/ نوفمبر اكتشف برنامج تم
تدريبه على الصور المركبة استخدام قنبلة أر بي كي-250 أكثر من 200 مرة في مجموعة
من لقطات الفيديو يصل عددها إلى 100.000 لقطة، وبدقة 99%.
وتضيف الصحيفة أن معظم لقطات الفيديو لم
يراجعها أي شخص من قبل. وقال هارفي: "قدم أدلة عن استخدام الذخيرة غير المشروع
في النزاع السوري". ووفر هارفي الأداة للباحثين في حقوق الإنسان على المصدر
المفتوح "في أف أر إي أم إي".
وقال: "كلما عثرنا، كلما أصبح النقاش
القانوني دقيقا وأننا أمام عملية انتهاك واسعة لحقوق الإنسان، جريمة حرب".
وتقول الصحيفة إن البيانات المركبة/ المصنعة أصبحت وبشكل متزايد بديلا جذابا لـ
"البيانات الكبيرة" وهي الكم الهائل من المدخلات والمطلوبة لتعليم نماذج
الذكاء الاصطناعي كيفية إدراك وفهم المعلومات.
وفي الوقت الذي تحتاج فيه البيانات الحقيقية
إلى تصنيف وتعليق مفصل يقوم به البشر إلا أن البيانات المركبة تأتي بتسميات تم
إنشاؤها تلقائيا، ويمكن زيادتها بسرعة. ويعد الابتكار مفيدا بشكل محدد للشركات
الصغيرة والتي لا تستطيع في العادة دفع ما بين 7- 14 دولارا لكي يقوم شخص بتسميتها
وتحتاج إلى مئات الآلاف من الصور لتدريب الذكاء الاصطناعي.
وتعلق أليكسا كوينغ، المديرة التنفيذية لمركز
حقوق الإنسان في جامعة كاليفورنيا- بيركلي: "إنها فكرة ذكية لمعالجة مشكلة عدم
توفر بيانات مدربة، وبالتحديد في جرائم الحرب التي تظل تحديا". وأضافت: "المحدد الرئيسي هو السرعة وحجم الصور للجرائم المرئية بشكل يجعل من المستحيل
علينا البحث فيها يدويا والعثور على إشارات في الصوت". وقالت: "سيكون
رصيدا ضخما من أجل جعل مجموعات البيانات قابلة للمراجعة البشرية".
وفي السنوات الأخيرة طورت شركات التكنولوجيا
بما فيها نيفيديا وتيسلا وأبل وغوغل وفيسبوك وأمازون مجموعاتها التجارية من البيانات
المركبة ولاستخدامها في أغراض تتراوح بين سيارة بدون قيادة إلى متحدث ذكي إلى
التشخيص الطبي. ويقول ماكسميليان ديننجر، عالم الكمبيوتر البصري في معهد الروبوت
الألماني بوكالة الفضاء "دي أل أر" إن شركات مثل أبل تستخدم البيانات
المركبة، رغم ما لديها من بيانات عن المستخدمين "لأنها جيدة جدا".
ويزعم أن نظام المحاكاة الرقمي لأبل
"هايبريزم" لديه قدرة "تامة على التصنيفات وتحصل على تسميات دقيقة
والجزء الأهم هو أنك تستطيع توليد بيانات لا تشبه البيانات الحقيقية". وفي أيلول/سبتمبر كشف الباحثون في
أمازون عن الطريقة التي يمكن للبيانات المصنعة أن تعلم أليكسا التعرف على
أسماء الأدوية العديدة، وهي مجموعة بيانات من الصعب الحصول عليها.
وكتبت جانيت سليفكا، مديرة البحث العلمي في
مجموعة أليكسا للفهم الطبيعي للذكاء الاصطناعي أن محركات البيانات المركبة قد تولد آلاف الكلمات الجديدة والمتشابهة. وفي الوقت نفسه فالت شركة تيسلا في
آب/أغسطس إنها بنت أكثر من 2.000 ميل من الصور المركبة للطرق، وهي بطول طريق يمتد من
شرق إلى غرب الشاطئ الأمريكي تقريبا. وهذا من أجل مساعدة برنامج القيادة الآلي.
وتسير سيارات تيسلا حاليا على شبكة ذكاء
اصطناعي مدربة على صور مركبة من 371 مليون صورة والتي ستزيد في الأشهر المقبلة.
وتستخدم الشركة مزيجا من البيانات الحقيقية والمركبة لمعالجة حالات يفشل فيها
المقود الآلي بالمحاكاة.
ولا تعد البيانات المركبة بديلا تاما عن
الواقع. ومن هنا فالتحدي أمام مطوري السيارات الآلية هي ردم الهوة بين
"المركب والحقيقي".