وافقت مبادرة المصدر المفتوح (OSI)، التي تقوم بمراجعة التراخيص للامتثال لمعايير المصدر المفتوح، على تعريف الذكاء الاصطناعي مفتوح المصدر الإصدار 1.0 (OSAID)، الذي يحدد تعريف الذكاء الاصطناعي المفتوح. يمكن اعتبار نظام الذكاء الاصطناعي مفتوحًا إذا استوفى المعايير التالية:
- إمكانية الاستخدام لأي غرض دون الحاجة إلى الحصول على إذن منفصل؛
- القدرة على دراسة تشغيل النظام وفحص مكوناته.
- القدرة على إجراء تغييرات لأي غرض، بما في ذلك تغيير المعلومات التي يخرجها النظام؛
- إمكانية نقل النسخة الأصلية والنسخة إلى أشخاص آخرين بعد إجراء التغييرات، دون الحد من أغراض الاستخدام.
لتمكين التغيير، يجب أن يتضمن نظام الذكاء الاصطناعي المفتوح ما يلي:
- معلومات تفصيلية عن البيانات المستخدمة في التدريب ومنهجية التدريب. يجب أن تكون هناك معلومات كافية للمطور المحترف ليتمكن من إعادة إنشاء نظام ذكاء اصطناعي مكافئ بمفرده، باستخدام نفس البيانات أو بيانات مشابهة للتدريب.
- كود المصدر الذي يسمح لك بتشغيل نظام الذكاء الاصطناعي وتنفيذ عملية التدريب عليه. يجب أن يغطي الرمز أيضًا مجالات مثل المعالجة المسبقة والتحقق من صحة البيانات والترميز. وبالإضافة إلى ذلك، يجب تقديم وصف تفصيلي لبنية النموذج.
- معلمات النموذج (معاملات الترجيح)، مما يعني وجود شريحة حالة جاهزة للاستخدام بعد التدريب أو وجود نسخة نهائية محسنة من النموذج.
تم العثور على نماذج كبيرة من لغات التعلم الآلي تلبي المعايير المعدة: Pythia (Eleuther AI)، وOLMo (AI2)، وAmber (LLM360)، وCrystalCoder (LLM360)، وT5 (Google).
نماذج لغات التعلم الآلي الكبيرة التي تدعي الامتثال، ولكنها تتطلب تغييرات في التراخيص أو قواعد الاستخدام: BLOOM (BigScience)، وStarcoder2 (BigCode)، وFalcon (TII).
تبين أن نماذج لغة التعلم الآلي الكبيرة لا تلبي معايير أنظمة الذكاء الاصطناعي المفتوحة بسبب عدم وجود المكونات الضرورية أو بسبب وجود متطلبات غير متوافقة مع مبادئ مفتوحة المصدر: Llama2 (Meta)، Grok (X/Twitter)، Phi-2 (مايكروسوفت) وميكسترال (ميسترال).
المصدر: opennet.ru
