پیدائش؟) دماغ کی نوعیت پر مظاہر۔ حصہ دوم

پیدائش؟) دماغ کی نوعیت پر مظاہر۔ حصہ دوم

عمل کے بارے میں ایک لفظ، یا ہم سب کے بارے میں تھوڑا سا جوابی ہوا.

ذہانت کے موضوع پر خیالات کا تسلسل، قدرتی اور مصنوعی دونوں (AI)، حصہ اول یہاں


مشکل سوال: کیا وہ شخص اب رہتا ہے؟ نہیں، جب ہم سڑک پر چلتے ہیں اور اپنے ارد گرد کی دنیا پر براہ راست غور کرتے ہیں، تو ہم کم و بیش کام کرتے ہیں۔ حقیقی وقت... اگرچہ حقیقت میں - جب تک کہ ہم جو کچھ دیکھتے ہیں وہ پہچان / درجہ بندی کے معمول کے طریقہ کار سے گزرتا ہے - یہ سب حالیہ ہوگا، لیکن پھر بھی ماضی ہے۔ وہ. کیا کوئی شخص ماضی میں رہتا ہے؟

مثال کے طور پر: آپ سڑک پر چل رہے ہیں اور ایک کتا دیکھتے ہیں۔ یا گاڑی۔ کسی بھی صورت میں، اگر ہم اس لمحے کے بارے میں بات کر رہے ہیں، تو یہ معلومات پہلے سے ہی پرانی ہے۔ اگر ہم ڈیٹا کے ساتھ کام کرتے ہیں جو ہمارے تمام علمی میکانزم سے گزر چکا ہے (اور دماغ تیز ترین کیلکولیٹر سے بہت دور ہے!) تو ہم دنیا کے ساتھ نہیں رہیں گے! کتا حملہ کرے گا یا اس کے برعکس، بھاگ جائے گا، اور اسے کان کے پیچھے تھپتھپانے کی آپ کی خواہش ادھوری رہے گی، اور گاڑی آپ کو ٹکرائے گی یا آپ کے پاس سے گزر جائے گی، حالانکہ یہ وہ کار تھی جسے آپ "پکڑنا" چاہتے تھے۔

لیکن خدا کا شکر ہے کہ ایسا نہیں ہوتا، اور اس کی وجہ یہ ہے: دماغ مختلف طریقے سے کام کرتا ہے۔ ادراک کی اکائی کوئی شے یا یہاں تک کہ اشیاء کا مجموعہ نہیں بلکہ عمل ہے۔ کتا دوڑ رہا ہے. آپ کو یا آپ کی طرف سے؟ یا وہ بھاگتا نہیں، لیکن لیٹ جاتا ہے، مثال کے طور پر۔ کار بھی ساکن ہے (پارکنگ میں)، یا کسی خاص سمت میں چل رہی ہے۔ تمام معاملات میں، آپ کو ایک ایسا عمل نظر آتا ہے جو وقت کے ساتھ ساتھ بڑھتا ہے اور، اس کے مطابق، مستقبل میں ایک خاص ترقی ہوتی ہے۔ جب میں کہتا ہوں کہ ہم واقعات کو وقت کے ساتھ ظہور پذیر سمجھتے ہیں، یہ تقریر کا پیکر نہیں ہے۔ ایک تجربہ کریں - درجن بھر تصاویر لیں (یعنی حقیقت کے اسنیپ شاٹس) اور جو کچھ آپ دیکھتے ہیں اس کی وضاحت کریں۔ یہاں ایک کمرے میں کئی لوگ ہیں، وہ جھگڑ رہے ہیں، یا یہاں کوئی شخص سڑک پر چل رہا ہے، یا یہاں بیٹھا ٹی وی دیکھ رہا ہے، اور یہاں ایک اور شخص کتاب پڑھ رہا ہے۔ یہ تمام عمل ہیں جو وقت کے ساتھ بڑھے ہوئے ہیں! آپ سنیپ شاٹ کو کسی ایسی چیز کے طور پر سمجھتے ہیں جس میں توسیع ہوتی ہے۔ آپ نہیں جانتے کہ اسے کسی اور طریقے سے کیسے کرنا ہے، کیونکہ دماغ اسی طرح کام کرتا ہے: اسے عمل کو پہچاننے کی تربیت دی جاتی ہے، نہ کہ اسٹیج پر الگ تھلگ اشیاء کو۔ بالکل اسی طرح جیسے آنکھیں-ناک-منہ نہیں، بلکہ مجموعی طور پر چہرہ (ہیلو، convolutional عصبی نیٹ ورک)۔

دنیا اشیاء پر نہیں بلکہ عمل پر مشتمل ہے۔ اگر میں آپ سے پوچھوں کہ یہ کیا ہے؟ سیب، پھر زیادہ تر بالغ کہیں گے کہ یہ ہے۔ پھل، اور بچے - یہ کیا ہے؟ کھانے کی. لیکن دونوں عمل کی تفصیل ہیں، کیونکہ پہلے کا مطلب یہ ہے کہ یہ سیب ایک درخت پر اگتا ہے، اور پنروتپادن کے لئے درخت کی خدمت کرتا ہے، اور دوسرا یہ ہے کہ یہ کھانے کے قابل. نہ تو ایک اور نہ ہی دوسرا سیب کی براہ راست خصوصیات سے وابستہ ہے - شکل، رنگ، سائز... کیونکہ خصوصیات شناخت کی اجازت دیتی ہیں، لیکن استعمال کرنے یا سمجھنے کی اجازت نہیں دیتی ہیں کہ یہ بیرونی دنیا میں کہاں استعمال ہوتا ہے، یعنی عمل کی وضاحت کریں.

اگر ہم وقت کی نوعیت کے بارے میں ایک عام بحث کریں، تو کلاسک مفروضے ماضی کی غیر متغیر ہونے کے بارے میں ہوں گے (وقت کے سفر کے تناظر سے باہر)، حال کی اہمیت (صرف ایک لمحہ ہے... 😉)، اور مستقبل، جو ابھی تک موجود نہیں ہے، جس کا مطلب ہے کہ اسے تبدیل کیا جا سکتا ہے۔ جب ہم معروضی حقیقت کی بات کرتے ہیں تو یہ بہت اچھی طرح سے ہو سکتا ہے کہ ایسا ہی ہو۔ تاہم، ایک شخص دنیا کے اپنے، ساپیکش ماڈل میں رہتا ہے، اور وہاں ہر چیز تقریباً اس کے برعکس ہے!

ماضی تقریباً اتنا ناقابل تغیر نہیں ہے جتنا ہم چاہتے ہیں۔ مسلسل نئی معلومات حاصل کرتے ہوئے، ایک شخص تضادات کو ختم کرنے کے لیے ماضی کی تعمیر نو کرتا ہے (آپ نے سوچا کہ پیوٹر سٹیپانیچ سمپوزیم میں تھا، اور وہ ایک سٹرپ کلب سے باہر آ رہا ہے... اس کا مطلب ہے کہیں نہیں، وہ، تفریح ​​کرنے والا، نہیں گیا اور بالکل بھی... )۔ ایک ہی وقت میں، آپ کا ساپیکش مستقبل بہت سے پہلوؤں میں ایک مستقل ہے (جو بھی ہو، جمعہ کو میرے پاس بیئر اور فٹ بال ہے!)۔ مزید برآں، مستقبل میں ایک خاص مقصد رکھتے ہوئے، آپ نہ صرف الٹ ترتیب میں عمل کا ایک سلسلہ بناتے ہیں (کسی بڑی کمپنی کا ڈائریکٹر بننے کے لیے، آپ کو ایک ممتاز یونیورسٹی سے ڈپلومہ کے ساتھ گریجویشن کرنا ہوگا، اس کے لیے آپ کو پہلے اس میں داخلہ لینا ہوگا، اس کے لیے آپ کو یونیفائیڈ اسٹیٹ کا امتحان اچھی طرح پاس کرنا ہوگا، اور اپنے ہوم ورک کا مطالعہ کرنا ہوگا!)، لیکن یہ بھی کافی امکان ہے کہ اس عمل میں آپ ماضی میں چلے جائیں گے (کیا ہمارے دوست / جاننے والے نہیں تھے جو اب بڑھ چکے ہیں اور کنکشن حاصل کر چکے ہیں اور یونیورسٹی میں ایک بچے کی مدد کر سکتے ہیں؟) - جوابی جذبات کیوں نہیں؟ 😉

تاہم، میں تھوڑا ہچکچاتا ہوں. پھر بھی، اہم چیز جس پر میں توجہ مرکوز کرنا چاہتا تھا۔ عمل. مجھے گہرا یقین ہے کہ ممکنہ AI کو تصاویر یا ویڈیوز پر بھی تربیت نہیں دی جانی چاہیے۔ ایک convolutional نیٹ ورک کی دو سطحیں ہوتی ہیں (کم سے کم) - اور درحقیقت یہ دو مختلف نیٹ ورکس ہیں: ایک کو خام تصویر میں مخصوص گرافک پیٹرن تلاش کرنے کی تربیت دی جاتی ہے، دوسرا پہلی کے آؤٹ پٹ سے متعلق ہے - یعنی پہلے سے تیار شدہ اور تیار شدہ معلومات کے ساتھ۔ AI کی دنیا کے ساتھ کامیابی کے ساتھ تعامل کرنے کے لیے، ایک ہی چیز کی ضرورت ہے: کچھ (کسی بھی طرح سے پہلی نہیں) سطح پر ایک ایسا نیٹ ورک ہونا چاہیے جو وقت کے ساتھ ساتھ سامنے آنے والے عمل کا نقشہ ان پٹ کے طور پر وصول کرے۔ "شروع" اور "اختتام"، "حرکت"، "تبدیلی"، "ضم" اور "تقسیم" کے تصورات وہ ہیں جن کے ساتھ کام کرنا نیٹ ورک کو سیکھنا چاہیے۔

مجھے پورا یقین ہے کہ وہ لوگ جو گیم AI پر کام کرتے ہیں، جیسے Alpha Go، اسے کسی نہ کسی طریقے سے سمجھتے ہیں۔ شاید وہاں کے نقطہ نظر کچھ مختلف ہیں، لیکن جوہر ایک ہی ہے: بورڈ پر موجودہ صورتحال (اور آخری چند چالوں کی ترقی میں) "عام طور پر کیا ہو رہا ہے" کے لیے تجزیہ کیا جاتا ہے۔ اور اس بات پر منحصر ہے کہ جو کچھ ہوتا ہے اس سے کتنا مطابقت رکھتا ہے، ہم اپنی چالیں خود منتخب کرتے ہیں۔

حکمت عملی/رویے کے بارے میں بات کرنا بہت مشکل ہے جب ان پٹ سینسر کی تصویر ہو۔ اور اس کے برعکس - مکمل معلومات کے ساتھ گیمز میں فیلڈ کی موجودہ حالت کی مکمل خرابی پر مشتمل ایک تیار شدہ ویکٹر (دنیا کی مکمل تصویر پر غور کریں) ایک مکمل طور پر قابل عمل کام ہے، جیسا کہ پریکٹس سے ظاہر ہوتا ہے۔ تاہم، اگر پہلی سطحوں کے ارتعاشی نیٹ ورک نے اشیاء کی شناخت کی ہے، اور اگلی سطحیں ان اشیاء کو حرکیات میں تجزیہ کرتی ہیں، شناخت کرنے والے عمل (مثال کے طور پر تربیت سے واقف) جو پہلے حاصل کیے گئے ڈیٹا کی تکمیل کرتی ہیں، تو ایسا لگتا ہے کہ اس کے ساتھ کام کرنا ممکن ہے۔ ..

ماہرین کے لیے سوالات:

عصبی نیٹ ورکس میں موجودہ پیش رفت کے پیش نظر، تقریباً درج ذیل کام کرنا کتنا حقیقت پسندانہ ہے:

دروازے پر، آئیے کہتے ہیں کہ ایک مسلسل ویڈیو سگنل، ممکنہ طور پر سٹیریو۔ ایک اختیار کے طور پر: آزادی کی کئی ڈگریوں کے ساتھ (کیمرہ کو گھمانے کی صلاحیت - من مانی طور پر، یا پیٹرن کے مطابق)۔ تاہم، اگر ضروری ہو تو، ویڈیو سگنل کو مقامی ادراک کے کسی بھی دوسرے طریقے - سونار سے لے کر لیدر تک اضافی/ بدلا جا سکتا ہے۔

سخت الفاظ میں…ان پٹ کچھ بھی ہو سکتا ہے۔ حقیقی وقت بہاؤ - یہاں تک کہ تقریر/متن، یہاں تک کہ کرنسی کے حوالہ جات، لیکن... زیر غور عمل میں، میرے لیے براہ راست مطالعہ کے لیے دستیاب ذہن کے واحد نمونے پر انحصار کرنا آسان ہے - میرا اپنا! ) اور اس "نمونہ" میں حسی چینل مقابلے سے باہر ہے!
باہر نکلنے پر:

  1. گہرائی کا نقشہ (اگر کیمرہ جامد ہے) یا ماحول کا نقشہ۔ جگہ (متحرک کیمرہ/لیڈر، وغیرہ)؛

    اس کے لئےیہ ضروری ہے کہ اگر ہم اشیاء کے باہمی تعامل کا اندازہ لگانے کے لیے ان کا ایک حقیقی مقامی انتظام کرنا چاہتے ہیں۔ اس صورت میں، کیمرے سے تصویر صرف ایک اعلی جہتی جگہ کا ایک دو جہتی پروجیکشن ہے، اور اضافی تبدیلیوں کی ضرورت ہے.

  2. انفرادی اشیاء کی تنہائی (گہرائی/خلا کے نقشے کو مدنظر رکھتے ہوئے، اور نہ صرف/اتنی زیادہ دکھائی دینے والی شکلوں کو)
  3. حرکت پذیر اشیاء کی شناخت (رفتار/سرعت، تعمیر/ترقی کی پیشن گوئی(؟))؛
  4. کسی بھی نکالی ہوئی خصوصیات کے مطابق اشیاء کی درجہ بندی کی درجہ بندی (شکل/طول و عرض/رنگ/حرکت کی باریکیاں/اجزاء کے حصے(؟))۔ وہ. کے لیے بنیادی طور پر میٹرکس نکالنا ہلبرٹ خالی جگہیں۔.

    درجہ بندی کے بارے میںشاید اس معاملے میں لفظ "Hierarchical" بالکل مناسب نہیں ہے۔ میں کسی بھی وقت میٹرکس کو منتخب کرنے کی صلاحیت پر زور دینا چاہتا تھا تاکہ ہیمنگا کا فاصلہ ان کے درمیان ہمیں میٹرکس کے دو مختلف سیٹوں کو ایک تصور کے طور پر غور کرنے کی اجازت دی گئی۔ مثال کے طور پر "سرخ کار" اور "نیلی بس" کو "گاڑی" کے تصور میں کیسے عام کیا جانا چاہیے۔

اہم: اگر ممکن ہو تو، نظام پہلے سے تربیت یافتہ نہیں ہے. وہ. کچھ بنیادی چیزیں رکھی جا سکتی ہیں (مثال کے طور پر، شکل/جیومیٹری کو نمایاں کرنے کے لیے پہلی پرت کا ایک ارتعاشی نیٹ ورک)، لیکن اسے اشیاء کو منتخب کرنا اور بعد میں خود ہی پہچاننا سیکھنا چاہیے۔

  • اور، آخر میں، پوائنٹس 1,4 کے مطابق تجزیہ کرنے کے لیے (ابھی کے لیے، بظاہر براہِ راست مشاہدہ شدہ مدت کے اس مرحلے پر)، ایک جھاڑو (پوائنٹس 2 کی بنیاد پر، یعنی ایک مقامی نقشہ کی بنیاد پر) -4، شناخت کرنے کے لیے: عمل/واقعات (جو بنیادی طور پر ہیں۔ تبدیلیاں وقت میں مرحلہ 3) اور ان کے کلسٹر کی درجہ بندی (مرحلہ 4)۔

ایک بار پھر: سینسر کی تصویر سے، ہم سب سے پہلے دنیا کی تفصیل کو زیادہ تیار شدہ شکل میں نکالتے ہیں، نکالی گئی خصوصیات کے مطابق نشان زد کیا جاتا ہے اور اسے پکسلز میں نہیں بلکہ اشیاء میں تقسیم کیا جاتا ہے۔ پھر ہم اشیاء پر مشتمل دنیا کو پھیلاتے ہیں۔ وقت میں اور موصول "دنیا کی تصویر" ہم اسے اگلے نیٹ ورک کے ان پٹ پر فیڈ کرتے ہیں، جو اس کے ساتھ اسی طرح کام کرتا ہے جس طرح پچھلی پرتیں حسی تصویر کے ساتھ کام کرتی تھیں۔ جہاں اشیاء کی شکل کو نمایاں کیا گیا تھا، اب جاری عمل کے "شکل" کو نمایاں کیا جائے گا۔ خلا میں اشیاء کی رشتہ دار پوزیشن وقت میں عمل کے سبب اور اثر کے تعلق سے ملتی جلتی ہے... کچھ ایسا ہی ہے۔

غالباً، اس کے بعد، نظام کو ان کے حصوں کے ذریعے عمل کو پہچاننے کے قابل ہونا چاہیے (جیسا کہ یہ تصویروں کو پہچاننے کے قابل ہے، صرف ان کا ٹکڑا ہونا، یا جیسا کہ ماڈل کے مطابق متن کا تسلسل لکھنا)، اور نتیجے کے طور پر، قدم 5 کے ماڈل کو دونوں سمتوں میں لامحدود طور پر پھیلاتے ہوئے، وقت کے ساتھ آگے اور پیچھے دونوں کی پیش گوئی کریں۔ نیز، غالباً، جزوی عمل کا خیال رکھتے ہوئے، نظام متعدد متعلقہ مقامی عملوں سے، بڑے، عالمی عملوں کی شناخت کر سکتا ہے اور اس کے نتیجے میں، مضمر، پوشیدہ عمل جو شناخت شدہ عالمی عمل کا ایک لازمی حصہ ہیں، لیکن براہ راست نہیں سمجھا جاتا ہے.

اور آخری چیز: مستقبل میں نظام کی ایک مقررہ حالت کا ہونا (جہاں ہلبرٹ میٹرکس کے صرف اہم عناصر طے کیے گئے ہیں، باقی، غیر ضروری اقدار کی آزاد تشریح کے ساتھ) - کیا نیٹ ورک "سوچنے" کے قابل ہے؟ آرام

ٹھیک ہے، یہ ہے. اگر یہ ایک ایسی تصویر تھی جس میں صرف دو غیر متعلقہ ٹکڑے دیئے گئے تھے، تو کیا کچھ نمونے پر تربیت یافتہ نیٹ ورک ایک "مسلسل" مکمل تصویر کو مکمل کر سکتا ہے؟ اس معاملے میں نمونہ تجربے سے اسی طرح کے وقفے کا ہے، ٹکڑے موجودہ اور مخصوص حالتیں ہیں۔ نتیجہ: ایک اور دوسرے کو جوڑنے والی ایک مستقل "کہانی"...

مجھے لگتا ہے کہ یہ پہلے سے ہی مزید تجربات کے لیے کافی اہم بنیاد ہو گا:

  • "تاریخ" میں اپنے اعمال کو شامل کرنا، اگر ممکن ہو/ضروری ہو۔
  • بے قابو اسٹاکسٹک اخراج پر "قدرتی" وجہ اور اثر کے نمونوں کی ترجیح (رولیٹ کا مسئلہ)
  • تجسس کا کچھ ورژن، یعنی عمل کے ذریعے پیٹرن کا فعال ادراک... وغیرہ

PS میں پوری طرح تسلیم کرتا ہوں کہ میں نے ابھی وہیل ایجاد کی ہے، اور باشعور لوگ ایک طویل عرصے سے ان اصولوں کو عملی طور پر لاگو کر رہے ہیں۔ 😉 اس معاملے میں، میں آپ سے کہتا ہوں کہ آپ متعلقہ پیش رفت میں "اپنی ناک چھین لیں"۔ اور یہ بالکل شاندار ہو گا اگر اس نقطہ نظر کے بنیادی مسائل کی تفصیلی وضاحت ہو یا اس بات کا جواز پیش کیا جائے کہ یہ اصولی طور پر کیوں کام نہیں کرتا۔

PPS میں جانتا ہوں کہ متن خام ہے، اور خیال ایک دوسرے سے چھلانگ لگاتا ہے، لیکن میں واقعی میں کچھ لوگوں سے یہ سوالات پوچھنا چاہتا تھا ("ماہرین کے لیے سوال" سیکشن)، اور اس کے بغیر ایسا کرنا مشکل ہے۔ کم از کم کچھ پیشکش. ماضی کا متن (اور میں اسے اب دوبارہ پڑھ رہا تھا، اور مجھے احساس ہوا کہ اسے سمجھنا بہت مشکل تھا) اس نے اپنا مقصد پورا کیا: مجھے کئی مباحثے ملے جو میرے لیے قیمتی تھے... مجھے امید ہے کہ اس بار بھی یہ کام کرے گا! 😉

ماخذ: www.habr.com

نیا تبصرہ شامل کریں