Kejadian?). Refleksi tentang sifat minda. Bahagian II

Kejadian?). Refleksi tentang sifat minda. Bahagian II

Satu perkataan tentang proses, atau kita semua sedikit lawan angin.

Kesinambungan pemikiran mengenai topik kecerdasan, baik semula jadi dan buatan (AI), Bahagian Pertama di sini


Soalan untuk menghidupkan semula: Adakah orang itu tinggal sekarang? Tidak, apabila kita berjalan di jalan dan merenung secara langsung dunia di sekeliling kita, kita bertindak lebih kurang realtime... Walaupun sebenarnya - selagi apa yang kita lihat melalui mekanisme biasa pengiktirafan / klasifikasi - semua ini akan menjadi baru-baru ini, tetapi masih masa lalu. Itu. adakah seseorang itu hidup di masa lalu?

Contohnya: anda sedang berjalan di jalan dan melihat seekor anjing. Atau kereta. Walau apa pun, jika kita bercakap tentang masa ini, maklumat ini sudah lapuk. Jika kita beroperasi dengan data yang telah melalui semua mekanisme kognitif kita (dan otak jauh daripada kalkulator terpantas!) kita tidak akan bersaing dengan dunia! Anjing itu akan menyerang atau, sebaliknya, melarikan diri, dan keinginan anda untuk menepuknya di belakang telinga akan tetap tidak kesampaian, dan kereta itu akan melanggar anda atau lalu, walaupun kereta inilah yang anda mahu "tangkap."

Tetapi alhamdulillah ia tidak berlaku seperti itu, dan inilah sebabnya: otak berfungsi secara berbeza. Unit persepsi bukanlah objek, malah satu set objek, tetapi proses. Anjing itu sedang berlari. Kepada anda atau daripada anda. Atau dia tidak berlari, tetapi berbaring, sebagai contoh. Kereta itu juga tidak bergerak (di tempat letak kereta), atau bergerak ke arah tertentu. Dalam semua kes, anda melihat proses yang memanjang dari semasa ke semasa dan, dengan itu, mempunyai perkembangan tertentu pada masa hadapan. Apabila saya mengatakan bahawa kita menganggap peristiwa sebagai berlaku dalam masa, ini bukan kiasan. Jalankan percubaan - ambil sedozen gambar (iaitu, syot kilat realiti) dan huraikan perkara yang anda lihat. Berikut adalah beberapa orang di dalam sebuah bilik, mereka sedang bergaduh, atau ini adalah orang yang berjalan di jalan, atau di sini sedang duduk menonton TV, dan ini adalah orang lain membaca buku. Ini semua proses yang dilanjutkan dalam masa! Anda menganggap syot kilat itu sebagai sesuatu yang mempunyai sambungan. Anda tidak tahu bagaimana untuk melakukannya dengan cara lain, kerana itulah cara otak berfungsi: ia dilatih untuk mengenali proses, dan bukan objek terpencil di atas pentas. Sama seperti bukan mata-hidung-mulut, tetapi muka secara keseluruhan (hello, rangkaian neural convolutional).

Dunia terdiri daripada proses, bukan objek. Jika saya bertanya apa itu epal, maka kebanyakan orang dewasa akan mengatakan bahawa ini adalah buah-buahan, dan kanak-kanak - apakah itu? makanan. Tetapi kedua-duanya adalah penerangan proses, kerana yang pertama bermakna bahawa epal ini tumbuh di atas pokok, dan menghidangkan pokok untuk pembiakan, dan yang kedua ialah ia boleh dimakan. Sama ada satu atau yang lain dikaitkan dengan ciri langsung epal - bentuk, warna, saiz... Kerana ciri-ciri itu membenarkan pengenalan, tetapi tidak membenarkan penggunaan, atau pemahaman di mana ia digunakan di dunia luar, i.e. menentukan proses.

Jika kita mengambil perdebatan tipikal tentang sifat masa, maka postulat klasik adalah mengenai ketidakbolehubah masa lalu (di luar konteks perjalanan masa), kepentingan masa kini (hanya ada seketika... πŸ˜‰), dan masa depan, yang belum wujud, bermakna ia boleh diubah. Apabila kita bercakap tentang realiti objektif, mungkin begitu. Walau bagaimanapun, seseorang hidup dalam model dunianya sendiri yang subjektif, dan di sana semuanya hampir bertentangan!

Masa lalu tidaklah hampir kekal seperti yang kita inginkan. Sentiasa menerima maklumat baru, seseorang membina semula masa lalu untuk menghapuskan percanggahan (anda fikir Pyotr Stepanych berada di simposium, dan dia keluar dari kelab strip... Ini bermakna tiada tempat, dia, penghibur, tidak pergi dan sama sekali... ). Pada masa yang sama, masa depan subjektif anda adalah tetap dalam banyak aspek (apa pun, pada hari Jumaat saya mempunyai bir dan bola sepak!). Selain itu, mempunyai matlamat tertentu pada masa hadapan, anda bukan sahaja membina rantaian proses dalam susunan terbalik (Untuk menjadi pengarah sebuah syarikat besar, anda perlu lulus dari universiti berprestij dengan diploma, untuk ini anda mesti terlebih dahulu mendaftar di dalamnya, untuk ini anda perlu lulus Peperiksaan Negeri Bersatu dengan baik, dan belajar kerja rumah anda!), tetapi kemungkinan besar dalam proses ini anda akan pergi ke masa lalu (Bukankah kita mempunyai kawan/kenalan yang kini telah meningkat dan memperoleh pertalian serta boleh membantu kanak-kanak di universiti?) - kenapa tidak melawan emosi? πŸ˜‰

Namun, saya menyimpang sedikit. Namun, perkara utama yang ingin saya fokuskan ialah proses. Saya amat yakin bahawa potensi AI tidak seharusnya dilatih pada foto mahupun video. Rangkaian konvolusi mempunyai dua tahap (minimum) - dan sebenarnya ini adalah dua rangkaian berbeza: satu dilatih untuk mencari corak grafik tertentu dalam imej mentah, yang kedua berkaitan dengan output yang pertama - i.e. dengan maklumat yang telah diproses dan disediakan. Untuk berjaya berinteraksi dengan dunia AI, perkara yang sama diperlukan: pada tahap tertentu (bukan yang pertama) mesti ada rangkaian yang menerima sebagai input peta proses yang terbentang dari semasa ke semasa. Konsep "permulaan" dan "akhir", "pergerakan", "transformasi", "penggabungan" dan "pembahagian" adalah perkara yang perlu dipelajari oleh rangkaian untuk bekerjasama.

Saya cukup pasti bahawa mereka yang bekerja pada permainan AI, seperti Alpha Go, memahami satu cara atau yang lain. Mungkin pendekatan di sana agak berbeza, tetapi intipatinya adalah sama: situasi semasa di papan (dan dalam perkembangan beberapa langkah terakhir) dianalisis untuk "apa yang berlaku secara umum." Dan bergantung pada berapa banyak perkara yang berlaku sepadan dengan apa yang sepatutnya berlaku, kami memilih langkah kami sendiri.

Sangat sukar untuk bercakap tentang strategi/tingkah laku apabila input adalah gambar daripada sensor. Dan sebaliknya - vektor yang disediakan yang mengandungi pecahan lengkap keadaan semasa medan dalam permainan dengan maklumat lengkap (pertimbangkan gambaran lengkap dunia) adalah tugas yang boleh dilaksanakan sepenuhnya, seperti yang ditunjukkan oleh amalan. Walau bagaimanapun, jika rangkaian konvolusi peringkat pertama telah mengenal pasti objek, dan peringkat seterusnya menganalisis objek ini dalam dinamik, mengenal pasti proses (biasa dari latihan, contohnya) yang melengkapkan data yang diperoleh sebelum ini, maka nampaknya mungkin untuk bekerja dengan ini. ..

Soalan untuk pakar:

Betapa realistiknya, memandangkan perkembangan semasa dalam rangkaian saraf, untuk melakukan lebih kurang perkara berikut:

Di pintu masuk, katakan isyarat video berterusan, mungkin stereo. Sebagai pilihan: dengan beberapa darjah kebebasan (keupayaan untuk memutar kamera - sewenang-wenangnya, atau mengikut corak). Walau bagaimanapun, jika perlu, isyarat video boleh ditambah/digantikan dengan mana-mana kaedah persepsi spatial lain - dari sonar hingga lidar.

Tegasnya…input boleh jadi apa sahaja realtime aliran - walaupun ucapan/teks, malah petikan mata wang, tetapi... Dalam proses yang sedang dipertimbangkan, lebih mudah bagi saya untuk bergantung pada satu-satunya sampel minda yang tersedia untuk saya untuk kajian langsung - saya sendiri! ) Dan dalam "sampel" ini saluran deria adalah di luar persaingan!
Di pintu keluar:

  1. Peta kedalaman (jika kamera statik) atau peta persekitaran. ruang (kamera/lidar dinamik, dsb.);

    KenapaIa adalah perlu jika kita ingin mempunyai susunan spatial sebenar objek untuk menilai interaksi mereka. Dalam kes ini, imej daripada kamera hanyalah unjuran dua dimensi bagi ruang berdimensi lebih tinggi, dan transformasi tambahan diperlukan.

  2. Pengasingan objek individu (dengan mengambil kira peta kedalaman/angkasa, dan bukan sahaja/tidak begitu banyak kontur yang kelihatan);
  3. Pengenalpastian objek bergerak (kelajuan/pecutan, pembinaan/ramalan trajektori(?));
  4. Pengelasan hierarki objek mengikut mana-mana ciri yang diekstrak (bentuk/dimensi/warna/nuansa pergerakan/Bahagian komponen(?)). Itu. pada asasnya mengekstrak metrik untuk Hilbert ruang.

    tentang hierarkiMungkin perkataan "Hierarki" tidak sesuai sepenuhnya dalam kes ini. Saya ingin menekankan keupayaan untuk memilih metrik pada bila-bila masa supaya Jarak Heminga antara mereka membolehkan kami mempertimbangkan dua set metrik yang berbeza sebagai satu konsep. Bagaimana "kereta merah" dan "bas biru" harus digeneralisasikan ke dalam konsep "kenderaan", contohnya.

Penting: Jika boleh, sistem ini tidak dilatih terlebih dahulu. Itu. beberapa perkara asas boleh ditetapkan (contohnya, rangkaian konvolusi lapisan pertama, untuk menyerlahkan kontur/geometri), tetapi ia mesti belajar memilih objek dan kemudian mengenalinya sendiri.

  • Dan, akhirnya, membina sapuan (berdasarkan mata 1,4, iaitu peta spatial dengan mengambil kira metrik) dalam masa (buat masa ini, pada peringkat tempoh yang nampaknya diperhatikan secara langsung ini), untuk menjalankan analisis mengikut mata 2 -4, dengan untuk mengenal pasti: proses/peristiwa (yang pada asasnya perubahan dalam langkah masa 3) dan klasifikasi kelompok mereka (langkah 4).

Sekali lagi: daripada imej daripada penderia, kami mula-mula mengekstrak perihalan dunia dalam bentuk yang lebih disediakan, ditandakan mengikut ciri yang diekstrak dan dibahagikan bukan kepada piksel, tetapi kepada objek. Kemudian kita mengembangkan dunia yang terdiri daripada objek dalam masa dan diterima "gambar dunia" kami menyuapnya ke input rangkaian seterusnya, yang berfungsi dengannya dengan cara yang sama lapisan sebelumnya berfungsi dengan imej deria. Apabila kontur objek diserlahkan, "kontur" proses yang sedang berjalan kini akan diserlahkan. Kedudukan relatif objek dalam ruang adalah serupa dengan hubungan sebab-akibat proses dalam masa... Sesuatu seperti itu.

Mungkin, selepas ini, sistem sepatutnya dapat mengenali proses mengikut bahagiannya (kerana ia dapat mengenali imej, hanya mempunyai serpihannya, atau sebagai menulis sambungan teks mengikut model), dan sebagai akibatnya, ramalkan kedua-duanya ke hadapan dan ke belakang dalam masa, mengembangkan model langkah 5 tanpa had dalam kedua-dua arah. Juga, mungkin, mempunyai idea tentang proses konstituen, sistem boleh mengenal pasti, daripada beberapa proses tempatan yang berkaitan, proses global yang lebih besar dan, sebagai akibatnya, proses tersembunyi yang tersirat yang merupakan sebahagian daripada proses global yang dikenal pasti, tetapi tidak langsung dirasakan.

Dan perkara terakhir: mempunyai keadaan sistem yang tetap pada masa hadapan (di mana hanya elemen penting metrik Hilbert ditetapkan, dengan tafsiran percuma bagi baki nilai yang tidak penting) - adalah rangkaian yang mampu "memikirkan" berehat?

Nah, begitulah. jika ia adalah imej yang hanya dua serpihan yang tidak berkaitan diberikan, bolehkah rangkaian yang dilatih pada beberapa sampel melengkapkan imej lengkap "konsisten"? Sampel dalam kes ini adalah selang masa yang sama dari pengalaman, serpihan adalah keadaan semasa dan dinyatakan. Hasilnya: "cerita" yang konsisten menghubungkan satu dengan yang lain...

Nampaknya saya ini sudah menjadi asas yang agak penting untuk eksperimen selanjutnya:

  • kemasukan tindakan sendiri dalam "sejarah", jika boleh / perlu
  • keutamaan pola sebab-akibat "semula jadi" berbanding pelepasan stokastik yang tidak terkawal (masalah roulette)
  • beberapa versi rasa ingin tahu, i.e. kognisi aktif corak melalui tindakan... dsb

PS Saya mengakui sepenuhnya bahawa saya baru mencipta roda, dan orang yang berpengetahuan telah menggunakan prinsip ini dalam amalan untuk masa yang lama. πŸ˜‰ Dalam kes ini, saya meminta anda untuk "mencucuk hidung anda" ke dalam perkembangan yang berkaitan. Dan ia akan menjadi sangat indah jika terdapat penerangan terperinci tentang masalah asas pendekatan ini atau justifikasi mengapa ia tidak berfungsi pada dasarnya.

PPS Saya sedar bahawa teks itu kasar, dan idea itu melompat dari satu sama lain, tetapi saya benar-benar ingin bertanya kepada beberapa orang soalan ini (bahagian "soalan kepada pakar"), dan ini sukar dilakukan tanpa di sekurang-kurangnya beberapa pembentangan. Teks lalu (dan saya sedang membacanya semula sekarang, dan menyedari bahawa ia sangat sukar untuk difahami) ia memenuhi tujuannya: Saya menerima beberapa perbincangan yang berharga bagi saya... Saya harap kali ini juga berkesan! πŸ˜‰

Sumber: www.habr.com

Tambah komen