Rangkaian Saraf Telah Belajar Membaca Fikiran Dalam Masa Nyata. Apa? Tidak! - Pandangan Alternatif

Rangkaian Saraf Telah Belajar Membaca Fikiran Dalam Masa Nyata. Apa? Tidak! - Pandangan Alternatif
Rangkaian Saraf Telah Belajar Membaca Fikiran Dalam Masa Nyata. Apa? Tidak! - Pandangan Alternatif

Video: Rangkaian Saraf Telah Belajar Membaca Fikiran Dalam Masa Nyata. Apa? Tidak! - Pandangan Alternatif

Video: Rangkaian Saraf Telah Belajar Membaca Fikiran Dalam Masa Nyata. Apa? Tidak! - Pandangan Alternatif
Video: CARA MEMBACA PIKIRAN ORANG LAIN NYATA - 100% AMPUH DENGAN TULISAN.. 2024, Mungkin
Anonim

Beberapa hari yang lalu, portal preprint bioRxiv.org menerbitkan karya penyelidik Rusia dari Institut Fizik dan Teknologi Moscow dan syarikat Neurobotics dan Neuroassistive Technologies, yang terlibat dalam penciptaan antara muka neurokomputer. Makalah ini berpendapat bahawa saintis dan pemaju berjaya mengajar algoritma dalam masa nyata untuk menyusun semula video yang dilihat oleh seseorang yang menggunakan isyarat EEG. Kedengarannya sangat menarik dan menarik - hampir seperti membaca minda. Sebenarnya, semuanya, tentu saja, tidak begitu mudah: komputer belum belajar membaca pemikiran. Ringkasnya, komputer belajar dari rakaman EEG untuk menentukan gambar lima kelas yang berbeza sebelumnya yang dilihat subjek. Mengenai bagaimana eksperimen itu dibina, tugas apa yang ditetapkan oleh para saintis, dan mengapa membaca minda tidak mungkin dapat dilaksanakan dalam waktu terdekat, kami sampaikan di blog kami.

Image
Image

Secara umum, idea membaca isyarat elektrik otak dan menguraikannya supaya anda dapat melihat apa yang sedang difikirkan atau dilakukan seseorang pada waktu tertentu, memandangkan rentak kemajuan teknologi semasa, nampaknya tidak begitu sukar. Inilah isyarat, dan inilah maksud isyarat ini: tambah dua dan dua, latih pengkelas dan dapatkan hasil yang kami perlukan.

Hasilnya adalah apa yang disebut orang futuris dan orang bodoh sebagai "membaca minda." Dan sepertinya teknologi seperti itu boleh didapati dalam pelbagai aplikasi: dari antara muka neurokomputer yang sempurna yang membolehkan anda mengawal prostesis pintar, hingga membuat sistem yang akhirnya akan memberitahu anda apa yang kucing anda fikirkan di sana.

Sebenarnya, semuanya, tentu saja, sama sekali tidak mudah, dan idea untuk membuat algoritma seperti itu segera menerobos halangan utama: kita harus berurusan dengan otak. Otak, sebaliknya, adalah perkara yang sangat kompleks: ia mempunyai lebih daripada 80 bilion neuron, dan hubungan antara mereka adalah beberapa ribu kali lebih besar.

Walaupun bagi orang awam jelas: ini terlalu banyak bagi kita untuk memahami apa yang ditanggung oleh setiap sel dan agregat mereka. Para saintis belum menguraikan koneksi manusia - walaupun mereka berusaha melakukannya dengan kejayaan yang relatif.

Satu persoalan semula jadi timbul: adakah perlu sama sekali memahami fungsi setiap neuron agar dapat mewakili apa yang berlaku di otak dengan tepat? Adakah peta fungsional tidak cukup, misalnya?

Jawapan untuk soalan ini, sebenarnya, adalah "ya", tetapi di sini tidak begitu mudah. Sekiranya umat manusia bergantung pada penyahkodan sambungan sebagai satu-satunya kunci untuk membuka misteri otak, maka kita akan berada dekat sekarang. Namun, kita tahu sesuatu tentang bagaimana otak kita berfungsi dan, tentu saja, kita dapat menggunakannya dengan jayanya.

Video promosi:

Salah satu contoh paling terang dan paling jelas menggunakan pengetahuan yang dikumpulkan oleh saintis mengenai kerja otak, tentu saja, muka neurointerfaces. Secara umum, hari ini benar-benar ada teknologi yang membolehkan membaca aktiviti otak dan menggunakannya untuk mengawal, sebagai contoh, kursor tetikus komputer atau pergerakan prostesis.

Terdapat dua cara untuk mencapai operasi antara muka neural yang cekap. Kaedah pertama adalah potensi yang ditimbulkan: kita melihat lekukan aktiviti elektrik bahagian otak tertentu dan memilih perubahan itu pada isyarat yang, seperti yang kita tahu pasti, muncul pada saat tertentu setelah penyajian rangsangan.

Cara kedua adalah tidak bergantung pada rangsangan sama sekali, tetapi menggunakan imaginasi orang itu untuk menghasilkan isyarat elektrik yang dapat dibaca. Contohnya, seseorang mungkin diminta untuk membayangkan bagaimana mereka menggerakkan kaki atau lengan mereka.

Kedua-dua kaedah mempunyai kelemahan yang ketara. Yang pertama dihalangi oleh kenyataan bahawa jumlah potensi yang dapat dipercaya yang diketahui oleh kita tidak begitu besar: jumlah mereka tidak dapat benar-benar meliputi semua tindakan yang mungkin dilakukan oleh seseorang. Kelemahan yang kedua adalah bahawa latihan panjang diperlukan untuk mencapai sekurang-kurangnya beberapa kesan.

Pengarang preprint memutuskan untuk menggabungkan kedua-dua pendekatan untuk membuat antara muka neurokomputer, dengan betul mempercayai bahawa ini akan menyelamatkan kedua-dua kaedah dari batasan yang ketara dan memungkinkan mengembangkan kaedah baru dan paling berkesan untuk bekerja dengan muka neurointermasa hari ini.

Juga diandaikan bahawa kaedah ini akan ditutup (loop tertutup), iaitu, hasil yang diperoleh dengan bantuannya, pada gilirannya, akan mempengaruhi operasi algoritma. Tetapi lebih banyak lagi kemudian.

Pada awalnya, algoritma memecah semua gambar menjadi komponen-komponen yang terpisah, diedarkan di ruang vektor, dengan bantuan yang kemudiannya dapat dihubungkan dengan isyarat otak tertentu yang direkam menggunakan EEG.

Pada peringkat awal ini, pengkelasan binari digunakan - secara kasar, sangat "dua dan dua": mempunyai isyarat yang cukup bersih (rakaman EEG dibersihkan dari artifak motor), anda boleh memilih salah satu atau yang lain dengan ketepatan yang lebih tinggi daripada hit rawak.

Dalam eksperimen mereka, para saintis menggunakan video objek dari lima kelas: gambar orang, air terjun, bentuk geometri abstrak, sukan ekstrim dan kereta Goldberg. Di satu pihak, set seperti itu kelihatan aneh, tetapi di sisi lain, nampaknya semua objek ini sangat berbeza antara satu sama lain. Adakah terdapat persamaan antara wajah manusia dan bentuk geometri abstrak?

Sementara itu, menurut pengkelasan binari, angka abstrak dan wajah manusia tidak dapat dibezakan antara satu sama lain: hasil sembilan daripada 17 peserta kajian menunjukkan bahawa antara muka saraf, nampaknya, gagal membezakan antara mereka. Tetapi mesin Goldberg dan wajah yang sama, dari sudut pandangan otak, sebaliknya, berbeza antara satu sama lain.

Hasil klasifikasi. A - bentuk abstrak, W - air terjun, HF - wajah manusia, GM - Kereta Goldberg, E - sukan lasak
Hasil klasifikasi. A - bentuk abstrak, W - air terjun, HF - wajah manusia, GM - Kereta Goldberg, E - sukan lasak

Hasil klasifikasi. A - bentuk abstrak, W - air terjun, HF - wajah manusia, GM - Kereta Goldberg, E - sukan lasak.

Pada pandangan pertama, tidak begitu jelas mengapa ini berlaku: sebaliknya, mesin dan bentuk geometri yang sama tidak dapat dibezakan antara satu sama lain. Semuanya menjadi sedikit lebih jelas jika anda melihat contoh bingkai dari video yang digunakan.

Contoh gambar dari lima kelas
Contoh gambar dari lima kelas

Contoh gambar dari lima kelas.

Kemungkinan besar (kita, tentu saja, hanya dapat mengandaikan di sini), kejayaan pengkelasan bergantung pada seberapa banyak gambar yang digunakan dalam dua kelas berbeza antara satu sama lain dalam beberapa ciri asas, dangkal - pertama sekali, berwarna. Ini juga berkaitan dengan kenyataan bahawa dimensi ruang pendam dalam autoencoder adalah 10.

Secara amnya, untuk mengklasifikasikan gambar lima kelas, dimensi lima sudah cukup, tetapi dalam hal ini ia akan dilakukan dengan maksimum histogram warna - yang bermaksud bahawa dimensi 10 tidak akan bertambah baik dan akan menjelaskan hasilnya.

Tidak begitu jelas mengapa pengarang tidak menggunakan pengkelasan linear untuk lima kelas sekaligus dan bukan sepuluh pengkelasan binari: kemungkinan besar, ia lebih baik.

Kemudian muncul tahap pembinaan semula gambar yang dihasilkan. Fakta bahawa ia dilumurkan dapat difahami - intinya adalah dalam dimensi ruang laten yang sama. Tetapi di sini dua perkara mengelirukan.

Yang pertama adalah bahawa gambar yang asli dan yang dibina semula sangat serupa antara satu sama lain. Di sini, tentu saja, saya tidak mahu menyusahkan sesiapa (termasuk diri kita sendiri - kita masih dalam kemajuan), tetapi ini bukan disebabkan oleh kenyataan bahawa isyarat tersebut direkodkan dengan baik dan disahkod (dan bahkan dalam masa nyata!), Tetapi kerana fakta bahawa algoritma mengembalikan tepat gambar yang sudah ada.

Lebih-lebih lagi, ini tidak selalu berfungsi seperti yang kita mahukan: jika, sebagai contoh, anda melihat video pengoperasian sistem, anda akan melihat bahawa dalam video dengan seorang lelaki yang menangis, antara muka neural dengan sebab tertentu melihat seorang wanita. Ini kerana algoritma tidak menyusun semula gambar, tetapi objek dari kelas tertentu: walaupun ia cukup berkesan, tidak ada yang menghalang algoritma melihat perahu dalam gambar motosikal - hanya kerana mereka tergolong dalam kelas yang sama.

Oleh itu, apa yang muncul di skrin semasa pembinaan semula selalunya hanyalah gambar rata-rata dari semua objek kelas yang digunakan.

Mengenai kegunaan menggunakan sistem tertutup, maka semuanya tidak begitu jelas dengannya: ketika melakukan tugas, seseorang melihat rakaman isyarat EEG dan gambar secara beransur-ansur muncul dari kepalanya. Adakah ini benar-benar sukar - penulis tidak membandingkan prestasi antara muka dengan dan tanpa peneguhan. Tetapi pada pandangan pertama nampaknya tidak begitu. Sekiranya ia membantu, saya benar-benar ingin mengetahui caranya.

Secara amnya, kita dapat menyimpulkan bahawa komputer belum belajar membaca pemikiran. Dan mereka juga tidak belajar bagaimana membuat semula video tersebut. Semua yang telah mereka pelajari, berdasarkan karya saintis, adalah untuk mengklasifikasikan objek yang mereka lihat menjadi lima kelas berdasarkan beberapa kriteria asas. Adakah komputer dapat melakukan ini sebelum ini? Sudah tentu mereka boleh. Ada otak di sini? Sudah tentu ada: tetapi otak yang melihat, bukan otak yang memahami apa sebenarnya yang dilihatnya.

Elizaveta Ivtushok

Disyorkan: