Rangkaian Saraf Telah Belajar Menghasilkan Video Berdasarkan Keterangan - Pandangan Alternatif

Rangkaian Saraf Telah Belajar Menghasilkan Video Berdasarkan Keterangan - Pandangan Alternatif
Rangkaian Saraf Telah Belajar Menghasilkan Video Berdasarkan Keterangan - Pandangan Alternatif

Video: Rangkaian Saraf Telah Belajar Menghasilkan Video Berdasarkan Keterangan - Pandangan Alternatif

Video: Rangkaian Saraf Telah Belajar Menghasilkan Video Berdasarkan Keterangan - Pandangan Alternatif
Video: Perjalanan Menembus Sistem Sarafmu 2024, Mungkin
Anonim

Kepintaran buatan menghasilkan video berskrip - sejauh ini pendek dan kabur, tetapi suatu hari ia sendiri akan menggantikan keseluruhan studio filem.

Jaringan saraf sudah cukup baik (dan dalam banyak keadaan lebih baik daripada orang) dalam mengenali corak dalam gambar dan dapat menggambarkan secara umum keseluruhan pemandangan. Rangkaian neural generatif melakukan transformasi terbalik dan dapat membentuk gambar berdasarkan keterangannya, atau meramalkan bingkai seterusnya berdasarkan yang sebelumnya.

Pemaju Belgia telah melangkah lebih jauh, menggabungkan kemampuan ini ke dalam satu sistem yang membuat video "tidak ada apa-apa", berdasarkan pengalaman mereka sendiri tentang pembelajaran mesin dan teks skrip. Tinne Tuytelaars membicarakan hal ini dalam pertemuan Persatuan untuk Kemajuan Kepintaran Buatan (AAAI) yang diadakan di Amerika Syarikat.

Rangkaian saraf berfungsi dalam dua tahap - menurut Tinne, seolah-olah meniru proses kreatif seseorang: pada peringkat pertama, "lakaran" kabur yang hampir kabur dari setiap bingkai dibentuk, setelah itu perincian ditentukan dan ditambah. Salah satu bahagian penting dari sistem tersebut adalah rangkaian saraf yang diskriminatif, yang membandingkan hasilnya dengan video "nyata" yang sesuai dengan senario tertentu, dan membolehkan anda menilai kualitinya, meningkatkan kerja bahagian generatif sistem.

Jaringan saraf dilatih dalam 10 adegan ("bermain golf di rumput", "bermain layang-layang di laut", dll.) Dan belajar untuk memisahkan tindakan dan keadaan antara satu sama lain, dan juga dapat menggabungkannya dengan cara tertentu, membuat video, misalnya "Golf di kolam renang":

Image
Image

atau "belayar di salji":

Image
Image

Video promosi:

Sudah tentu, kualiti animasi seperti itu masih jauh dari yang boleh diterima: "video" berdurasi lebih kurang sesaat hanya terdiri daripada 32 bingkai dengan dimensi 64x64 piksel.

Tetapi dengan keyakinan yang sama adalah mungkin untuk menjamin bahawa angka-angka ini akan meningkat dengan cepat, kerana tidak lama dahulu bioskop itu sendiri hanya dapat membanggakan gambar yang berlumpur, berkedut dan bodoh. Sekiranya rangkaian neural seperti itu dapat dibuat dengan sangat pantas dan efisien, Hollywood mungkin akan berakhir: cukup untuk mengambil skrip dan filemnya sudah siap. Peluang ini akan berguna dalam menghasilkan set besar untuk melatih rangkaian saraf lain, dan dalam membuat algoritma baru untuk memampatkan dan menghantar video streaming.

Sergey Vasiliev

Disyorkan: