Rangkaian Saraf Diajar Untuk "menghidupkan" Potret Berdasarkan Hanya Satu Gambar Statik - Pandangan Alternatif

Video: Rangkaian Saraf Diajar Untuk "menghidupkan" Potret Berdasarkan Hanya Satu Gambar Statik - Pandangan Alternatif

Video: 5 причин стать 2D аниматором игр | Как создать анимацию для игры? 2024, Mungkin

2024 Pengarang: Keith Bush | [email protected]. Diubah suai terakhir: 2023-12-16 14:33

Pakar Rusia dari Samsung AI Center-Moscow Center for Artificial Intelligence, bekerjasama dengan jurutera dari Institut Sains dan Teknologi Skolkovo, telah mengembangkan sistem yang mampu membuat gambar animasi wajah manusia yang realistik berdasarkan hanya beberapa kerangka manusia statik. Biasanya, dalam hal ini, penggunaan gambar pangkalan data yang besar diperlukan, namun, dalam contoh yang dikemukakan oleh para pembangun, sistem ini dilatih untuk membuat gambar animasi wajah manusia dari hanya lapan bingkai statis, dan dalam beberapa kes satu itu cukup. Untuk maklumat lebih lanjut mengenai pembangunan, lihat artikel yang diterbitkan di repositori dalam talian ArXiv.org.

Sebagai peraturan, agak sukar untuk menghasilkan semula modul fotorealistik yang diperibadikan wajah manusia kerana kerumitan fotometrik, geometri dan kinematik yang tinggi dalam menghasilkan semula kepala manusia. Ini dijelaskan bukan hanya dengan kerumitan pemodelan wajah secara keseluruhan (untuk ini terdapat sebilangan besar pendekatan pemodelan), tetapi juga oleh kerumitan pemodelan ciri-ciri tertentu: rongga mulut, rambut, dan sebagainya. Faktor yang merumitkan kedua adalah kecenderungan kita untuk menangkap kekurangan kecil dalam model kepala manusia yang sudah siap. Toleransi yang rendah terhadap kesalahan pemodelan ini menjelaskan kelaziman avatar non-fotorealistik semasa yang digunakan dalam telekonferensi.

Menurut pengarang, sistem yang disebut Fewshot learning ini mampu mencipta model yang sangat realistik mengenai kepala orang yang bercakap dan bahkan lukisan potret. Algoritma mensintesis gambar kepala orang yang sama dengan garis rujukan wajah yang diambil dari serpihan video yang lain, atau menggunakan titik rujukan wajah orang lain. Sebagai sumber bahan untuk melatih sistem, para pembangun menggunakan pangkalan data yang luas untuk gambar video selebriti. Untuk mendapatkan kepala bercakap yang paling tepat, sistem perlu menggunakan lebih daripada 32 gambar.

Untuk membuat gambar wajah animasi yang lebih realistik, para pembangun menggunakan perkembangan sebelumnya dalam pemodelan lawan generatif (GAN, di mana rangkaian saraf memikirkan perincian gambar, sebenarnya, menjadi artis), serta pendekatan meta-pembelajaran mesin, di mana setiap elemen sistem dilatih dan dirancang untuk menyelesaikan beberapa tugas tertentu.

Skema meta-pembelajaran.

Video promosi:

Tiga rangkaian saraf digunakan untuk memproses gambar statik kepala orang dan mengubahnya menjadi animasi: Embedder (network implementasi), Generator (generasi generasi) dan Discriminator (diskriminator network). Yang pertama membahagikan gambar kepala (dengan tanda tempat wajah hampir) ke vektor penyisipan, yang mengandungi maklumat yang tidak bergantung pada pose, rangkaian kedua menggunakan tanda muka wajah yang diperoleh oleh rangkaian penyisipan dan menghasilkan data baru berdasarkannya melalui sekumpulan lapisan konvolusional yang memberikan ketahanan terhadap perubahan skala, perpindahan, selekoh, perubahan sudut dan penyelewengan lain dari gambar wajah asal. Diskriminasi rangkaian digunakan untuk menilai kualiti dan keaslian dua rangkaian lain. Hasilnya, sistem ini mengubah mercu tanda wajah seseorang menjadi foto peribadi yang kelihatan realistik.

Pembangun menekankan bahawa sistem mereka dapat menginisialisasi parameter rangkaian penjana dan rangkaian diskriminasi secara individu untuk setiap orang dalam gambar, sehingga proses pembelajaran dapat didasarkan pada hanya beberapa gambar, yang meningkatkan kelajuannya, walaupun perlu memilih puluhan juta parameter.

Nikolay Khizhnyak

Disyorkan:

"Mereka Berkata Kepada Saya:" Saya Mengajar Anak Saya Membaca Sejak Usia 2 Tahun ", - Dan Saya Menjawab: &Ldquo; Sungguh Bodoh &Rdquo; ", - Tatiana Chernigovskaya

Dalam beberapa tahun kebelakangan ini, trend berikut dapat dikesan: anak-anak mulai belajar menulis dan membaca hampir dari buaian. Ramai ibu bapa mengajar anak mereka dari usia dua tahun apa yang mereka sendiri pelajari pada usia 5. Tetapi adakah ini tidak menyakitkan anak?

Notre Dame De Paris Terbakar &Ldquo; Vikings &Rdquo;, &Ldquo; Greek Kuno &Rdquo; Dan Secara Amnya Keseluruhan &Ldquo; Kronologi Rasmi - Paparan Alternatif

Sepanjang abad ke-19 dan ke-20, kepala semua orang yang waras di dunia, termasuk sejarawan rasmi yang mengajar di universiti, diseksa oleh pemikiran menghujat dan liar: bagaimana orang Mesir kuno berjaya membina piramid di Giza? Banyak megalitik kuno yang lain menimbulkan persoalan serupa, kerana teori pasukan gajah dan kumpulan hamba tidak berjaya

Kementerian Telekomunikasi Dan Komunikasi Massa Menerbitkan Untuk Perbincangan Rancangan Undang-undang Mengenai Profil Digital Warganegara Dan Entiti Undang-undang - Pandang

Rang undang-undang mengenai pindaan terhadap tindakan perundangan tertentu (dalam hal menjelaskan prosedur pengenalan dan pengesahan), yang memperkenalkan konsep profil digital warganegara dan entiti undang-undang, diterbitkan pada hari Isnin untuk perbincangan umum

Dasar Privasi untuk greatplainsparanormal.com

Rangkaian Saraf Diajar Untuk "menghidupkan" Potret Berdasarkan Hanya Satu Gambar Statik - Pandangan Alternatif

Video: Rangkaian Saraf Diajar Untuk "menghidupkan" Potret Berdasarkan Hanya Satu Gambar Statik - Pandangan Alternatif

Disyorkan:

"Mereka Berkata Kepada Saya:" Saya Mengajar Anak Saya Membaca Sejak Usia 2 Tahun ", - Dan Saya Menjawab: &Ldquo; Sungguh Bodoh &Rdquo; ", - Tatiana Chernigovskaya

Notre Dame De Paris Terbakar &Ldquo; Vikings &Rdquo;, &Ldquo; Greek Kuno &Rdquo; Dan Secara Amnya Keseluruhan &Ldquo; Kronologi Rasmi - Paparan Alternatif

Kementerian Telekomunikasi Dan Komunikasi Massa Menerbitkan Untuk Perbincangan Rancangan Undang-undang Mengenai Profil Digital Warganegara Dan Entiti Undang-undang - Pandang

Dasar Privasi untuk greatplainsparanormal.com

Seorang Petani India Telah Mencipta Jagung Pelbagai Warna Yang Unik - Pandangan Alternatif

Bagaimana Di USSR Mereka Mencipta "rumah Pintar", Jam Tangan Pintar Dan Analog Google Glass - Pandangan Alternatif

Tangan Ringan - Pandangan Alternatif

The Lost Lemurian (mengenai Count Saint-Germain Yang Misteri) - Pandangan Alternatif

Snowden Mendedahkan Data UFO - Pandangan Alternatif

Phobos Ternyata Bukan Asteroid, Tetapi Bangkai Kapal Marikh - Pandangan Alternatif

Para Saintis Memberitahu Apa Yang Akan Berlaku Di Bumi Dalam 100 Tahun - Pandangan Alternatif

"Raksasa Kurus Dengan Cakar Panjang Datang Kepada Saya Pada Waktu Malam" - Pandangan Alternatif

Pembetung Hantu - Pandangan Alternatif

Meteorit Kanada Dengan Hieroglif Luar Angkasa - Pandangan Alternatif

Pushkin. Pemain Sebenar - Pandangan Alternatif

Tsar Cannon: Siapa Dia Menembak - Pandangan Alternatif

Menjelang 2040, Kecerdasan Buatan Dapat Merevolusikan Prinsip Keselamatan Nuklear - Pandangan Alternatif

Siapa Yang Membayar Hutang Pushkin - Pandangan Alternatif

10 Tempat Berhantu Teratas Di Dunia - Pandangan Alternatif