Mike Tika melukis potret orang yang tidak ada. Namun, dia tidak menggunakan kuas untuk ini, tetapi "khayalan" rangkaian saraf.
Saya berminat dengan wajah orang, anda boleh membaca banyak di dalamnya. Saya terpesona dengan projek ini, kerana saya suka merenungkan siapa orang-orang ini sekiranya mereka benar-benar wujud.
Mike menghabiskan kira-kira sembilan bulan untuk mengembangkan projek Potret Orang Imajiner, yang mengikuti Inceptionism dan Groovik's Cube.
GAN, rangkaian musuh generatif
Dalam projeknya, Mike menggunakan rangkaian permusuhan generatif (GAN):
Saya mula bereksperimen dengan GAN dalam pemasangan yang saya lakukan dengan Refik Anadol, di mana kami menggunakan teknik ini untuk menghasilkan dokumen sejarah khayalan dari arkib besar. Setelah menyelesaikan projek, saya melihat potret menggunakan kaedah ini.
Video promosi:
Katakan anda mahu GAN menggambarkan kucing. Untuk memulakan, anda memerlukan sejumlah besar foto kucing. Selepas itu, anda mesti menyediakan model untuk membuat gambar kucing, yang akan mempertimbangkan semua ciri haiwan: misai, cakar, ekor. Sama seperti set data asas untuk pembelajaran mesin, Mike menggunakan kira-kira 20,000 gambar berkualiti tinggi dari Flickr.
Tetapi ini hanya langkah pertama. Untuk mendapatkan imej kucing yang realistik dan bukan lakaran digital, anda perlu membuat rangkaian saraf kedua yang dikenali sebagai diskriminator. Walaupun rangkaian saraf pertama (penjana) akan membuat gambar kucing, yang kedua (pembeza) akan memeriksa karya pertama dengan gambar kucing yang sebenar dan mengetahui sama ada ia boleh dipercayai. Berdasarkan hasilnya, sistem menyesuaikan parameter generator untuk menjadikan gambar output lebih realistik.
Sekiranya anda hanya menggunakan satu rangkaian, maka ukuran gambar output akan berkisar antara 128 × 128 hingga 256 × 256 piksel. Untuk meningkatkan ukuran gambar, anda perlu mengumpulkan beberapa GAN yang disediakan secara berasingan sehingga tahap seterusnya adalah pembeza dari yang sebelumnya. Langkah ini akan dapat meningkatkan kualiti gambar, dan ukurannya akan berbeza antara 768 × 768 dan 1024 × 1024 piksel.
Pada akhirnya, Mike ingin menghasilkan foto 4K, tetapi pada masa ini sukar baginya untuk mencari set data untuk melatih sistem:
GAN sukar dilatih dan sukar dikawal. Anda perlu memantau data input dengan teliti, pastikan semua gambar beresolusi tinggi, tidak mempunyai artifak dan tidak dilukis. Adalah sukar untuk membandingkan larian yang berbeza dengan parameter yang berbeza kerana tidak ada petunjuk stabil dan baik untuk prestasi rangkaian tertentu. Dan imej output memerlukan masa yang sangat lama untuk dibina. Tetapi projek saya dibuat bukan demi hasil atau petunjuk yang tepat, tetapi terutama untuk kepentingan seni, yang seharusnya memberi inspirasi dan membuat anda berfikir.
Dmitry Alexandrov