Para Saintis Telah Melatih Rangkaian Saraf Untuk Menentukan Jenis Kelamin Seseorang Dari Teks Bertulis - Pandangan Alternatif

Para Saintis Telah Melatih Rangkaian Saraf Untuk Menentukan Jenis Kelamin Seseorang Dari Teks Bertulis - Pandangan Alternatif
Para Saintis Telah Melatih Rangkaian Saraf Untuk Menentukan Jenis Kelamin Seseorang Dari Teks Bertulis - Pandangan Alternatif

Video: Para Saintis Telah Melatih Rangkaian Saraf Untuk Menentukan Jenis Kelamin Seseorang Dari Teks Bertulis - Pandangan Alternatif

Video: Para Saintis Telah Melatih Rangkaian Saraf Untuk Menentukan Jenis Kelamin Seseorang Dari Teks Bertulis - Pandangan Alternatif
Video: Kemungkinan jenis kelamin pada manusia (Hereditas Manusia) 2024, Mungkin
Anonim

Sekumpulan saintis dari Universiti Penyelidikan Nuklear Nasional "MEPhI", Pusat Penyelidikan Nasional "Institut Kurchatov" dan Universiti Negeri Voronezh telah mengembangkan kaedah yang mengajar komputer untuk mengenali jantina seseorang dari teks yang ditulis olehnya dengan ketepatan 80 peratus. Perkembangan ilmiah tergolong dalam bidang linguistik komputasi. Penyelidikan ini dilakukan dengan bantuan dari Yayasan Sains Rusia. Hasilnya diterbitkan dalam jurnal Procedia Computer Science.

Banyak kajian ilmiah menunjukkan bahawa teks yang ditulis pasti menggambarkan ciri-ciri pengarangnya - jantina, ciri psikologi, tahap pendidikan. Ucapan adalah alat psikodiagnostik berharga yang digunakan oleh pakar sumber manusia syarikat besar, serta perkhidmatan keselamatan.

Berdasarkan analisis pertuturan, adalah mungkin untuk mendiagnosis kehadiran penyakit tertentu pada seseorang (demensia, kemurungan) dan kecenderungan melakukan tingkah laku bunuh diri. Keperluan untuk menetapkan ciri-ciri pengarang teks juga bertambah dengan perkembangan komunikasi Internet: penting bagi syarikat untuk mengetahui kumpulan orang mana yang menyukai produk dan perkhidmatan mereka.

Para saintis yang bekerja ke arah ini (ahli bahasa, psikologi, pakar teknologi maklumat), berdasarkan nilai berangka dari pelbagai parameter teks, membina model matematik untuk mendiagnosis parameter keperibadian tertentu.

Sekumpulan pakar menganalisis keberkesanan pelbagai teknologi pembelajaran mesin menggunakan rangkaian saraf untuk analisis teks.

Dalam kajian ini, mereka membandingkan ketepatan menyelesaikan masalah pengenalan jantina teks berdasarkan dua pendekatan untuk pemodelan berasaskan data: di satu pihak, algoritma pembelajaran mesin (sokongan mesin vektor dan peningkatan gradien), di sisi lain, rangkaian saraf pembelajaran mendalam (rangkaian saraf konvolusional dan rangkaian saraf berulang dengan ingatan jangka pendek yang panjang).

Kami telah mencapai hasil yang tinggi dalam menentukan jantina pengarang teks berkat model rangkaian neural yang maju, dalam keadaan ketika penulis tidak menyembunyikan jantina. Tugas seterusnya adalah menentukan jantina dari segi penyembunyiannya yang disengajakan,”kata Alexander Sboev, profesor bersekutu di NRNU MEPhI.

Oleh itu, dalam teks berikut, yang dimuat pada awalnya di laman web temu janji, rangkaian saraf dengan mudah menemui sepuluh dari sepuluh kes, apalagi, penulis dengan sengaja memasukkan nama lawan jenis dalam tanda tangan.

Video promosi:

Teks itu ditulis oleh seorang gadis: “Saya seorang lelaki tampan dan berotot 30 tahun. Saya bekerja untuk syarikat minyak dan gas yang besar dalam kedudukan yang baik dengan gaji yang lumayan. Saya tinggal di apartmen saya sendiri di Moscow. Tempat penginapan ini juga mempunyai rumah kecil tetapi cantik di salah satu kampung di Itali. Saya gemar sukan, khususnya bola sepak. Saya suka keluar pada hujung minggu, saya benci tinggal di rumah. Seorang gadis yang sesuai dengan saya semestinya mempunyai sikap sederhana, tampan dan sosok yang menarik mengikut standard moden. Dia harus berkongsi minat saya, tidak boleh cemburu, dan tidak boleh membuat saya merasa cemburu. Saya tidak akan menyokong gadis itu, kerana saya percaya bahawa kedua-duanya harus bekerja dalam keluarga. Saya juga lebih suka menyimpan anggaran secara berasingan. Saya tidak akan bertolak ansur dengan pengkhianatan."

Teks itu ditulis oleh seorang lelaki: "Halo! Saya sangat tidak gembira, sangat! Mengapa anda bersikap seperti itu dengan kami ?! Kita juga orang, kita semua sama! Adakah anda seksis? Saya tidak akan mengambil ini lagi! Saya akan memecahkan kereta anda di seluruh tempat, cat. Tunggu, tidak berperikemanusiaan. Saya akan menyelesaikannya dengan cara ini."

Hasil kajian ini menunjukkan bahawa pendekatan berdasarkan penggunaan rangkaian saraf konvolusional dan kaedah pembelajaran mendalam untuk mengenali jantina orang yang menulis teks adalah yang paling optimum.

Kini sekumpulan penyelidik sedang mengusahakan masalah pengecaman usia.

Disyorkan: