Bagaimana Rahsia Manuskrip Voynich Dedahkan: Suatu Siasatan - Pandangan Alternatif

Isi kandungan:

Bagaimana Rahsia Manuskrip Voynich Dedahkan: Suatu Siasatan - Pandangan Alternatif
Bagaimana Rahsia Manuskrip Voynich Dedahkan: Suatu Siasatan - Pandangan Alternatif

Video: Bagaimana Rahsia Manuskrip Voynich Dedahkan: Suatu Siasatan - Pandangan Alternatif

Video: Bagaimana Rahsia Manuskrip Voynich Dedahkan: Suatu Siasatan - Pandangan Alternatif
Video: Manuskrip Voynich paling misterius sebentar lagi terpecahkan KOK BISA 2024, Mungkin
Anonim

Apa yang ada di sebalik berita sensasi mengenai manuskrip Voynich dan mengenai saintis Rusia, adakah mungkin untuk menentukan bahasa dari teks dengan tepat, bagaimana ahli matematik mencukupi dalam mengusahakan "bidang" linguistik.

Pada 19 April, media Rusia menyebarkan berita mengenai penemuan "zaman pembuatan" ahli matematik Rusia: para saintis yang menggunakan kaedah baru itu bukan sahaja membuktikan makna naskah "Voynich" yang terkenal, tetapi juga dapat menentukan bahawa ia ditulis dalam dua bahasa dan kecuali huruf untuk huruf vokal.

Manuskrip Voynich adalah manuskrip bergambar abad pertengahan yang dibeli pada tahun 1912 oleh Wilfred Voynich kuno. Dicipta pada abad ke-15 (berdasarkan analisis radiokarbon perkamen - tetapi kebanyakan sarjana pada masa ini tidak menganggap teks itu sendiri sebagai pemalsuan kemudian), ia ditulis dalam bahasa yang tidak diketahui menggunakan abjad yang tidak diketahui. Berdasarkan ilustrasi, teks terdiri daripada blok tematik: botani, astronomi, farmakologi dan lain-lain. Kerumitan penyahkodan teks menjadikan naskah Voynich sebagai "Holy Grail" bagi kriptografer dan objek banyak kajian, termasuk yang menggunakan kaedah Big Data.

Berita mengenai naskah tersebut dilaporkan sebagai sesuatu yang sensasional. Ini segera menimbulkan kebimbangan. "Sebelum itu, semua usaha untuk menguraikan dokumen yang unik dan hanya memahami sama ada teks bermakna gagal. Usaha yang tidak berguna selama 600 tahun!.. Kriptografer CIA dan NSA, superkomputer dan juga doktor "ilmu ghaib" menandatangani mati pucuk mereka. Catatan terbaru oleh pakar kriptologi Gordon Rugg dari Universiti Keele di UK berbunyi: “Manuskrip Voynich itu palsu. "Teks yang rumit" seperti itu mudah dibuat untuk sesiapa sahaja yang biasa dengan kaedah penyalinan yang mudah, "kata artikel itu.

Pertama, makna teks dikenali pada tahun 1970-an dan beberapa kali disahkan dalam kajian tahun 2010-an, yang ditulis secara terperinci walaupun di media domestik. Kedua, penemuan yang diserahkan kepada berita tersebut hanya disajikan dalam bentuk preprint institut, dan bukan dalam artikel dalam jurnal peer-review antarabangsa (praprint juga diterbitkan pada tahun 2016).

Keanehan dalam penyampaian materi ini memaksa kami untuk meminta penjelasan terlebih dahulu dari pengarang kajian, dan kemudian kepada pakar bebas - ahli bahasa yang bekerja dengan kaedah statistik dan matematik, serta penyahkodan skrip kuno.

Sangat mudah untuk menulis formula, tetapi sangat mahal untuk menjalankan analisis berangka

Video promosi:

Pertama, secara ringkas mengenai intipati kajian. Pengarang preprint, ahli matematik dari Institut Fizik dan Teknologi Moscow dan Institut Matematik Gunaan Akademi Sains Rusia, bergantung pada karya mereka, yang mana "sebaran frekuensi simbol teks adalah ciri stabil bukan pengarang atau subjek teks, tetapi bahasa." Maksudnya, dengan menggunakan satu set menggunakan alat matematik, adalah mungkin untuk menentukan bahasa yang ditulisnya, kerana setiap bahasa mempunyai ciri "profil" tersendiri (sebaran Hurst eksponen). Selanjutnya, dengan menggunakan kaedah ini sebagai dasar, para saintis menetapkan bahawa teks naskah ditulis dalam campuran beberapa bahasa. Pada waktu yang sama, ruang palsu ditambahkan ke dalamnya dan simbol yang menunjukkan bunyi vokal dikeluarkan.

Pengarang utama kajian ini, Yuri Orlov (IPM RAS dan MIPT), menekankan bahawa manuskrip Voynich sama sekali bukan tujuan utama karya mereka. "Manuskrip 'sensasi' hanyalah gambaran kaedah matematik untuk mengenali bahasa dari teks - sebenarnya masalah untuk pembelajaran mesin," kata Orlov.

Manuskrip itu sendiri sama sekali tidak menarik bagi kita. Sains merujuk secara khusus kepada statistik bahasa. Melaluinya, kita dapat memahami dalam bahasa apa manuskrip ini ditulis. Tetapi bukan apa yang ditulis di sana, ini adalah perkara penting. - Yuri Orlov. MIPT dan Institut Matematik Gunaan dinamakan M. V. Keldysh

Mengenai kaedah linguistik yang digunakan dalam karya, Orlov menyatakan bahawa analisis kekerapan gabungan huruf dalam teks itu sendiri adalah perkara yang terkenal. Walau bagaimanapun, penunjuk Hurst kurang dikenali oleh ahli bahasa, kerana sukar untuk dikira walaupun dalam istilah matematik. Rumus itu sendiri mudah ditulis, tetapi analisis berangka sangat mahal. Untuk ini, komputer super yang terletak di Institut dinamakan M. V. Keldysh, ahli matematik menekankan.

Pilihan bahasa Indo-Eropah untuk analisis dijelaskan oleh fakta bahawa semuanya sangat serupa, kata Orlov. Petunjuk yang dikembangkan oleh ahli matematik memudahkan untuk membezakan bahasa dalam kumpulan bahasa yang sama, tetapi tidak antara keluarga. Sudah tentu, secara teorinya mungkin untuk melakukan kerja yang sama dengan kumpulan lain (Ural, Altai atau yang lain), tetapi nilai analisisnya terletak pada kelengkapannya, Orlov pasti. Bagi bahasa Indo-Eropah, tidak sukar untuk mengetik korpus teks untuk setiap bahasa; lebih sukar untuk melakukannya dengan keluarga lain.

Kembali ke manuskrip Voynich, Orlov menyatakan bahawa dia dan rakan-rakannya memetik lima bukti (profil logaritma kekerapan susunan huruf dalam teks dalam satu dan beberapa bahasa, penyebaran eksponen Hurst, potret spektrum matriks kemungkinan bersyarat, dan lain-lain) hipotesis mengenai campuran bahasa dalam manuskrip dan penghapusan huruf untuk vokal. Mereka dengan tegas menjauhkan diri dari "hangout sekitar manuskrip", tetapi memberikan hasil yang unik - kaedah terbuka, analisis statistik dengan penilaian kebolehpercayaan yang dapat disahkan secara bebas.

Kesimpulannya disusutkan oleh fakta bahawa kita tidak memahami bahan apa yang mereka hasilkan dan apa - mereka memeriksa formula mereka

Anggapan bahawa teks manuskrip Voynich tidak mempunyai huruf untuk huruf vokal, dengan jarak yang tidak betul cantik dan bagus, kata ahli bahasa Evgenia Korovina, yang terlibat dalam statistik matematik bahasa (Institut Linguistik, Akademi Sains Rusia). Sebelum ini, tidak ada yang mengemukakan hipotesis seperti itu. Dia, misalnya, menjelaskan dengan indah mengapa terdapat lebih sedikit huruf daripada yang diharapkan untuk teks Eropah. Tetapi masalahnya adalah bahawa pengarang kajian itu tidak menunjukkan teks mana dalam bahasa yang berbeza yang mereka bandingkan dan berapa jumlah ujian ini. Sebilangan besar bahasa disebut dalam praketak. Oleh itu, kajian ini tidak dapat diterbitkan semula: jika anda mengambil teks sewenang-wenang dalam bahasa yang sama, bukan fakta bahawa corak yang sama akan keluar.

Maria Molina, pakar dalam kaedah korpus dalam kajian bahasa kuno (Institut Linguistik, RAS), bersetuju dengan Korovina. Kaedah baru memproses data linguistik, menurutnya, membantu mendapatkan maklumat mengenai apa yang sebelumnya ditutup kepada penyelidik bahasa. Walau bagaimanapun, bahan input yang tidak disiapkan dengan baik sering merugikan bahkan teknik pemprosesan data terbaik.

Kesimpulannya disusutkan oleh fakta bahawa kita tidak memahami bahan apa yang mereka lukiskan dan apa yang mereka periksa formula mereka. Untuk bahan saya, saya tahu pasti bahawa terdapat ralat metodologi kecil - dan saya mendapat nombor yang sangat berbeza. - Maria Molina. Institut Linguistik RAS

"Sampah masuk - sampah keluar," tambah Molina (GIGO adalah prinsip dalam sains komputer yang bermaksud bahawa data input yang salah akan menghasilkan hasil yang salah, walaupun algoritma itu sendiri betul, - perhatikan Indicator. Ru).

Kaedah statistik masih petunjuk hasil, bukan hasil

Albert Davletshin (pegawai Pusat Kajian Perbandingan Linguistik Institut Kajian Perbandingan Universiti Kemanusiaan Negeri Rusia, mempelajari bahasa Maya dan Polinesia) bercakap dengan lebih tajam. Sekiranya pengarang pracetak tidak akan menguraikan naskah Voynich, mengapa mereka melakukannya? Dan lebih jauh lagi, jika kita berbicara secara khusus mengenai penyahkodan skrip yang tidak diketahui, timbul pertanyaan demi pertanyaan: “Tidak ada data awal tentang penulisan - jenis surat apa? Bagaimana transkripsi yang berbeza diperoleh? Berapa watak? Apa yang mendasari andaian yang ada mengenai sifat penulisan? Berapakah panjang perkataan yang dipisahkan dengan ruang dan tanpa ruang? Apa maksud ruang? Berapa besar kamus? Berapakah nisbah tandatangan dan gambar?

Pada mulanya, ternyata teksnya adalah bahasa Denmark dan hanya bahasa Denmark (dan ini tidak mungkin secara historis, yang tidak ada perkataan dalam karya itu). Kemudian ternyata teksnya dalam dua bahasa yang tidak diketahui (pengesahan pada tahap ini ternyata mustahil dan diambil berdasarkan kepercayaan). Lebih-lebih lagi, terdapat banyak cara konservatif untuk menunjukkan bahawa dua halaman (besar) ditulis dalam satu huruf, tetapi dalam bahasa yang berlainan, tanpa menggunakan model matematik yang kompleks. Akhirnya, jika huruf vokal dikeluarkan dari teks, berapa banyak yang disahkan oleh kaedah standard yang sudah lama dikenali (contohnya, oleh Sukhotin, Shevoroshkin dan Ventris)?"

Davletshin juga mengkritik ketidakpekaan terhadap filologi dan sejarah, ciri penyelidikan seperti ini:

Apa yang saya lihat dalam teks: sering kali ada orang yang ingin mengambil sumber X dan lupa bahawa ia adalah sumber dan wujud dalam beberapa sejarah, termasuk linguistik, konteks, dan entah bagaimana menghitung sesuatu di dalamnya. Hipotesis bahawa terdapat lebih daripada satu bahasa dalam manuskrip menarik. Tetapi anda boleh menunjukkannya secara manusiawi. Kaedah statistik masih merupakan petunjuk hasil, bukan hasil. -Albert Davletshin. Pusat Kajian Perbandingan Linguistik, IVKA RSUH

Tidak ada kriteria untuk membezakan hasil yang menarik dari yang buruk

Kedudukan yang lebih seimbang diambil oleh Georgy Starostin, seorang pakar linguistik sejarah perbandingan (RSUH). Dia lebih berminat dengan kaedah matematik baru yang berguna untuk menyelesaikan masalah yang dihadapi oleh ahli bahasa. “Model yang disajikan dalam artikel itu membuat kesan aneh. Di satu pihak, nampaknya tergolong dalam kategori "buta", menganalisis data teks tanpa penilaian awal mengenai struktur abjad (misalnya, digraf, seperti bahasa Inggeris ch, sh, harus dianggap sebagai kombinasi dua huruf, walaupun sebenarnya ini salah satu bunyi). Sebaliknya, huruf vokal dilemparkan dari rentetan yang dibandingkan, yang menurut penulis teks, mengandungi lebih sedikit maklumat dan lebih sedikit menambahkan kebisingan. Secara amnya, asas ujian jelas sangat kecil, mustahil untuk membicarakan sesuatu yang mendasar dalam begitu banyak bahasa."

Hasil perbandingan bahasa Indo-Eropah dan Uralic, yang dibentangkan dalam jadual perbandingan 3 dalam artikel itu, tidak mendorong optimisme tertentu dalam Starostin. Beberapa petunjuk tahap kedekatan bahasa ditangkap dengan baik (contohnya, hubungan intra-Jermanik atau intra-Romanesque), ada yang kurang baik (misalnya, metodologi tidak lagi mengenal pasti keluarga Indo-Eropah). Perkara utama adalah bahawa tidak ada kriteria untuk membezakan hasil yang menarik dari yang buruk. Dalam kes terbaik, kaedah ini memungkinkan untuk memisahkan kumpulan linguistik kecil (walaupun walaupun di sini ia tidak berfungsi antara Finlandia dan Estonia yang berkait rapat), tetapi semua kumpulan ini dapat dikenal pasti tanpa adanya.

Jadual 3 dari preprint, yang membentangkan hasil membandingkan bahasa Indo-Eropah dan Uralic. Warna yang sama dalam jadual. 3 kumpulan bahasa dikenal pasti yang berpasangan dekat (dalam arti norma L1 pengedaran frekuensi teratur dalam teks tanpa vokal). Beberapa pasangan bahasa yang hampir tidak dijangka ditandai dengan warna merah, seperti Jerman / Hungary, Inggeris / Estonia, Latin / Basque, dan Yunani / Finland. Pengarang pracetak: Arutyunov A. A., Borisov L. A., Zenyuk D. A., Ivchenko A. Yu., Kirina-Lilinskaya E. P., Orlov Yu. N., Osminin K. P., Fedorov S. L., Shilin S. A
Jadual 3 dari preprint, yang membentangkan hasil membandingkan bahasa Indo-Eropah dan Uralic. Warna yang sama dalam jadual. 3 kumpulan bahasa dikenal pasti yang berpasangan dekat (dalam arti norma L1 pengedaran frekuensi teratur dalam teks tanpa vokal). Beberapa pasangan bahasa yang hampir tidak dijangka ditandai dengan warna merah, seperti Jerman / Hungary, Inggeris / Estonia, Latin / Basque, dan Yunani / Finland. Pengarang pracetak: Arutyunov A. A., Borisov L. A., Zenyuk D. A., Ivchenko A. Yu., Kirina-Lilinskaya E. P., Orlov Yu. N., Osminin K. P., Fedorov S. L., Shilin S. A

Jadual 3 dari preprint, yang membentangkan hasil membandingkan bahasa Indo-Eropah dan Uralic. Warna yang sama dalam jadual. 3 kumpulan bahasa dikenal pasti yang berpasangan dekat (dalam arti norma L1 pengedaran frekuensi teratur dalam teks tanpa vokal). Beberapa pasangan bahasa yang hampir tidak dijangka ditandai dengan warna merah, seperti Jerman / Hungary, Inggeris / Estonia, Latin / Basque, dan Yunani / Finland. Pengarang pracetak: Arutyunov A. A., Borisov L. A., Zenyuk D. A., Ivchenko A. Yu., Kirina-Lilinskaya E. P., Orlov Yu. N., Osminin K. P., Fedorov S. L., Shilin S. A.

Akhirnya, untuk menentukan ciri genetik bahasa dengan penyebaran eksponen Hurst adalah idea yang menarik dan, mungkin, bahkan sampai ke titik ilmiah. Tetapi ini memerlukan memproses sebilangan besar teks dalam pelbagai bahasa. Dan masalahnya segera timbul: banyak bahasa tidak ditulis, dan bagaimana betulnya membandingkan sistem rakaman abjad dengan transkripsi fonetik masih belum jelas. Terdapat sedikit idea praktikal dari idea ini, Starostin pasti. Paling baik, ia benar-benar dapat diterapkan pada insiden seperti manuskrip Voynich, apabila ada hipotesis bahawa beberapa bahasa dengan tulisan abjad standard dienkripsi mengikut prinsip-prinsip tertentu (misalnya, dengan penghapusan huruf vokal, dll.). Walau bagaimanapun, terdapat sedikit kejadian seperti ini di dunia.

Menjumlahkan

Apa yang ada di garis bawah? Perbincangan mengenai penyelidikan IPM dan MIPT mengungkapkan jurang yang mendalam antara komuniti linguistik (bahkan mereka yang menggunakan kaedah statistik) dan "orang luar" mengenai pakar linguistik yang memutuskan untuk menggunakan alat matematik mereka pada bahan linguistik.

Fakta bahawa ahli matematik tidak mahu bekerjasama dengan ahli bahasa tidak hanya menimbulkan kesalahan besar, yang kemudiannya berpindah ke media (contohnya, bahasa Basque dalam preprint disebut Indo-Eropah, ada ungkapan "huruf vokal"). Keindahan model dan kekuatan komputasi superkomputer sebenarnya dinilai oleh kesilapan semasa masuk. Sekali lagi, dengan keinginan dan keterbukaan hubungan dengan rakan sekerja dari disiplin yang berbeza, kesalahan ini dapat dielakkan dengan mudah.

Lihat Manuskrip Voynich itu sendiri di sini.

Disyorkan: