Iluminarea primei parti iluminate: o prima privire asupra manuscrisului Voynich

In timp ce lumea abunda de fenomene ciudate, pentru analize in starea lor bruta, exista o placere deosebita de a examina informatiile arcane, curate si intunecate de mintea umana.

Manuscrisul Voynich este unul dintre cele mai cunoscute si studiate volume de cunostinte oculte. Cea mai recenta istorie a cartii implica achizitionarea sa in 1912 de catre Wilfrid Voynich, un dealer de carti rar, dintr-o vanzare de manuscrise de catre Societatea lui Isus la Vila Mondragone, Frascati. Dupa cativa ani fructuosi de incercari de a descifra manuscrisul si de a-i descoperi originea sau de a-i interesa pe altii, Wilfrid Voynich a murit. Cartea a trecut printr-o serie de alte maini inainte de a fi donata Universitatii Yale de catre renumitul dealer de carti rare, Hans P. Kraus, in 1969. Acum locuieste in Biblioteca de carti si manuscrise rare Yale din Bealecke, cu denumirea MS 408.

Scris aproape in intregime intr-un scenariu necunoscut, cu exceptia unui numar mic de cuvinte aparent in latina si inalta germana, manuscrisul este ilustrat convingator cu reprezentari de plante, ierburi, figuri umane, simboluri astronomice si astrologice. Manuscrisul a rezistat tuturor incercarilor de interpretare de criptografi, istorici si lingvisti.

Manuscris Voynich – Folio 178

Din perspectiva lingvistica si criptografica, aceasta lipsa de succes in interpretare nu este surprinzatoare. Cele doua sute de folii ale manuscrisului, in timp ce frumos iluminate, prezinta un corp de text trist limitat in scopul analizei traditionale.

In aceasta scurta serie de postari vom supune manuscrisul Voynich unei serii de tehnici de analiza a textului, aprofundandu-se in structura sa, obtinand o perspectiva oribila asupra compozitiei sale si evaluand sceptic credibilitatea acesteia. Manuscrisul a fost supus aproape cincizeci de ani de incercari furtive ale criptografilor, inclusiv Agentia de Securitate Nationala a SUA si o menagerie a altora de la distins pana la deranjat. Vom imita crud cateva rezultate anterioare si speram sa adaugam propria noastra confuzie la masa continua a cercetarilor curente din manuscrisul Voynich.

De la descoperirea sa si de-a lungul incercarilor nereusite in curs de descifrare a continutului sau, multi au pus sub semnul intrebarii autenticitatea manuscrisului Voynich. Teoria conform careia intreaga carte este o farsa, fie de carturari contemporani, fie de jucatori mai moderni, a fost ridicata in mod repetat de-a lungul anilor.

Array

Radiocarbonul din 2010 a afirmat ca pergamentul manuscrisului dateaza probabil de la inceputul secolului al XV-lea; volumul pergamentului din manuscris si coerenta acestuia in document, fac putin probabil, desi nu imposibil, ca cartea sa fie o farsa moderna.

Alte dovezi justificative au fost extrase din mentiunile timpurii ale manuscrisului in corespondenta. Conform http://www.voynich.nu, care prezinta o descriere mult mai detaliata si detaliata a cercetarii din jurul manuscrisului si a istoriei sale decat am putea spera sa oferim aici, prima mentiune existenta a manuscrisului poate fi gasita intr-o 1639 scrisoare de la Athanasius Kircher din Roma, raspunzand unei scrisori trimise de la Georgius Barschius din Praga de matematicianul Theodor Moretus.

Scrisoarea se refera la o „carte cu steganografie misterioasa” ( „libellum…… steganographici miststerisi” ) ilustrata cu imagini cu plante, stele si secrete chimice pe care Kirscher nu avusese inca timp sa le descifreze. Barschius a cautat expertiza lui Kirscher datorita faimei sale la acea vreme pentru a pretinde ca, in mod eronat, a transpirat, a descifrat sistemul de scriere hieroglifica a limbii egiptene antice. Ulterior, corespondenta dintre Barschius si Kirscher apare, potrivit Zandbergen, pentru a sugera cu tarie ca misterioasa carte in cauza este Manuscrisul Voynich bazat pe descrierea sa.

Acum trecem de la surse istorice la taramuri mai intunecate si mai statistice. Exista un sprijin convingator pentru ideea ca, indiferent de adevaratul sens al cartii, continutul acesteia este extras dintr-un limbaj uman si nu este nici simboluri aleatorii si nici o forma de cifrare sofisticata.

Unul din pilonii acestui argument este faptul ca anumite proprietati statistice ale textului manuscriselor Voynich seamana puternic cu cele ale limbajelor naturale, umane, si care este putin probabil, desi nu este imposibil, sa provina dintr-un text aleatoriu, din text artificial generat sau din cele mai multe forme de encifrare. .

Cea mai cunoscuta dintre aceste proprietati statistice este aderenta aparenta a manuscrisului la Legea lui Zipf. Aceasta lege, facuta faimoasa de lingvistul american George Zipf, observa ca, in corpurile de limbi naturale, frecventa unui cuvant este invers proportionala cu rangul sau atunci cand cuvintele dintr-un corpus sunt ordonate in functie de frecventa. Mai clar: cel mai obisnuit cuvant intr-o limba este probabil sa fie de n ori mai frecvent decat al doilea cuvant cel mai frecvent; al doilea cuvant va fi de aproximativ n ori mai frecvent decat al treilea cuvant si asa mai departe.

In timp ce este doar o aproximare, se poate vedea ca aceasta lege tine pentru majoritatea limbilor umane si pentru o serie de alte fenomene naturale.

Gibberish-ul intamplator, pe de alta parte, cel mai probabil nu ar urma Legea lui Zipf, desi, cu siguranta, gibrisul elaborat cu atentie. Rugg a demonstrat ca o procedura mecanica simpla poate produce un text aleatoriu care respecta Legea lui Zipf, desi exemplul pe care il ofera este atat oarecum conturat, cat si presupune o cunoastere a acestei chestiuni statistice a limbilor umane in primul rand. Avand in vedere ca machiajul fizic al manuscrisului Voynich dateaza de la inceputul secolului al XV-lea, cu patru secole inainte ca Zipf sa popularizeze aceasta evaluare matematica a limbajelor umane, argumentul ca este un act contemporan al glicololaliei caligrafice pare incordat.

In mod similar, majoritatea formelor de criptografie dincolo de cele mai simple cifre de substitutie ar distrage si textul departe de Legea Zipf. Este de remarcat faptul ca Manuscrisul Voynich este chiar inainte de lucrari precum Steganografia lui Trithemius sau Cartea lui Soyga si tabelele sale magice de scrisori care il obsedau atat de bine pe John Dee.

In schimb, sa afirmat ca alte caracteristici ale textului ridica indoieli. Unul dintre cele mai des enuntate contra-argumente ale ipotezei naturale a textului Voynich este ca unele cuvinte sunt repetate de nenumarate ori. In functie de transcriere, cuvintele individuale au fost repetate de pana la cinci ori. Desi acest lucru nu este un lucru imposibil in lanugajul uman, este foarte neregulat.

Urmatoarea postare din aceasta scurta serie se va concentra pe respectarea manuscrisului Voynich sau lipsa acestora la Legea lui Zipf in intregime. In continuare, vom vedea masura in care alte forme de analiza textuala moderna pot fi aplicate pentru a diseca secretele arcane si neintrerupte ale MS 408.

Totusi, acest post va descrie conturatiile necesare pentru a face textul Voynich potrivit pentru forma noastra particulara de control.

Avand in vedere formatul si prezentarea textului, facem mai multe ipoteze despre sistemul de scriere continut in manuscrisul Voynich:

  • Este scris intr-un alfabet, sau potential un abjad sau chiar un abugida, si nu un sistem logografic. Ca textul nu este logografic este justificat de numarul mic de simboluri individuale. Distinctia dintre celelalte sisteme este suficient de subtila incat nu va afecta analizele noastre.
  • Manuscrisul este scris de la stanga la dreapta, si nu invers, vertical, boustrophedon. Acest lucru este necontrolat si reiese chiar dintr-o inspectie cursiva a textului in sine; fluxul orizontal al scrierii este clar, cu linii care incep clar de la marginea stanga si se termina inainte de dreapta. Textul este separat in paragrafe, dintre care linia finala este justificata la stanga.

Datorita activitatii diligente a mai multor generatii de cercetatori Voynich, textul manuscrisului a fost transcris intr-un format care poate fi citit de masini. Deoarece alfabetul este necunoscut, exista reduse incertitudini in redarea textului, ceea ce duce la o serie de transcrieri similare, dar concurente. Detaliile subtile ale diverselor eforturi de transcriere, precum si istoricul lor, sunt disponibile la: http://www.voynich.nu/transcr.html, cu datele brute disponibile la http://www.voynich.nu/data/. Ne-am asezat pe transliterarea v101 de Glen Claston, redata in formatul intermediar al Voynich Transliteration File Format (IVTFF) din Zandbergen. Aceasta este una dintre transcrierile mai recente si utilizate pe scara larga si are avantajul suplimentar de a fi sustinuta de disponibilitatea unui font TrueType. Fisierul de baza este disponibil aici: http: //www.voynich.

Efectuam urmatorii pasi pentru a face datele utilizate pentru analizele noastre. Pentru multe scenarii, am dezvolta un set generalizat de pasi care sa permita conversia multor documente intr-o forma adecvata. Pana si daca nu se gaseste, insa, o noua cache de documente in aceeasi limba, este mai simplu si mai usor sa efectuati manual acesti pasi unici.

In primul rand, stergem din text toate cuvintele incomplete, asa cum sunt marcate in formatul IVTFF. Aceasta include:

  • tot textul intre paranteze unghiulare
  • toate cuvintele care contin?
  • toate cuvintele care contin []

In al doilea rand, simbolizam textul si eliminam punctuatia. Transcrierea manuscrisului Voynich pe care l-am ales foloseste urmatoarea punctuatie:

  • „“ este un spatiu
  • „,” Este un spatiu potential. Pentru simplitate, nu le tratam ca pe un spatiu.

In cele din urma, organizam documentul intr-o forma adecvata pentru a fi importate intr-un cadru de date R sau in tabul de ordine.

Etapele de mai sus au fost efectuate in editorul de text Vim, iar comenzile utilizate sunt reproduse in codul de mai jos:

Afiseaza comenzi de manipulare a textului Vim.

# Stergeti toate liniile comentate: \% g /\^\#.\*/ d # Eliminati liniile necompletate: \% g / \ ^ \ $ / d # Eliminati „,” – presupuneti ca spatiile potentiale sunt / nu / spatii . : \% s /, // g # Inlocuiti marcajul paginii fiecarui folio (initial pentru fiecare pagina) # cu continutul sau, urmat de virgula. (<f1r> – \> f1r,): \% s / \ ^ <fRos> \ s * \ <. {-} \> \ $ / \ rfRos, /: \% s / \ ^ \ <(f \ [0-9 \] * \ [r \ | v \] \ [0-9 \] *) \> \ s * \ <. {-} \> \ $ / \ r \ 1, / # Eliminati toate \ <\> intrari (non-lacom): \% s / \ <. {-} \> \ s * // g # Alaturati toate alineatele (toate liniile noi urmate de un caracter # altul decat o noua linie sunt eliminate). : \% s / \ n (\ [\ ^ \\ n \]) /. \\ 1 /: \% s / \ ^. f / f /: \% s / ,./, / # Inlocuire „mare” ascii „personaje rare din IVTFF cu reprezentarea lor # ASCII. (<http://www.voynich.nu/img/extra/v101a.jpg>): \% s / @ (\ [0-9 \] {-});

Fisierul de date brute rezultat este disponibil aici. Acest fisier poate fi citit in R pur si simplu folosind functia read.csv:

voynich_tbl <- read_csv („date / voynich_raw.txt”, col_names = FALSE)%>% renume (folio = X1, text = X2)

Ca o prima privire oribila asupra formelor de analiza pe care acest lucru le permite, acum putem folosi datele noastre brute pentru a identifica cele mai repetate cuvinte din manuscris, conform transcrierii noastre. Urmatorul cod R extrage intregul text si il codifica ca o codificare a lungimii de rulare. Acest lucru convenabil ca rezultat intr – o lista de cuvinte secventiala si numarul de ori pe care fiecare se repeta in secventa . Putem apoi extrage pur si simplu cel mai mare numar de repetari pentru fiecare cuvant din corpus:

Numarati cele mai lungi secvente de repetare a cuvintelor in manuscrisul Voynich.

library (tidyverse) biblioteca (magrittr) # Numarati numarul de cuvinte repetate din textul manuscrisului Voynich. # Incarcati datele brute voynich_tbl <- read_csv („data / voynich_raw.txt”, col_names = FALSE)%>% renume (folio = X1, text = X2) # Extrageti textul ca vector al cuvintelor voynich_vector <- voynich_tbl%> % extract2 („text”)%>% paste (sep = „”, collapse = „”)%>% str_split („”)%>% unlist # Creati un obiect care codifica lungimea rularii din vectorul voynich_rle <- voynich_vector%> % rle # Converti obiectul rle intr-un cadru de date si raporteaza numarul maxim de # cazuri repetate pentru fiecare cuvant voynich_repetitions <- voynich_rle%>% unclass%>% as.data.frame%>% group_by (valori)%>

Aceasta analiza simpla arata ca, in transcrierea pe care am ales-o, cele mai lungi secvente de cuvinte repetate au doar trei cuvinte in lungime, care apar in total de cinci ori in text. Desi exista multe alte argumente impotriva potentialei validitati a manuscrisului Voynich, repetarea cuvantului prezinta in sine un motiv convingator pentru a se indoia ca textul este un limbaj uman.

Am redus acum eleganta ciudata si frumoasa a iluminarilor vechi de secole ale manuscrisului Voynich la o abstractizare cruda si utilitara. Cu acest act particular de profanare artistica si literara completata, in urmatoarea postare vom examina Legea lui Zipf mai detaliat si vom interoga masura in care aceasta lege sustine sau submineaza autenticitatea textului.

Note de subsol