
Автор фото, Beáta Megyesi
У сховищах Ватиканської бібліотеки майже 400 років зберігалася нерозгадана таємнича рукописна книга, наповнена невідомими символами. Її зашифровані сторінки, очевидно, приховували секретні рецептури “від недуг людського тіла”, як вказано на внутрішній стороні обкладинки. Подібні методи лікування тоді тримали в секреті, оскільки вони могли викликати підозри або навіть звинувачення в чаклунстві.
Цей манускрипт, відомий як шифр Борджа (Borg cipher), обсягом 408 сторінок здебільшого залишається незрозумілим. Він закодований за допомогою 34 загадкових символів, доповнених кількома римськими літерами та титульною сторінкою арабською мовою.
Не існувало жодного відомого ключа для його дешифрування. Деякі сторінки також пошкоджені через свій вік, що додатково ускладнює читання коду.
Однак, за допомогою машинного навчання — однієї з форм штучного інтелекту — дослідникам вдалося розгадати цей код. Виявилося, що текст містить тисячі незвичайних рецептів, наприклад, поради вживати кілька келихів високоякісного червоного вина або запікати мускатний горіх у тісті для боротьби з дизентерією.
«Це схоже на детективне розслідування, де кожен символ, кожна закономірність і кожне часткове розв’язання можуть наблизити нас до чиїхось таємниць і до втраченого історичного світу», — зазначає Беата Меєші, професорка комп’ютерної лінгвістики Стокгольмського університету у Швеції, яка входила до команди, що розшифрувала текст.
Навіть за допомогою ШІ процес пошуку ключа до шифру був виснажливим.
Нині Меєші та її колеги очолюють проєкт з використання можливостей ШІ для розшифрування історичних шифрів, що потенційно може відкрити величезний пласт закодованої інформації з минулого, яку раніше не вдавалося розгадати.
«Це відкриває захопливі перспективи для рідкісних та нестандартних систем письма», — каже Беата Меєші.
За деякими оцінками, приблизно 1% матеріалів в архівах та бібліотеках по всьому світу повністю або частково зашифровані. Деякі з найдавніших відомих шифрів датуються епохою Стародавньої Греції та Риму.
Омана, вимерлі мови та нерозбірливий почерк
Зашифровані історичні документи приховують дипломатичну інформацію, ритуали таємних спільнот, медичні знання, історії кохання або повсякденні деталі, які люди хотіли зберегти в таємниці. Це інформація, що наразі відсутня в історичних розповідях.
У деяких випадках розшифрування таких документів може змінити наше уявлення про відому історичну постать або цілу епоху. Одним з нещодавніх прикладів є колекція зашифрованих листів, які виявилися написаними Марією Стюарт під час її тривалого ув’язнення в Англії. Вони продемонстрували її причетність до змов з метою відновлення трону та напружені стосунки з її сином Яковом VI Шотландським, майбутнім королем Англії Яковом I.
Історичні шифри можуть бути досить простими: наприклад, шифр Борджа використовує метод заміни, тобто кожен символ був замінений однією римською літерою, щоб приховати зміст написаного. Однак інші можуть бути складнішими для розгадки.
У деяких випадках взагалі нічого не відомо про мову, якою був написаний оригінальний текст. Можуть також додаватися зайві, беззмістовні символи, щоб ввести в оману та збити зі сліду тих, хто намагається зрозуміти текст. В інших випадках одна й та сама літера може передаватися різними знаками.
Це означає величезний обсяг роботи — часто шляхом спроб і помилок — навіть для розшифрування незначної частини тексту.
Так, Сесіль П’єрро, криптологиня Французького національного інституту досліджень у галузі інформатики (INRIA) у Нансі, разом із колегами витратила шість місяців, щоб поступово розкрити ключ до 500‑річного листа Карла V, імператора Священної Римської імперії та короля Іспанії, написаного з використанням 120 різних символів шифру на трьох сторінках.
Розшифрований лист показав, що Карл V — одна з найвпливовіших осіб свого часу — був охоплений страхом перед змовою з метою його вбивства. Король побоювався, що італійський найманець, який служив французькому королю Франциску I, планує його вбити.

Автор фото, Biblioteca Apostolica Vaticana
Підпис до фото, Шифр Борджа містить поєднання дивних шифрованих символів та латинського письма на 408 сторінках
Перед початком дешифрування дослідники повинні ретельно перетворити рукописний шифр на цифровий документ, який можна завантажити в програмне забезпечення для дешифрування.
Нечіткий почерк і вицвітання чорнила ще більше ускладнюють це завдання. П’єрро зазначає, що їй зазвичай потрібен день, щоб переписати двосторінковий лист з незнайомими символами.
ШІ сприяє прискоренню розкриття таємниць
Однак ШІ починає прискорювати процес. Мішель Вальдіспюль, професорка германської лінгвістики Університету Осло в Норвегії, разом із колегами нещодавно застосувала онлайн-платформу ШІ Transkribus для транскрибування секретного листа, написаного дворянином Сигізмундом Гойзнером фон Вандерслебеном шведському лорд-канцлеру Акселю Оксеншерні у 1637 році під час Тридцятилітньої війни — релігійного конфлікту, що зрештою забрав мільйони життів і спустошив значні території Європи.
Цей інструмент навчений на різноманітних мовах, писемних системах і почерках, що охоплюють кілька століть. Після завантаження зображення документа система ідентифікує блоки тексту та окремі рядки, а потім сканує його символ за символом, перетворюючи на цифрову форму.
Хоча деякі корективи довелося вносити вручну, інструмент досить добре впорався з листом фон Вандерслебена, оскільки він був лише частково зашифрований числами, розділеними крапками, й акуратно написаний. Інші частини не були закодовані й просто написані німецьким шрифтом XVII століття.
Наявні платформи ШІ для транскрибування часто стикаються з труднощами, коли рукописи зашифровані незвичними символами, такими як вигадані знаки, астрологічні символи або числа, записані в дивний спосіб.
Однак Меєші, Вальдіспюль та їхні колеги розробляють власний інструмент ШІ, щоб перетворювати рукописні історичні тексти з незрозумілими символами або письмом на машинозчитувані документи в межах міжнародного проєкту Descrypt.
«Ми розробляємо більш гнучкі моделі, навчені та протестовані на широкому спектрі писемних систем, алфавітів і символічних наборів», — каже Меєші.

Автор фото, Getty Images
Підпис до фото, Багато архівів і бібліотек у всьому світі містять зашифровані тексти, які можуть містити цінну історичну інформацію
Після того, як секретний документ транскрибовано, починається робота детектива. Нині криптологи часто використовують спеціально розроблене програмне забезпечення без ШІ, яке застосовує алгоритми для визначення типу шифру та його розкриття.
Прості шифри часто можна зламати шляхом аналізу частоти використання символів і зіставлення її з літерами алфавіту, які трапляються з такою ж частотою у мові. Наприклад, в англійській мові літера ‘E’ є найпоширенішою, тоді як ‘Z’, ‘Q’ і ‘X’ — найрідкіснішими.
Але в листі фон Вандерслебена з фронту Тридцятилітньої війни, наприклад, для позначення літери ‘E’ використовувалося до восьми різних символів. Це означало, що для поступового розкодування потрібні були як метод спроб і помилок, так і знання Вальдіспюль старонімецької мови.
«Це був постійний процес взаємодії між машиною та людиною-перевіряльником, — каже Вальдіспюль. — Можливо, колись ШІ зможе робити це повністю самостійно».
За шифром ховалися попередження фон Вандерслебена про загрозу з боку фракцій протестантських союзників Швеції у війні. Він повідомив Оксеншерні, що був змушений відступити після отримання інформації про змову серед союзників, включно з лордом Францем Генріхом Саксонським.
Повторне відкриття кодів
Меєші та її команда нині досліджують, як ШІ може взагалі обійти етап транскрибування, просто аналізуючи фотографії сторінок для розшифрування секретних повідомлень. Нещодавно вони показали, що такий підхід може працювати для простих кодів, де кожну літеру замінює один символ.
Вони протестували систему на рукописі зі 105 сторінок, який вже був розшифрований і відомий як шифр Copiale, що описує ритуали, правила та ідеали німецького таємного товариства XVIII століття. Після навчання ШІ на загальному почерку, а потім на зображеннях рядків шифру та відповідного розшифрованого німецького тексту, система змогла точно розшифрувати частини тексту, яких раніше не бачила.
Такий підхід може бути особливо корисним, коли мова, що лежить в основі шифру, невідома.
«Це відкриває захопливі перспективи для рідкісних та нестандартних систем письма», — каже Меєші. «Кінцева мета — поєднати транскрибування та дешифрування в один етап».

Автор фото, Getty Images
Підпис до фото, Символи на 4000‑річному Фестському диску, знайденому в руїнах мінойського палацу на Криті, залишаються значною мірою нерозшифрованими
Вальдіспюль та її колеги досліджують старі архіви в пошуках шифрованих текстів для створення бази даних. Це може бути вирішальним для накопичення достатнього обсягу даних для навчання ШІ, здатного розкривати коди. Великі мовні моделі, на яких базуються чатботи ШІ, такі як ChatGPT, навчаються на трильйонах слів із книг, статей і вебсайтів. Зібрати подібні обсяги даних для дешифрування складно.
Серед матеріалів, які вони зібрали, — 400 загадкових листівок, написаних шифром наприкінці 1800-х — на початку 1900-х років. Наразі розшифровані уривки показують, що частина з них є любовними листами, написаними німецькою мовою.
Команда Меєші використала свої напрацювання для створення інструменту ШІ у стилі чатбота, який поєднує транскрибування та дешифрування в одному кроці. Він інтегрує алгоритми дешифрування, навчені на парах символів шифру та відповідного тексту, із великими мовними моделями, навченими на історичних текстах різних періодів, щоб надавати підказки для розшифрування.
Також використовуються алгоритми розпізнавання зображень, навчені на анотованому почерку. Інструмент ШІ зможе вдосконалюватися, враховуючи виправлення експертів.
Ідея полягає в тому, що дослідники або навіть широке коло користувачів зможуть надати чатботу зашифрований історичний текст і отримати його розшифровку.
Під час тестування чатбота на шифрі Борджа Меєші та її колеги виявили, що він може перекласти і розшифрувати фрагмент із 500 символів трохи більш ніж за 29 хвилин. Він навіть надав переклад англійською мовою.
Система також документувала процес і пояснювала, чому запропоноване рішення є ймовірним. Це важливо для того, щоб упевнитися, що ШІ не «галюцинує» і не вигадує інтерпретації.
Команда також нещодавно протестувала систему на двох інших шифрах, які вони раніше розшифрували і які представляють різні історичні періоди, мови, типи секретних кодів та рівні складності. Вона швидко їх дешифрувала, демонструючи здатність працювати з різними шифрами.
«ШІ найбільше допомагає з масштабом, швидкістю, виявленням закономірностей та інтеграцією завдань», — каже Меєші.
Такі інструменти можуть стати ключем до розкриття історичних шифрів, які досі залишалися загадкою. Вони також допоможуть із давніми текстами, написаними алфавітами, які сьогодні ніхто не може прочитати. Наприклад, 4000-річний Фестський диск із Криту досі не розшифрований, як і ранньогрецька писемність «лінійне письмо B».
«Мене захоплює не лише можливість розв’язати одну конкретну історичну загадку, а й перспектива створення методів, які допоможуть дослідникам у багатьох різних випадках», — каже Меєші.
