…
Формула языка “Икс”
“ЗС” №2/1967
В 1963 году в совете по комплексной проблеме “Кибернетика” при Президиуме Академии наук СССР было решено начать изучение ряд дешифрованных исторических систем письма с широким использованием средств вычислительной техники. Для проведения этой работы были организованы филологическая группа под руководство) Ю. В. Кнорозова, в которую входили Г. В, Алексеев, Б. Я. Волчек, А. М. Кондратов, В. М. Наделяев, В. С. Стариков, И. С. Федорова и А. И. Харсекин, и группа по машинной обработке текстов при Всесоюзном институте научной н технической информации (ВИНИТИ) под руководством М. А. Пробста, в которую входили 3. М. Остроухова и Т. Б. Павлова.Перед вами статья одного из участников этой работы.
Без билингвы
Перед нами — текст, записанный неизвестными знаками. Как понять его? Самый простой путь — найти человека, знающего неизвестные вам письмена. Предельно просто! И, как ни удивительно, именно так удавалось найти ключ даже к древним письменам! В конце XVIII века французский исследователь Анкетиль-Дюперон сообщил, что ему удалось прочитать и перевести тексты священной книги древних персов “Авеста”. Он много лет провел среди современных огнепоклонников (для которых и поныне “Авеста” — священная книга) и научился у жрецов, из поколения в поколение передававших свои знания, искусству чтения “Авесты”.Когда Анкетиль-Дюперон опубликовал свой перевод “Авесты”, он единодушно был признан “плодом фантазии” и считался таковым до тех пор, пока успехи языкознания XIX века… не подтвердили правоту отважного исследователя, с риском для жизни добывшего у жрецов-огнепоклонников тайну их священных текстов.
Еще более поразительный случай, произошел совсем недавно, в середине нашего столетия. Как известно, четыреста лет назад испанцы уничтожили великую цивилизацию инков в Южной Америке, а вместе с ней и все памятники письма. Впрочем, памятников этих уже в ту пору было крайне мало — когда-то процветавшее иероглифическое письмо было запрещено самими инками и заменено на “письмо узелков” — “кипу” или “квипу”. Инки сохранили лишь совсем немного иероглифических текстов, где. была записана их история (ведь с помощью узелков “кипу”, родных братьев наших “узелков на память”, длинного связного текста не записать). Однако после испанского завоевания и эти тексты погибли. Но в пятидесятых годах нашего века боливийский археолог и этнограф Дик Эдгар Ибарре Грассо обнаружил живых знатоков иероглифического письма! И не только в отдаленных горных районах Боливии и Перу, но даже в самой столице Боливии, городе Ла-Пас!
В отдаленных районах государства инков, очевидно, были люди, не послушавшиеся запрета. Вот почему и поныне индейцы, не знающие ни европейской “латиницы”, ни испанского языка, пользуются письмом, корни которого уходят во времена культуры Тиагуанако, предшествовавшей культуре инков!
Найти живого знатока древних письмен и с его помощью прочитать тексты — задача увлекательная и романтическая. Но ведь для большинства древних текстов, например египетских, хеттских, шумерских и многих других, это практически невозможно (египетские иероглифы не умели читать сами жрецы уже 20 веков назад). И все-таки мы знаем, что письмена Египта, Малой Азии, Двуречья были прочтены. Почему? Здесь на помощь дешифровщикам пришла билингва, текст, повторенный на двух языках, только один из которых неизвестен.
С помощью знаменитого Розеттского камня Шампольон дешифровал иероглифику Египта.
Помогают исследователям не только билингвы: возможны и другие “ключи” к письменам. В 1929 году французская экспедиция, раскопав холм Рас-Шамра (в Сирии), обнаружила неизвестную письменность, названную угаритской. Ряд надписей был сделан на бронзовых боевых топорах, причем на одних топорах было всего лишь 6 знаков, а на других к тем же 6 знакам добавлялось еще 4 новых. Немецкий филолог Бауэр разумно предположил, что 6 знаков передают имя владельца, а 4 — соответствуют слову “топор”; и это помогло вскоре расшифровать все надписи угаритского письма!
Как быть, если у нас нет билингвы? И вообще никаких других вспомогательных данных? Можно ли тогда дешифровать текст?
“Из ничего нельзя ничего дешифровать, — говорит известный специалист по дешифровке И. Фридрих. — Если не за что ухватиться, если опора пока что не найдена, значит, серьезных результатов достичь невозможно — остается лишь простор для беспочвенных фантазий дилетантов”.
Письмена острова Пасхи, надписи на печатях из Мохенджо-Даро и Хараппы, древнейших городов Индостана, загадочный диск из города Фест иа Крите, письмена этрусков билингвы не имеют. И многочисленные любители, да и. серьезные ученые, тщетно пытались проникнуть в загадку этих письмен, читая их то по-хеттски, то по-тольтекски, то по-гречески, то по-албански, то на санскрите… Но всем этим “дешифровкам” не хватало одного — “точки опоры”. Имеется ли она у текстов без билингвы, у текстов, где отсутствуют какие бы то ни было косвенные данные?
Оказывается, такая “точка опоры” все-таки есть. И это — сами тексты, точнее — их внутренняя структура! Здесь на помощь исследователю приходят точные числа, количественные показатели и электронные вычислительные машины.
Формула системы письма
Первая задача, которая встает перед дешифровщиком древних текстов, — это определение системы письма. Что передает тот или иной знак — букву? слог? корень слова? служебную частицу? слово? или, может быть, целое, сочетание слов и даже предложение? Возможно, что исследуемый текст не является письменным текстом в полном смысле этого слова, то есть текстом, который можно читать, а представляет собой пиктографическую запись, “рисуночное письмо”, и его можно толковать на любом языке мира.
Звуков в языке немного — от 10-12 (в полинезийских) до 70-80 (в некоторых кавказских). Как правило, в алфавитном письме бывает в среднем около 30 различных знаков-букв. Значит, если мы видим текст, где число различных знаков порядка 30, можно с уверенностью считать, что этот текст записан буквенным, алфавитным письмом.
Системы письма, где каждый знак передает слог, насчитывают 50-80 различных знаков. В смешанных, иероглифических системах письма одни знаки передают слоги (или даже отдельные буквы, как в древнеегипетском), другие — корни слов, а третьи, “ключевые” знаки (или детерминативы), никаких единиц языка не передают, а лишь указывают, как должен читаться тот или иной знак или сочетание знаков.
Естественно, что в иероглифике число различных знаков будет гораздо больше, чем в алфавитном или слоговом. Так, в древнеегипетском письме насчитывают около 800 иероглифов, в хеттском — около 500, и т. д.
Среди дошедших до нас древних систем письма нет ни одной, где каждый знак передавал бы целое слово (такая система очень громоздка). Но теоретически можно представить такое “пословное” письмо — и где гарантия, что неизвестный текст не написан как раз таким письмом? Нетрудно подсчитать число знаков, которое должно иметь “пословное” письмо, — оно будет равно числу слов в языке, насчитывать десятки и сотни тысяч знаков.
Бесконечно и число знаков пиктографии, “рисуночного письма”, — каждая новая ситуация требует новых знаков, фиксирующих ее.
Таким образом, каждая система письма имеет свои точные количественные показатели. Нам остается только посчитать число разных знаков — и мы можем тут же определить систему письма. Однако тут имеется одно “но” — и весьма важного свойства.
Дело в том, что дошедшие до нас древние тексты зачастую очень коротки... - А поэтому мы не можем знать, вошли ли в эти тексты все знаки письма или нет. Чтобы определить в подобном тексте систему письма, приходится поступать так. Подсчитывают не все разные знаки, а знаки новые, которые появляются вновь на каждые 25, 50, 75, 100 и т. д. знаков текста.
Среди первых 25 знаков немногие будут повторяться — и у алфавитного письма, и у иероглифики, и у слогового. На вторую “двадцатьпятку” у алфавитного письма появится очень мало новых знаков. В третьей “порции” по 25 знаков число алфавитных знаков будет совсем маленьким, начнет исчерпываться и запас слоговых знаков, в то время как число новых знаков иероглифики по-прежнему будет прибывать, хотя и не столь быстро, как вначале (ведь наиболее употребительные иероглифы уже повстречаются нам среди первых 25, 50 и т. д. знаков текста).
...Что же касается знаков пиктографии... то число новых будет постоянным — в среднем по 18-20 новых знаков на каждые 25 знаков текста.
Таким образом, мы видим, что каждая система письма отличается не только общим числом всех знаков, но и частотой появления новых знаков в тексте. Значит, можно выяснить (с определенной степенью вероятности)..., какой именно системой письма написан неизвестный текст.
Для наглядности приведем таблицу, где сопоставляется частота появления новых знаков. Первый столбец — письмена древнего Египта, классический образец иероглифического письма. Второй столбец — письмена долины Инда, до сих пор еще не расшифрованные... Одни ученые считали их иероглифическими, другие — слоговым письмом. Из таблицы явно видно, что числовые показатели графы “Египет” совпадают с показателями, графы “Индия” — видимо, создатели цивилизации Мохенджо-Даро и Хараппы пользовались не слоговым, а иероглифическим письмом.
Числа и кохау ронго-ронгоКакой системой письма пользовались жители острова Пасхи? Тут среди ученых нет единогласия. Были попытки читать значки кохау ронго-ронго как слоговые и даже алфавитные. Советские исследователи Кудрявцев, Ольдерогге, Кнорозов, Бутинов признали письмена острова Пасхи иероглификой. Доктор Бартель из ФРГ полагает, что кохау ронго-ронго является “эмбриописьмом”, в котором нет грамматических показателей, а каждый знак передает целое слово. В недавно вышедшей книге В. Истрина “История письма” высказывается мысль, что островитяне пользовались письмом, в котором одному знаку могла соответствовать даже целая фраза. Известный знаток письмен древнего Востока Игнациус Гельб полагает, что кохау ронго-ронго нельзя назвать “письменностью” даже в примитивном смысле этого слова. Он считает их пиктографической записью.
Очевидно, ответить точно на вопрос, какой же системой письма пользовались жители острова Пасхи (и было ли у них вообще письмо), могут лишь статистические методы исследования, количественные подсчеты. Они были произведены автором этих строк и приводятся в таблице.
Первоначально была определена частота появления новых знаков в двух текстах кохау ронго-ронго: тексте “Тахуа” (в таблице он обозначен буквой “Т”) и тексте “Аруку-Куренга” (буквы “А. К.” в таблице). Кроме того, для сопоставления был взят фольклорный текст острова Пасхи, повествующий о легендарном первом поселенце Хоту Матуа, Хоту-Отце. Этот текст был записан исследователями острова Пасхи латинскими буквами.
В графе таблицы, обозначенной буквами “Ал.”, приводится частота появления в нем новых букв. Но ведь можно подсчитать частоту появления не букв, а целых слогов, и тогда мы получим характеристику слогового письма (на случай, если кохау ронго-ронго записаны им). (Графа таблицы, обозначенная буквами “Сл.”).
Подсчитав частоту появления в том же тексте новых морфем, то есть новых корней слов и грамматических частиц, мы получим характеристику “поморфемного” письма, (графа “Морф.”), а подсчитав частоту появления новых слов, — письма “пословного” (графа “Слов.”)
Сопоставим затем данные по текстам кохау ронго-ронго с данными по тексту Хоту Матуа... и древнеегипетскому иероглифическом тексту. Нетрудно убедиться в том, что письмо острова Пасхи никак не может быть алфавитным или слоговым: слишком много новых знаков появляется в письме кохау ронго-ронго. А для того, чтобы оно оказалось письмом “поморфемным” или “пословным”, этих знаков слишком мало. Зато с древнеегипетской иероглификой данные текстов кохау ронго-ронго совпадают очень хорошо. Видимо, жители остров Пасхи пользовались иероглифическим письмом.
Классы знаков и статистика
Система письма определена. Что делать дальше? Следующим шагом в изучении неизвестного текста будет подсчет частоты отдельны знаков.
Если система письма — алфавитная, то самые частые знаки будут передавать самые “популярные”... буквы неизвестного языка. Советскими исследователями В. Шеворошкиным и Б. Сухотиным разработан объективный метод, с помощью которого можно произвести разделение знаков неизвестного письма на две группы — группу гласных и группу согласных (подробно о нем читателям нашего журнала рассказал один из авторов этого метода, В. Шеворошкин, в статье “Язык царя Мавсола”, опубликованной в №7 журнала “Знание — сила” за 1965 год).
После разделения знаков на гласные и согласные можно провести и более точное деление. Например, гласная “а” почти в любом языке мира встречается чаще, чем гласная “у” и т. д.
СОПОСТАВЛЕНИЕ ЧАСТОТЫ ПОЯВЛЕНИЯ НОВЫХ ЗНАКОВ
(египетские, протоиндийские и тексты острова Пасхи)
Число знаков
|
Египет
|
Индия
|
о. Пасхи
|
||||||||||
|
|||||||||||||
Т.
|
А. К.
|
Ал.
|
Сл.
|
Морф.
|
Слов.
|
||||||||
25
50 75 100 |
13
12 14 9 |
20
11 11 7 |
18
1 11 18 |
7
7 8 6 |
1
0 0 0 |
0
2 0 0 |
6
2 3 2 |
8
4 6 9
|
|||||
125
150 175 200 |
8
5 9 6 |
5
3 4 4 |
11
9 14 6 |
0
0 0 0 |
0
0 0 0 |
7
8 1 7 |
2
8 6 8 |
6
4 0 3
|
|||||
225
250 275 300 |
4
4 5 2 |
6
3 5 3 |
11
2 0 0 |
2
2 2 4 |
4
8 4 9 |
8
11 5 4 |
8
6 9 8 |
4
3 4 2
|
|||||
325
350 375 400 |
4
3 3 6 |
2
6 5 6 |
14
7 3 0 |
9
2 6 5 |
8
9 12 9 |
2
3 4 3 |
5
3 3 4 |
0
0 0 0
|
|||||
425
450 475 500 |
0
4 2 4 |
7
5 5 2 |
19
10 5 8 |
5
6 9 1 |
7
6 4 1 |
8
4 4 4 |
0
0 0 0 |
0
0 0 0
|
|||||
525
550 575 600 |
2
1 1 4 |
7
3 2 5 |
1
1 2 8 |
10
6 1 11 |
3
8 8 7 |
0
0 0 0 |
0
0 0 1 |
4
1 2 8
|
|||||
625
650 675 700 |
3
2 5 3 |
1
3 0 6 |
10
12 8 5 |
9
9 9 2 |
0
0 0 0 |
0
2 2 0 |
8
5 10 5 |
6
8 6 7
|
|||||
|