Иероглифы — хаос или система? Разбираемся из чего они состоят, как работают и в чём их сила

Каллиграфия "Солнце после снега", Ван Сичжи

Праздничные деликатесы подходят к концу — самое время дать пищу мозгу и познакомиться с одной из древнейших и самой необычной и сложной системой письменности современности — китайским иероглифическим письмом.

Я постараюсь простым языком с примерами и иллюстрациями описать как это все в принципе работает и чем отличается от привычных нам языков с алфавитом, осветить слабые и сильные стороны, а для желающих копнуть глубже по тексту будут ссылки на дополнительные материалы.

Где используются иероглифы?

Иероглифическая письменность считается наиболее ранней - множество первых цивилизаций в Индии, Китае, Центральной Америке и на Ближнем Востоке пользовались подобными логограммами для фиксирования информации.

Однако, до нашего времени по сути дожила только китайская ветвь, иероглифы которой несколько тысяч лет эволюционировали от схематичных рисунков к более упрощенным современным формам.

Эволюция китайской письменности: от рисунков к схематическому набору черт

Благодаря древней истории Китая и влиянию его в регионе, китайские иероглифы исторически применялись не только в китайском, но и в японском, вьетнамском и корейском языках.

Вьетнамский язык около ста лет назад официально перешел на латиницу + дополнительные надстрочные и подстрочные знаки. Корейцы 5 веков назад изобрели свой фонетический алфавит - хангыль (про хангыль на Хабре уже писали), который некоторые путают с иероглифами из-за сложных форм символов.

Японцы заимствовали китайские иероглифы примерно полторы тысячи лет назад, дополнили их двумя вариантами слоговой записи, которая на самом деле тоже произошла из кусочков иероглифов и используют это все по сей день. Про японскую письменность на Хабре уже тоже подробно писали, не буду повторяться.

Какие современные варианты иероглифов существуют?

Различают китайские традиционные и упрощенные, а также японские иероглифы, которые хоть и исторически заимствованы у китайцев, но пройдя через века не всегда совпадают, плюс их упрощение прошло в меньшей степени и не всегда одинаково с китайскими.

Разные начертания одинаковых юникод символов шрифтами для китайского и японского языков

Исторически, упрощённые иероглифы появились из традиционных — они имеют меньше черт и проще и быстрей в написании. Официально процесс упрощения в Китае происходил в 50-х-60-х годах XX века, целью было заявлено массовое повышение грамотности населения. Примерно в то же время подобная реформа письменности была проведена и в Японии, но упрощено было меньшее количество иероглифов и не всегда так как в китайском.

Неверно считать, что новые формы написания были заново придуманы с нуля. Где-то формы брали из упрощенного курсивного написания, где-то брали часть иероглифа, отбрасывая остальное, где-то подбирали похожие по звучанию. Упрощены в Китае были 2235 иероглифов, остальные остались в исходной форме.

В некоторых случаях традиционный иероглиф несет в себе больше подсказок, чем его упрощенная форма:

В отдельных случаях, соответствие между традиционными и упрощёнными иероглифами не однозначное, когда одному упрощенному соответствуют несколько традиционных. Но в целом существуют он-лайн конверторы, а в некоторых учебниках приводят параллельно примеры на обеих вариантах. Юникод коды традиционных и упрощенных иероглифов разные.

Традиционные иероглифы официально приняты на Тайване, в Гонконге и Макао, а также широко используются в зарубежных китайских общинах. Упрощённые используются в материковом Китае, общинах Малайзии и Сингапура. Таким образом существует как бы два варианта современной китайской письменности. В японском языке такого разделения не произошло, страна перешла на упрощенные иероглифы.

Интересное видео о традиционных и упрощенных иероглифах от переводчика Романа Серебрякова

Структура китайской письменности

Иероглиф не рисунок, а весьма стандартизованная форма записи, где как в конструкторе черты формируют компоненты, компоненты затем объединяются в иероглифы, а уже иероглифы формируют слова.

Если изучить структурные элементы иероглифов, то становится видна логика их построения

А теперь рассмотрим эти составные части по-порядку, от самых базовых до самых комплексных, обратив внимание на их особенности.

1. Черта

Черта - наименьшие элемент иероглифа, базовая его структурная единица. Любой иероглиф можно разложить до составляющих его черт. У черт есть свои правила написания, обычно сверху вниз и слева-направо. Составные черты состоят из нескольких простых соединенных под углом и пишутся без отрыва. Для эстетов интересующихся каллиграфией еще и толщина черты не одинакова в разных ее частях, но если вы не пишите кистью и не оформляете афишу, то для вас это не актуально.

Существует несколько классификаций черт и даже в учебных и справочных материалах нет единого мнения, сколько точно их всего. Грубо говоря - примерно 30 черт, несколько из которых встречаются только в одном компоненте. А еще есть иероглиф 〇 который обозначает ноль и фактически образован вот такой чертой-окружностью, которая вообще выбивается из логики остальных черт.

Простейшие черты в иероглифе "вода"

При написании черты могут слегка менять форму и наклон в зависимости от компоновки в иероглифе. При письме от руки подряд идущие рядом расположенные черты часто пишут без отрыва, даже если это несколько искажает иероглиф.

Обучающее видео на 25 минут - 32 черты с примерами (на английском)

2. Компоненты

Компонент — простыми словами можно рассматривать как отдельный кубик составленный из черт, который может быть самостоятельным иероглифом или же частью более сложного. Основная идея в том, что компоненты повторяются в разных иероглифах, то есть мы можем воспринимать иероглиф не как кучу черт, а как композицию из компонентов, что сильно упрощает их понимание и запоминание.

Компонент или радикал?

В некоторых англоязычных источниках компоненты называют радикалами, что в целом не верно - радикал частный случай компонента. Радикал — это индексный компонент. Для того чтобы составлять словари в до компьютерную эпоху все множество из тысяч иероглифов разделили на группы (в современном китайском языке выделяют 214 радикалов), каждой из которой присвоили индексный радикал. Соответственно видя новый иероглиф и предположив его радикал (он не всегда в составе самого иероглифа) можно было дальше уже посчитать количество черт и найти его в бумажном словаре. В современных электронных словарях можно просто "нарисовать" незнакомый иероглиф и увидеть его значение и запоминание радикала и подсчет черт потерял актуальность, хотя до сих пор встречается в обучающих и справочных материалах.

Несколько компонентов имеют различное написание, в зависимости от того используются как отдельный иероглиф или как компонент, а также их места в иероглифе. Например: 心 - сердце (忄- как левый компонент), 手 - рука (扌- как левый компонент), 火- огонь (灬 - как нижний компонент), 水 - вода (氵- как левый компонент), 人 - человек (亻- как левый компонент).

Компонент может нести смысловую или фонетическую подсказку, позволяющую легче запомнить иероглиф. Собственно говоря, очень похоже на то, как работают радикалы в органической химии — зная из каких радикалов состоит молекула проще её запомнить и угадать её свойства. Около 80% иероглифов относятся к таким "смысло-фонетическим".

Рассмотрим смысловые компоненты на примере компонента 火 (灬 ) - "огонь" который используется в ряде иероглифов так или иначе с ним связанных: 烟(дым), 灯(лампа), 烧(гореть, жарить), 煤(уголь, сажа), 照(сиять), 烈(пылающий, яростный), 煮(варить, готовить),煎(жарить), 黑(черный). Несколько смысловых компонентов могут давать новый комбинированный смысл: 灾 (огонь под крышей) - бедствие, несчастье. Отличная подборка смысловых компонентов с примерами есть на ресурсе Fluent Mandarin (1, 2, 3 части на английском).

Точное количество компонентов назвать сложно, как минимум несколько сотен, но изучив около сотни самых распространенных уже можно значительно упростить изучение иероглифов.

Как и смысловой компонент передает только общую идею, а не точный смысл, так и фонетический компонент часто не дает абсолютно точного звучания - могут отличаться тон, может быть близкое звучание (易 - yi / yang). Кроме того, это подсказка для звучания в основном диалекте китайского языка, но может быть другим в диалектах и тем более в японском. Тут (1, 2 части на английском) можно посмотреть больше подробностей о фонетических компонентах китайского языка.

3. Иероглиф

Существуют два типа иероглифов: состоящие из одного компонента (их около 300 сотен) и те которые можно разделить на составляющие их компоненты (все остальные). Не смотря на то, что первая группа составляет меньше 5% от востребованных иероглифов по количеству, по частоте использования они составляют до 25%, потому как к ним относятся многие очень популярные иероглифы.

женщина + ребенок => хорошо

Для составных иероглифов при их анализе имеет смысл раскладывать их на компоненты, так как это позволит проще его запомнить и распознавать в дальнейшем. Существуют сервисы для анализа состава иероглифов.

Часто сочетания компонентов в иероглифе явно не случайны и помогают запомнить смысл: 坏 плохой, испорченный = земля + нет, 好 — хорошо = женщина + ребенок, 灾- несчастье, катастрофа = крыша + огонь.

Чаще компоненты группируются по горизонтали или по вертикали, но есть варианты когда компонент частично или полностью находится внутри другого компонента.

Варианты группировки компонентов в иероглифе

Источник: https://openbooks.lib.msu.edu/chs101/chapter/chinese-characters/

Порядок написания черт и компонентов имеет значение

Исходно порядок оптимизировался под скорость письма и под то, чтобы черты не размазывались при письме чернилами кистью. Кроме того, написание черт в правильном порядке делает иероглиф более узнаваемым, поскольку при быстром письме ряд черт пишут без отрыва и форма иероглифа искажается. Если каждый будет ее искажать произвольным образом, то понять написанное будет крайне сложно.

В эпоху электронных устройств правильное написание важно при распознавании написания от руки. Причем, правильный порядок черт важней общего вида иероглифа - каракули в правильном порядке распознаются лучше красивых иероглифов написанных наугад (речь не о распознавании при сканировании, а о распознавании прям в момент написания).

Современные электронные словари имеют подобные красивые анимации для порядка черт.

Самое общее правило — слева-направо и сверху вниз, но есть ещё несколько правил которые надо учитывать. Бывают отличия в правилах между китайским и японским написанием, читал что на этом даже ловили японских шпионов в Китае во времена их конфликта. Кроме того, порядок написания может изменяться при письме курсивом, адаптируясь под почти безотрывное письмо.

Фонетически, каждый иероглиф произносится как отдельный слог. В китайском языке большинство иероглифов имеет одно чтение, около 15% распространенных иероглифов - более одного чтения. В японском языке с чтением намного больше путаницы, так как есть японское и китайское произношение, плюс вариации. Об этом писали подробно в статье про японский язык.

4. От иероглифов к словам

В простом случае иероглиф сам по себе уже является словом. Но в большинстве других случаев это "почти слово", то есть некая смысловая единица, которая в сочетании с другими такими единицами формирует уже полноценное точное значение.

В классическом китайском было более распространено использование слов из одного иероглифа, в результате тексты были лаконичные, но более сложные и неоднозначные для понимания, поскольку отдельный иероглиф может иметь несколько значений. В современном китайском языке около 80% слов состоят из 2 иероглифов. Некоторые и из большего их числа.

Объединение иероглифов в одно слово может быть по разным принципам:

Дополнительные объяснения и примеры связи иероглиф-слово от переводчика Романа Серебрякова

"В чем сила, брат?"

У иероглифического письма есть ряд преимуществ по сравнению с более известными нам алфавитными языками:

  1. В отличии от алфавитных языков, где часто придумывают кучу новых корней слов без какой-то общей логики, количество компонентов и иероглифов ограничено, поэтому они максимально переиспользуются в различных комбинациях. В итоге, формирование иероглифов и слов может быть довольно логичным (или по крайней мере не скучным) и помогать их запоминанию:

Поиграем в конструктор слов?

Да, в алфавитных языках тоже есть составные слова типа самолет, вездеход и тому подобные, но это все же скорее приятное исключение, чем общее правило. В китайском подобные "конструкторы" в порядке вещей, что делает язык более логичным.

  1. Вторая сильная сторона - иероглифы статичны. То есть они не меняют своего написания и звучания в зависимости от рода, числа, падежа, склонения, спряжения, времени, залога и погоды на Марсе. Нет такого, что для одного слова надо запоминать кучу форм, а потом еще ломать голову какую из них в каком случае применять. В китайском языке грамматика вообще относительно простая, в тех случаях когда надо выразить специальную грамматическую форму просто добавится иероглиф ее выражающий, остальные иероглифы останутся неизменными. Например 们 - показывает множественное число, 了- завершенность действия, есть иероглифы суффиксы и префиксы, которые участвуют в словообразовании. В японском для грамматических функций вместе с иероглифами используют элементы слоговой азбуки, там сложная система грамматики, но сами иероглифы при этом также сохраняют свою форму.

  2. И третий момент который является одновременно и сильной и слабой стороной: иероглифы не завязаны на произношение и в принципе могут быть использованы в качестве письменности для другого диалекта или языка. Это имело большое историческое значение, так как в Китае существовал и существует ряд диалектов носители которых не понимают речь друг друга, но имеют общую письменность, которая объединяла страну и позволяла ей управлять. Эта же особенность позволила ранее заимствовать китайскую письменность японцам, корейцам и вьетнамцам, не смотря на то, что их языки сильно отличаются от китайского.

Обратная сторона медали

Сильные стороны иероглифической письменности я выше указал, но не лишена она и специфических проблем.

  1. Высокая сложность освоения, особенно для письма - писать иероглифы по памяти значительно сложней чем просто распознать иероглиф в тексте.

  2. Слишком разная детализация иероглифов - какие-то состоят всего из нескольких черт, а у каких-то черт больше десятка. В итоге при письме и отображении а экране или печати сложно подобрать адекватный размер, чтобы и простые иероглифы не были непропорционально большими и сложные были хорошо понятными находясь рядом в одной строке.

  3. Невозможность произнести незнакомый иероглиф, а также записать незнакомый услышанный. С современными электронными устройствами это еще решаемо, а вот как страдали раньше, когда кроме бумажного словаря ничего не существовало, мне представить сложно.

  4. Невозможность точно написать иностранное имя собственное - имена, фамилии, географические названия, которая следует из того, что количество слогов ограничено, и не каждое сочетание звуков (особенно когда подряд несколько согласных или гласных) в принципе можно передать такой системой. Кроме того, близкие звуки могут быть переданы разными иероглифами, поэтому нельзя предсказать какие именно были выбраны в качестве стандарта в конкретном случае.

  5. Даже когда иероглиф используется только для озвучки, а не смысла, этот смысл в нем все равно читается и это надо учитывать, иначе можно попасть в просак, как случилось при переводе названия Coca-Cola.

Нельзя просто так взять и записать иероглифами Coca-Cola

Когда в 1928 году Coca-Cola вышла на китайский рынок, название продукта на китайский переводить не стали. Однако некоторые китайские торговцы сделали это самостоятельно, точно передав иероглифами звуки «ко-ка-ко-ла». При этом о смысле надписей они не думали, в результате рождались названия наподобие «Кусай воскового головастика». Маркетологи Coca-Cola перебрали 200 разных иероглифов, но не смогли составить красивую фразу. В результате им пришлось поменять звуки на «ко-ку-ко-ле», что в переводе означает «полный рот счастья». https://facts.museum/3011

Особенности шрифтов для иероглифов

Выбор шрифтов для иероглифов не такой богатый, как для алфавитных языков, потому как разработка нового шрифта для нескольких тысяч символов задача более трудоемкая, даже несмотря на то, что компоненты переиспользуются. Китайские шрифты делятся на три типа (красным названия популярных шрифтов):

Три типа шрифтов для китайских иероглифов

Слева шрифт с засечками, считается шрифтом для печати, средний без них - самый популярный в цифровых материалах, а правый имитирует письмо от руки и используется в обучающих материалах.

Если в одном тексте встречаются и иероглифы и алфавитные шрифты, то начинается игра с размерами шрифта. Проблема в том, что для того чтобы иероглифы с большим количеством деталей были хорошо читаемы их надо делать по размерам в несколько раз выше чем требуется для алфавитных языков с простым написанием, то есть для разных языков стоит использовать разные шрифты.

Хорошо, что в офисных пакетах (по крайней мере в LibreOffice) для текста можно задать разные шрифты и их размеры отдельно для алфавитных и отдельно для азиатских языков. А вот в редакторе статьи у меня не получилось увеличить шрифт для иероглифов, поэтому их плохо видно, местами придется использовать масштабирование страницы.

Как это набирать на компьютере или смартфоне

Существует несколько способов ввода китайских иероглифов, наиболее распространенный из которых - это ввод пиньинь (произношение иероглифа латинскими буквами) и выбор нужного иероглифа из предложенных компьютером.

Существуют альтернативные способы ввода, в том числе ввод "рисованием" (вот тут можно попробовать прям в браузере, из нескольких опробованных - этот само адекватно распознает).

В целом, тема ввода иероглифов подробно уже освещалась на Хабре (раз, два).

А что с письмом от руки?

Это один и тот же иероглиф!

Из современных рукописных стилей различают регулярный, полу-курсив и курсив (слева направо на рисунке).

Регулярный это практически печатные иероглифы, его используют в обучающих материалах, его легко читать, но медленно писать, потому что надо чётко разделять черты с многими отрывами ручки от бумаги. Полу-курсив это то во что превращается регулярный когда писать надо относительно быстро и много. А вот писать и читать курсив — это уже отдельный навык, именно его часто используют в каллиграфии и быстром конспектировании.

Реальное рукописное письмо (вот тут хорошая подборка примеров как от носителей, так и от учеников) даже в регулярном стиле часто выглядит совсем не так ровно и красиво, как в обучающих материалах и каллиграфических шрифтах. Что вряд ли сильно вас удивит, если вспомнить как люди пишут на более простых в написании алфавитных языках.

Чтобы хорошо различать рукописный текст надо хорошо знать иероглифы и язык в целом, тогда можно догадываться что именно пытались написать даже если форма иероглифа искажена.

Чтобы хорошо писать от руки кроме запоминания иероглифов требуется "набить руку". Для этого существуют специальные прописи, которые являются обычным дополнением к обучающим материалам, в том числе есть онлайн генераторы прописей.

FAQ

ПОСЛЕСЛОВИЕ:

Надеюсь статья оказалась интересной. Если у кого есть какие-то замечания и дополнения, если я где-то не прав — пишите в комментариях, самые ценные комментарии добавлю в статью с указанием авторства. На все вопросы постараюсь ответить.

Source habr.com