Гра в латинку

Yevgen Sadko
7 min readOct 24, 2021

--

На тлі війни та пандемії українці знову взялися за улюблений різновид прокрастинації — суперечки навколо «переходу на латинку». І як завжди, цим суперечкам не вистачає раціональних аргументів. Навіть сам предмет спору — кирилиця проти латинки — відволікає від суті. Адже писемність не має значення у відриві від мови.

Для кожної писемності мова — як окрема дисципліна для спортсмена, який може бути хорошим тенісистом і, водночас, поганим футболістом. Тому треба розглядати окремі мови у різних абетках, а не всю кирилицю чи всю латинку.

Літери та слова української мови

Граматика та орфографія визначають характер слів, розподіл літер. Ці особливості унікальні для кожної мови. Тому, перш ніж думати про перехід на латинку, треба розглянути графеми, які дає нашій мові кирилиця, наскільки вони зручні, економічні, візуально збалансовані.

Частотний словник Генерального регіонально анотованого корпусу української мови (ГРАК) показує, що усі українські тексти на 8,3% складаються з однієї літери о. І більш ніж на третину — з п’яти літер о, а, н, и, і.

В україномовних текстах заголовні літери вживаються у 35 разів рідше, ніж рядкові, та використовуються в особливих випадках: на початку речень, іменах, власних назвах, абревіатурах і титульних написах. Тому вони розподілені по текстах інакше. Найрозповсюдженішими заголовними літерами є В, П, Н, А, Т.

Уживаність літер визначає вплив кожної літери на об’єм усіх текстів. Наприклад, при зменшенні ширини літер о, а, н на 20% більшість текстів займатиме на 4,5% менше місця, хоча довжина набраної в один рядок абетки зменшиться лише на 1,75%. Порівняймо це зі зміною широких літер ж, ш, щ, які не до вподоби багатьом. Якщо ми зробимо їх на 20% вужче, місткість текстів збільшиться лише на 1%. Ці величини стосуються тільки україномовних текстів, в інших мовах ті ж самі літери впливають на місткість текстів інакше.

Звісно, текст складається не з окремих літер, а зі слів, які теж розподілені нерівномірно. Частотний аналіз показує, що 33% усіх україномовних текстів складається зі 100 слів. А одинадцять однолітерних слів: і, в, з, у, а, й, я, ж, є, б покривають 10% корпусу української мови.

Не менш корисним буде врахування розповсюдженості дволітерних сполучень. Топ-100 дволітерних сполучень покриває 63% усіх українських текстів.

Форма і пластика української абетки

Кожен дизайнер хоч раз сварив кирилицю за форму і пластику літер. Її вважають парканом, і небезпідставно. Але перш ніж оголошувати вирок, треба дослідити докази та розібратися, в чому саме винен підсудний. Може є пом’якшувальні обставини?

Майже 40% заголовних літер в україномовних текстах — це справжній паркан. Жахливі перпендикуляри, чотири однакових звисання і такий самий гачок згори. Дуже мало овальних форм — лише 15%. Але заголовні літери покривають тільки 3% мови й рідко збираються у групи більше ніж три. Це є пом’якшувальною обставиною.

Рядкові літери набагато гармонійніші. Вони перетворюють на паркан лише 32% тексту, а крапки над і та ї урізноманітнюють монотонність своєї групи. 21% текстів складається з приємних овалів, а 19% з непоганого сполучення напівовалів та прямих. Виносні елементи рядкових літер теж доволі красиві. Шкода, що у, р, б, ф покривають лише 10% текстів

В українській абетці є дві серйозні проблеми: надмірна схожість рядкових і заголовних літер і занадто часте використання поперечини, як у Н, н. Цей елемент використовується у 13 рядкових та у 15 заголовних літерах. Зайва деталізація графем підвищує ризик оптичних викривлень та розтікання друкарської фарби.

В російській абетці усе значно гірше, через ё, ы, ъ «талія» навантажена у 16 рядкових та 18 заголовних. Натомість в англійській мові — зона поперечини використовується лише у 5 рядкових та 10 заголовних літерах. Простота форми та багато витончених виносних елементів робить англійський текст менш вразливим до фізичних та оптичних викривлень. Це не краса латинки як такої, а краса англійської мови у виконанні латинки.

Вказані особливості кирилиці в українській мові мають відношення лише до графем, а не до історії чи політики. Українська мова та її абетка дійсно могли б виглядати краще, хоча і зараз вона є найкращою (на мій погляд) та найекономнішою (статистично) з усіх кириличних абеток!

У справі вдосконалення української абетки відомі дві утопічні ідеї: перша — відійти від «гражданського шрифту», який придумав Петро I та перейти на «Рутенію», друга — перейти на латинку.

Перша ідея дещо архаїчна, вона передбачає повернення до джерел, до міфічної України Гоголя чи Шевченка. А друга ідея прогресистська і трохи толкієнівська. Її прибічники кажуть, що ми повинні перейти на латинку, щоб остаточно розірвати з Росією і потрапити під вплив західної цивілізації, нібито латинка — це чарівна мова вищих ельфів, а кирилиця нам дісталася від самого Саурона.

Українська латинка

Перейти на латинку можна кількома способами. Візьмемо для прикладу два максимально різних способи транслітерації української мови: міжнародний стандарт ISO 9 та «національну транслітерацію» — і дослідимо їх з урахуванням частотного аналізу мови.

Національна транслітерація української мови

Сьогодні в Україні діє порядок транслітерації української абетки прийнятий кабінетом міністрів у 2010 році.

Така абетка, мабуть, може потішити когось відсутністю літер ц, щ, ж, які часто критикують російські дизайнери, але разом з цими досягненнями з’являється низка проблем:

  1. Втрачена відповідність графіки і фонетики мови. Замість 1 літери на 1 звук та один знак м’якості, введені буквосполучення ia, ch, kh, zh, iu, sh, ts, yi, shch, ie.
  2. Ускладнені правила правопису 5 літер: ia (ya), i (y), iu (yu), i (yi), ie (ye).
  3. Додаткове правило для заміни апострофу і м’якого знаку.
  4. Зменшена на 1% місткість усіх україномовних текстів.
  5. Деякі дуже популярні слова змінилися до невпізнання, наприклад: що (shcho), ще (shche), якщо (yakshcho).
  6. Збільшилася кількість виносних елементів, але вони стали однаковішими. У 99,85% текстів використовуються лише вертикалі (як у h, k) та звисання (як в y). Велика кількість будь-яких однакових елементів знижує швидкість розпізнавання слів.

Транслітерація за стандартом ISO 9

Міжнародний стандарт ISO 9 визначає спосіб транслітерації кириличних абеток.

Цей варіант абетки теж порадує тих, хто не любить парканні літери п, ц, щ або ж, що іноді запливає фарбою. Крім того, ці латинські літери, як і кириличні, передають по одному простому чи складному звуку. Символи для м’якого знаку та апострофу теж залишаються. Також місткість українських текстів збільшується. Тексти, набрані такою абеткою будуть на 14% коротше.

Але у цієї системи є серйозний недолік — дуже слабка розрізнюваність знаків. 20 з 32 літер можна сплутати одна з одною. Наприклад, у випадку з дорожніми знаками, від швидкості розпізнавання написів залежить ризик потрапити в аварію. Через спробу передати складні звуки однією літерою з’явилося дуже багато діакритичних знаків, які створюють труднощі при друку і сповільнюють розпізнавання знаків як людиною, так і комп’ютером. Замість кириличних літер: и, і, ї, у, ю, е, є, с, ш, щ, ч, ц, з, ж, а, я, г, ґ, ь, використовуються латинські: i, ì, ï, u, û, e, ê, s, š, ŝ, c, č, z, ž, a, â, g, ģ, , .

Ще одна заковика у латинці ISO 9 — «кириличний паркан», від якого буцімто рятує латинка, не тільки не зникає, але навпаки, погіршується. Замість 32,5% уживань «парканних» літер з вертикалей та горизонталей у кирилиці ми маємо 44,1% тексту у вигляді латинського «паркану». Цей паркан виглядає приємніше за рахунок відсутності горизонталей, але читається він навіть гірше, ніж звичний паркан з горизонталями.

А ще є така нудна річ, як матеріальні витрати. Щоб перейти на латинку Україні треба витратити мільярди доларів і пару десятиліть. За цей час доведеться зробити кілька «кроків назустріч людям»:

  1. Змінити документи 45 мільйонів людей.
  2. Передрукувати закони, правила, весь документообіг.
  3. Передрукувати навчальну літературу для усіх освітніх закладів.
  4. Підвищити навантаження на викладачів, учнів і студентів.
  5. Перевчити мільйони держслужбовців та бюджетників.
  6. Передрукувати українську художню літературу.
  7. Переробити усі монети і банкноти.
  8. Замінити мільйони дорожніх знаків, покажчиків, табличок.
  9. Отримати додатковий розкол у суспільстві.
  10. Загострити конфлікт старшого і молодшого покоління.
  11. Сповільнити усі процеси, де люди читають тексти.
  12. Зазнати підвищених збитків від ДТП через нові дорожні знаки, які читаються незвично.

Після цього ми відмовимося не тільки від «гражданського шрифту», але і від нашої історичної писемності. Київські князі, літописці, гетьмани, козаки, українські поети й письменники писали кирилицею. Також ми витратимо час і гроші на ускладнення власної мови, хоча вона і зараз розвивається не дуже швидко. І все це заради перевірки примарної гіпотези про те, що радикальна зміна абетки зробить Україну принципово прогресивнішою. Цікаво, хтось з прибічників латинізації розуміє, що гіпотеза може виявитися хибною, що латинка буде «поганим футболістом», та ще й до біса дорогим?

Латинізована Україна Майбутнього

Уявімо Україну 2041 року. Ми, нарешті, остаточно перейшли на латинку, стали дуже цивілізованими і несхожими на росіян. Але виявилося, що для розуміння західних текстів треба знати не писемність, а європейські мови. Тим часом, весь світ вже 10 років майже не вживає писемність, інтерфейси голосові або візуальні, а машинний переклад практично відмінив мовний бар’єр.

Directed by Robert B. Weide

Корисні посилання:

--

--

Yevgen Sadko

I have a dream that one day, font designers will be able to join hands with font users as sisters and brothers.