ВІСНИК ЛЬВІВСЬКОГО УНІВЕРСИТЕТУ

ЛІНГВО-СТАТИСТИЧНІ ХАРАКТЕРИСТИКИ ВОКАБУЛЯРІВ ПЕРЕКЛАДІВ СВЯТОГО ПИСЬМА НА ПРИКЛАДІ СХІДНИХ МОВ – Богдан РУДИЙ

Київський національний університет ім. Тараса Шевченка, Музей лінгвістики,
вул. Володимирська, 60, 01033, Київ, Україна,
тел.: (0038044) 2393497, моб. тел.: (38068)1239318,
e-mail: cri-evol@ukr.net
Подано результати частотного аналізу однакового тексту (Євангеліє від Івана),
перекладеного різними, у тому числі східними, мовами. З порівняльної таблиці
випливає, що найрозвиненішу морфологію серед східних мов мають тюркські мови
(турецька, азербайджанська, узбецька тощо), а найменш розвинену – чаморро,
тагалог та цебуано. Китайська та корейська мови представлені тут умовно, адже для
них не вдалося укласти частотний список слів, а лише ієрогліфів/складів унаслідок
відсутності комп’ютерного алгоритму групування ієрогліфів/складів у слова.
Ключові слова: лінгво-статистичні характеристики, частотний словник,
переклади Святого Письма.
У мовознавстві існують проблеми побудови частотних словників (вокабулярів)
для перекладів одного й того ж тексту, порівняння між собою лінгво-статистичних
характеристик цих вокабулярів та складнощі з єдиної порівняльної таблиці зробити
висновки про те, наскільки ці характеристики відрізняються одна від одної, як вони
корелюють з типологізацією мов, які тенденції простежуються тощо. Ця проблема є
науковою і стосується галузі мовної типологізації. Але одночасно вона є
дидактичною у межах розроблюваних нових методів вивчення та викладання
іноземних мов – “методу частотного штурму” та методу “познайомтеся з мовами!”.
Дослідження проводиться вперше. Подібне за масштабом та суттю дослідження
– порівняння лінгво-статистичних характеристик багатьох перекладів однакового
тексту – відсутнє у світовій літературі. У літературі наявні лише частотні словники
різних текстів (чи текстових корпусів) для окремих мов, наприклад, загальномовний
словник російської мови – Засорина Л. Частотный словарь русского языка. – М.,
1985; фінської мови – Pauli Saukkonen, Marjatta Haipus, Antero Niemikorpi, Helena
Sulkala. Suomen kielen taajuussanasto. A Frequency Dictionary of Finnish. – Helsinki,
1979; англійської мови – частотний словник на основі the Brown Corpus тощо.
Метою статті є презентувати результати дослідження, яке значною мірою
вирішує описану вище проблему.
Ми створили частотні словники (вокабуляри) для перекладів одного й того ж тексту
(Євангеліє від Івана) східними та іншими мовами. Частотні словники є нерафінованими,
тобто словоформи у них не зведені до вихідних форм. До кожного словника створено
діаграму покриття тексту частотними словами. Для понад чверті мов виконано переклад78 Б. Рудий
верхівки списку (N50 чи більше) на українську, російську чи англійську мову. Результати
роботи зведено у порівняльну таблицю 1. Результати роботи виставлено на сайті:
www.Bowfree.com/data/_Frequency%20dictionaries/ Freq_John-u.htm
Таблиця 1
Частотні характеристики однакового тексту (Євангеліє від Івана), перекладеного
60-ма різними мовами*
1 Мова Середня
довжина
слова
N25 N50 N66,7 N80 N90 N100 – кількість
неповторюваних
слів (порівняно
з загальною
кількістю слів у
тексті)
Загальна
кількість
слів у
тексті
Наявність
перекладу
верхівки
списку (N50
чи більше)
2 Maori 6,2 5 16 37 85 191 944 (3,8%) 24961 (100%)
3 Afrikaans 6,2 7 23 58 138 317 1320 (6,5%) 20204 (100%) +
4 Korean 1,0 8 26 46 84 150 627 (1,8%) 35065 (100%)
5 Chamorro 7,7 6 28 86 251 681 2109 (12,2%) 17263 (100%)
6 Tagalog 8,2 6 28 84 228 565 2011 (10,0%) 20110 (100%)
7 Esperanto 6,6 7 28 91 238 602 1925 (11,0%) 17493 (100%) +
8 Cebuano 7,9 5 30 84 235 627 2193 (10,8%) 20380 (100%)
9 Norwegian 6,0 10 32 89 205 437 1540 (8,6%) 18008 (100%) +
10 English 5,9 9 33 80 182 391 1412 (7,6%) 18684 (100%) +
11 English,
literal
transl 6,0 9 34 77 164 337 1279 (6,3%) 20430 (100%)
12 Chinese 1,0 9 36 86 165 307 1041 (4,4%) 23640 (100%)
13 Danish 6,2 11 36 97 224 503 1676 (9,3%) 17942 (100%)
14 Dutch 6,7 11 37 100 231 497 1698 (9,0%) 18832 (100%) +
15 Spanish 6,7 8 39 116 288 689 2103 (11,8%) 17761 (100%) +
16 Swedish 6,2 11 39 113 256 557 1853 (9,8%) 18951 (100%) +
17 Albanian 6,2 9 40 143 389 929 2514 (13,6%) 18487 (100%)
18 Gaelic
manx 6,4 9 41 104 238 511 1732 (8,6%) 20156 (100%)
19 Breton 6,3 9 44 127 294 654 2027 (10,4%) 19479 (100%)
20 Gypsy 6,7 10 45 120 268 561 1766 (9,7%) 18134 (100%)
21 Indonesian 8,1 11 45 117 281 613 1812 (10,6%) 17080 (100%)
22 Hebrew 4,3 6 46 173 484 1083 2503 (17,1%) 14669 (100%) +
23 Hungarian 7,6 7 47 213 649 1593 3191 (20,0%) 15986 (100%)
24 French 6,9 11 47 128 307 694 2115 (11,6%) 18311 (100%) +
25 Portuguese 6,9 8 48 142 339 769 2161 (12,9%) 16704 (100%) +
26 Greek old 8,0 10 48 216 682 1712 3159 (21,8%) 14475 (100%) +
27 German 6,8 13 50 129 296 661 2014 (11,0%) 18265 (100%) +
28 Icelandic 6,1 11 51 163 408 920 2376 (13,9%) 17133 (100%)
29 Vietnamic 6,4 15 54 117 251 581 2153 (10,8%) 19942 (100%)
30 Italian 6,9 13 55 144 338 771 2204 (12,5%) 17601 (100%) +
31 Bulgarian 6,5 13 56 176 443 986 2422 (15,2%) 15933 (100%)
32 Latvian 6,7 13 56 192 528 1148 2602 (17,8%) 14615 (100%)
33 Welsh 6,2 10 57 145 335 738 2206 (11,3%) 19581 (100%)
34 Wolof 5,4 15 57 132 283 591 1816 (10,1%) 18018 (100%)
35 Greek
modern 6,8 13 60 198 507 1118 2714 (15,5%) 17459 (100%)
36 Gothic 7,0 13 60 181 410 857 1771 (19,4%) 9145 (100%) Лінгво-статистичні характеристики вокабулярів перекладів Святого Письма … 79
Закінчення табл. 1
37 Estonian 6,6 14 62 191 468 1036 2487 (15,6%) 15906 (100%)
38 Romanian 6,3 14 63 170 379 782 2118 (12,0%) 17703 (100%)
39 Ukrainian 6,6 14 64 217 576 1254 2806 (18,1%) 15520 (100%) +
40 Belorussian 6,7 15 70 219 555 1165 2629 (17,9%) 14654 (100%)
41 Latin 7,2 13 71 226 545 1131 2520 (17,9%) 14057 (100%)
42 Croatian 6,2 13 72 207 489 1042 2413 (15,9%) 15174 (100%)
43 Georgean 7,6 10 75 256 646 1406 2790 (20,2%) 13842 (100%)
44 Russian 6,6 14 76 236 582 1195 2640 (18,2%) 14469 (100%) +
45 Uma 7,7 13 77 213 511 1142 2755 (15,8%) 17385 (100%)
46 Finnish 7,9 14 80 268 684 1497 3013 (19,9%) 15169 (100%)
47 Slovak 6,3 17 80 219 532 1141 2621 (16,7%) 15672 (100%)
48 Arabic 4,9 12 82 285 709 1508 2831 (21,4%) 13231 (100%) +
49 Polish 7,1 17 96 296 699 1423 2941 (19,4%) 15186 (100%)
50 Armenian 6,7 18 103 328 817 1751 3206 (22,0%) 14560 (100%) +
51 Czech 6,3 21 106 292 669 1370 2785 (19,7%) 14150 (100%)
52 Swahili 7,9 22 110 294 731 1670 3034 (22,2%) 13645 (100%)
53 Lithuanian 7,2 20 113 354 896 1902 3255 (24,1%) 13529 (100%)
54 Basque of
1571 7,9 22 125 350 762 1522 2980 (20,4%) 14588 (100%)
55 Kyrgyz 7,3 26 130 383 925 1891 3302 (23,4%) 14114 (100%)
56 Azerbaijan 7,4 28 150 436 1013 2003 3351 (24,8%) 13485 (100%)
57 Basque 7,6 24 153 443 957 1875 3325 (23,0%) 14487 (100%)
58 Uzbek 7,7 31 188 577 1300 2508 3881 (28,3%) 13733 (100%)
59 Turkish 7,9 36 205 581 1248 2354 3559 (29,5%) 12056 (100%) +
60 Xhosa 8,4 30 236 757 1770 2961 4152 (34,9%) 11911 (100%)
61 Thai 18,9 28 766 1812 2612 3228 3843 (62,4%) 6155 (100%)
* Список мов є відранжованим за кількістю найчастіше уживаних слів тексту, необхідних для
покриття 50% тексту (N50
). Східні мови виділено жирним шрифтом.
Рис. 1. Діаграма покриття тексту частотними словами
(для Євангелія від Івана на івриті) 80 Б. Рудий
Таблиця 2
Найчастіше уживані слова тексту, необхідні для покриття 50% тексту (N50
)
Ранг Слово Транскрип-
ція
Переклад Частота Скільки % покриває
разом з попередніми
1 [ ו ве] и 1651 11,3
2 [ ה га] артикль 820 16,8
3 [ כי ки] ибо, потому что 379 19,4
4 [ את ат]
префикс винительного
падежа
378 22
5 [ לא ло] не, нет 319 24,2
6 [ אשר ашéр] который, что 314 26,3
7 [ ישוע йешуа] Иисус 251 28
8 [ הוא гу] он; он/это есть 246 29,7
9 [ אל аль] не 182 30,9
10 [ יאמר йамáр] он сказал 176 32,1
11 [ אני анú] я 155 33,2
12 [ אם им] если 127 34,1
13 [ אליו елив] ему 122 34,9
14 [ איש иш] мужчина 120 35,7
15 [ על аль] на 108 36,5
16 [ זה зэ] это, этот 107 37,2
17 [ אתם атéм] вы (мужской род) 91 37,8
18 [ גם гам] также 89 38,4
19 [ לכם лэхéм] вам (мужской род) 81 39
20 [ מן мин] из, от 75 39,5
21 [ יען йаан] отвечая 71 40
22 [ אמר амéр] он сказал 71 40,4
23 [ יהי йегé] есть, является 70 40,9
24 [ כל коль] все, всё 69 41,4
25 [ דבר дувар] слово, вещь 68 41,9
26 [ אתה атá] ты 68 42,3
27 [ אתו итó; отó] с ним; (н)его 68 42,8
28 [ אלהים элогúм] Бог 68 43,2
29 [ אבי авú] мой отец 68 43,7
30
יאמרו
ויאמרו
[йамеру] они сказали 67 44,2
31 [ אליהם элейгéм] им 67 44,6
32 [ היה гайá] был, была 64 45,1
33 [ עולם олáм] мир, век 63 45,5
34 [ למען лемаан] для 62 45,9
35 [ יהודים йагудúм] иудеи 61 46,3 Лінгво-статистичні характеристики вокабулярів перекладів Святого Письма … 81
Закінчення табл. 2
36 [ מה ма] что? 56 46,7
37 [ זאת зот] эта 56 47,1
38 [ לו ло] ему 52 47,4
39 [ בו бо] в нём; им 52 47,8
40 [ אמן амéн] аминь, поправде 51 48,1
41 [ לי ли] мне; мой 50 48,5
42 [ עתה атá] сейчас 50 48,8
43 [ בן бэн] сын 48 49,2
44 [ כאשר каáшер] когда, поскольку 48 49,5
45 [ הנה гинé] вот 44 49,8
46 [ עשה асá] сделал 44 50,1
Наступна таблиця дає уявлення про мови, залучені до дослідження.
Таблиця 3
Уривок з Євангелія від Івана (перші 5 віршів) 18-ма східними мовами*
Українська 1 Споконвіку було Слово, а Слово в Бога було, і Бог було Слово.
2 Воно в Бога було споконвіку.
3 Усе через Нього повстало, і ніщо, що повстало, не повстало без Нього.
4 І життя було в Нім, а життя було Світлом людей.
5 А Світло у темряві світить, і темрява не обгорнула його.
Китайська
1 太 初 有 道 , 道 与 神同 在 , 道 就 是 神 。
2 这 道 太 初 与 神 同 在。
3 万物是藉着他造的。凡被造的,没有一样不是藉着他造的。
4 生 命 在 他 里 头 。 这生 命 就 是 人 的 光 。
5 光 照 在 黑 暗 里 , 黑暗 却 不 接 受 光 。
Корейська
1 태 초 에 말 씀 이 계 시 니 라 이 말 씀 이 하 나 님 과 함 께 계 셨
으 니 이 말 씀 은 곧 하 나 님 이 시 니 라
2 그 가 태 초 에 하 나 님 과 함 께 계 셨 고
3 만 물 이 그 로 말 미 암 아 지 은 바 되 었 으 니 지 은 것 이 하 나
도 그 가 없 이 는 된 것 이 없 느 니 라
4 그 안 에 생 명 이 있 었 으 니 이 생 명 은 사 람 들 의 빛 이 라
5 빛 이 어 두 움 에 비 취 되 어 두 움 이 깨 닫 지 못 하 더 라
ﺑﻮﻟﺲ وﺳﻠﻮاﻧﺲ وﺗﻴﻤﻮﺛﺎوس اﻟﻰ آﻨﻴﺴﺔ اﻟﺘﺴﺎﻟﻮﻧﻴﻜﻴﻴﻦ ﻓﻲ اﷲ اﺑﻴﻨﺎ واﻟﺮب ﻳﺴﻮع اﻟﻤﺴﻴﺢ Арабська 1
ﻧﻌﻤﺔ ﻟﻜﻢ وﺳﻼم ﻣﻦ اﷲ اﺑﻴﻨﺎ واﻟﺮب ﻳﺴﻮع اﻟﻤﺴﻴﺢ 2
ﻳﻨﺒﻐﻲ ﻟﻨﺎ ان ﻧﺸﻜﺮ اﷲ آﻞ ﺣﻴﻦ ﻣﻦ ﺟﻬﺘﻜﻢ اﻳﻬﺎ اﻻﺧﻮة آﻤﺎ ﻳﺤﻖ ﻻن اﻳﻤﺎﻧﻜﻢ ﻳﻨﻤﻮ آﺜﻴﺮا وﻣﺤﺒﺔ آﻞ 3
واﺣﺪ ﻣﻨﻜﻢ ﺟﻤﻴﻌﺎ ﺑﻌﻀﻜﻢ ﻟﺒﻌﺾ ﺗﺰداد
ﺣﺘﻰ اﻧﻨﺎ ﻧﺤﻦ اﻧﻔﺴﻨﺎ ﻧﻔﺘﺨﺮ ﺑﻜﻢ ﻓﻲ آﻞ آﻨﺎﺋﺲ اﷲ ﻣﻦ اﺟﻞ ﺻﺒﺮآﻢ واﻳﻤﺎﻧﻜﻢ ﻓﻲ ﺟﻤﻴﻊ اﺿﻄﻬﺎداﺗﻜﻢ 4
واﻟﻀﻴﻘﺎت اﻟﺘﻲ ﺗﺤﺘﻤﻠﻮﻧﻬﺎ
.ﺑﻴﻨﺔ ﻋﻠﻰ ﻗﻀﺎء اﷲ اﻟﻌﺎدل اﻧﻜﻢ ﺗﺆهﻠﻮن ﻟﻤﻠﻜﻮت اﷲ اﻟﺬي ﻻﺟﻠﻪ ﺗﺘﺄﻟﻤﻮن اﻳﻀﺎ 5 82 Б. Рудий
Продовження табл. 3
בראשית היה הדבר והדבר היה את האלהים ואלהים היה הדבר׃ Іврит 1
הוא היה בראשית אצל האלהים׃ 2
הכל נהיה על ידו ומבלעדיו לא נהיה כל אשר נהיה׃ 3
בו היו חיים והחיים היו אור בני האדם׃ 4
והאור בחשך זרח והחשך לא השיגו׃ 5
Турецька 1 Başlangıçta Söz vardı. Söz Tanrı’yla birlikteydi ve Söz Tanrı’ydı.
2 Başlangıçta O, Tanrı’yla birlikteydi.
3 Her şey O’nun aracılığıyla var oldu, var olan hiçbir şey O’nsuz olmadı.
4 Yaşam O’ndaydı ve yaşam insanların ışığıydı.
5 Işık karanlıkta parlar ve karanlık onu alt edememiştir.
Азербайджанська 1 Əzəldən Kəlam mövcuddur; Kəlam Allahda olub və Kəlam Allah olub.
2 O əzəldən Allahda olub.
3 Hər şey Onun vasitəsilə yarandı və yaranan şeylərin heç biri Onsuz
yaranmadı.
4 Həyat onda olub, həyat isə insanların nuru olub.
5 Nur qaranlıqda parlayır və qaranlıq onu dərk etməmişdir.
Узбецька 1 Азалда Калом бор эди. Калом Худо ҳузурида эди, Калом — Худо эди.
2 Азалданоқ У Худо ҳузурида эди.
3 Борлиқ У орқали бор бўлган, Усиз ҳеч нарса бор бўлган эмас. Неки бор
бўлган бўлса, У орқали бор бўлган.
4 Унда ҳаёт бор эди, Ҳаёт инсонларнинг нури эди.
5 Нур зулматда порлайди, Зулмат эса нурни қоплай олмади.
Киргизька 1 Эң башында Сөз бар болгон, Сөз Кудайда болгон жана Сөз Кудай
болгон.
2 Сөз эң башында Кудайда болгон.
3 Бардыгы Ал аркылуу башталган, эмне башталса да, Ансыз башталган
эмес.
4 Анда өмүр болгон, ал өмүр адамдар үчүн жарык болгон.
5 Жарык караңгыда жаркырап турат, караңгылык жарыкты каптаган жок.
Вірменська 1 Սկիզբէն էր Խօսքը, ու Խօսքը Աստուծոյ քով էր, եւ Խօսքը Աստուած
էր.
2 ան սկիզբէն Աստուծոյ քով էր:
3 Ամէն ինչ եղաւ անո՛վ. եղածներէն ո՛չ մէկը եղաւ առանց անոր:
4 Կեանքը անով էր, ու կեանքը մարդոց լոյսն էր.
5 լոյսը կը փայլէր խաւարի մէջ, բայց խաւարը չճանչցաւ զայն:
В’єтнамська 1 Ban ñaàu coù Ngoâi Lôøi, Ngoâi Lôøi ôû cuøng Ñöùc Chuùa Trôøi, vaø
Ngoâi Lôøi laø Ñöùc Chuùa Trôøi.
2 Ban ñaàu Ngaøi ôû cuøng Ñöùc Chuùa Trôøi.
3 Muoân vaät bôûi Ngaøi laøm neân, chaúng vaät chi ñaơ laøm neân maø
khoâng bôûi Ngaøi.
4 Trong Ngaøi coù söï soáng, söï soáng laø söï saùng cuûa loaøi ngöôøi.
5 Söï saùng soi trong toái taêm, toái taêm chaúng heà nhaän laáy söï saùng.
Індонезійська 1 Pada mulanya adalah Firman; Firman itu bersama-sama dengan Allah dan
Firman itu adalah Allah.
2 Ia pada mulanya bersama-sama dengan Allah.
3 Segala sesuatu dijadikan oleh Dia dan tanpa Dia tidak ada suatupun yang
telah jadi dari segala yang telah dijadikan.
4 Dalam Dia ada hidup dan hidup itu adalah terang manusia.
5 Terang itu bercahaya di dalam kegelapan dan kegelapan itu tidak
menguasainya. Лінгво-статистичні характеристики вокабулярів перекладів Святого Письма … 83
Закінчення табл. 3
Цебуано 1 Sa sinugdan mao na ang Pulong, ug ang Pulong uban sa Dios, ug Dios ang
Pulong.
2 Kini siya sa sinugdan uban sa Dios.
3 Ang tanang mga butang nangahimo pinaagi kaniya; ug niadtong mga
nangahimo na, walay bisan usa nga nahimo nga dili pinaagi kaniya.
4 Diha kaniya ang kinabuhi, ug ang maong kinabuhi mao ang kahayag alang
sa mga tawo.
5 Ug ang kahayag nagadan-ag sa taliwala sa kangitngitan, ug ang kangitngitan
wala makabuntog kaniya.
Тагалог (Філіпіни) 1 Nang pasimula siya ang Verbo, at ang Verbo ay sumasa Dios, at ang Verbo
ay Dios.
2 Ito rin nang pasimula’y sumasa Dios.
3 Ang lahat ng mga bagay ay ginawa sa pamamagitan niya; at alin man sa
lahat ng ginawa ay hindi ginawa kung wala siya.
4 Nasa kaniya ang buhay; at ang buhay ay siyang ilaw ng mga tao.
5 At ang ilaw ay lumiliwanag sa kadiliman; at ito’y hindi napagunawa ng
kadiliman.
Тайська 1 ในเรมแรกน ่ิ นพระวาทะทรงเป ้ั นอย  แลู ว และพระวาทะทรงอยกูบพระเจ ั า และพระวาทะทรงเปนพระเจ  า
2 ในเรมแรกน ่ิ นพระองค ้ั น นทรงอย ้ั กูบพระเจ ั า
3 พระองคทรงสร  างส ่ิงทงปวงข ้ั นมา ้ึ และในบรรดาสงท่ิ เป่ี นมาน  น้ั ไมม สีกสั งเด่ิ ยวท ี ได่ี เป นมานอกเหน  อพระองค ื 
4 ในพระองคม ชีวีติ และชวีิตนนเป้ั นความสว  างของมน  ษยุ ท งปวง ้ั
5 ความสวางน นส้ั องเข  ามาในความม  ดื และความมดหาได ื เข าใจความสว  างไม  
Чаморро 1 Y tutujonña gaegue y Finijo, ya y Finijo güiya yan si Yuus; ya y Finijo güiya
si Yuus.
2 Güiya gaegue gui tutujonña yan si Yuus.
3 Todo y güinaja sija manmafatinas pot güiya; yaguin ti pot güiya, taya ni esta
mafatinas, nu y gaegue gui finatinas sija.
4 Y linâlâ gaegue guiya güiya, ya y linâlâ, güiya y candet y taotao sija.
5 Ya y candet gui jalom jomjom maniina, ya y jemjom ti matungo.
Ума 1 Lomo’ -na, kako’ia-na dunia’ rapajadi’, mpolia’ ria-imi-hana Lolita. Lolita
toei, dohe Alata’ala-i, pai’ Lolita toei, Hi’a moto-mi Alata’ala.
2 Ngkai lomo’ -na-imi dohe Alata’ala-e.
3 Hi’a-mi to napopale Alata’ala mpopajadi’ hawe’ea to rapajadi’. Uma ria
hanyalaa to jadi’ ane uma Hi’a.
4 Hi’a-mi pehupaa’ katuwua’, pai’ Hi’a-mi baja to mpobajahi nono manusia’.
5 Baja toe mehini ncuu hi rala kabengia-na, pai’ kabengia uma mpakulei’ mpopatehi-i.
Хоса 1 Ekuqalekeni ube ekho uLizwi, waye uLizwi ekuye uThixo, waye uLizwi
enguThixo.
2 Yena lowo ebekho ekuqalekeni kuThixo.
3 Izinto zonke zabakho ngaye; engekho yena, akubangakho nanye into ethe yabakho.
4 Kuye kwakukho ubomi, baye ubomi obo bulukhanyiselo lwabantu.
5 Ukhanyiso ke olo lwabonakala ebumnyameni, basuka ubumnyama abaluqiqa.
Циганська 1 Anda gor sas E Vorba, ai E Vorba sas le Devlesa, ai E Vorba sas O Del.
2 Wo anda gor sas le Devlesa.
3 Wo kerdia swako fielo, ai kanchi so kerdilo nas kerdo bi leste.
4 Ande leste sas o traio, ai o traio sas e vediara le manushenge.
5 E vediara strefial ando tuniariko, ai o tuniariko shoxar chi mudardia e
vediara.
* На початку подано український варіант як переклад уривка. 84 Б. Рудий
З таблиці 1 випливає, що найбільш розвинену морфологію серед східних мов
мають тюркські мови (турецька, азербайджанська, узбецька тощо), а найменш
розвинену – чаморро, тагалог та цебуано.
З таблиць 1, 2 та рисунка 1 видно велику дидактичну користь створення
частотних словників, бо студент, скажімо, івриту, завчивши лише перші 46 слів,
здатний упізнавати кожне друге слово тексту.
Для китайської та корейської мов нагально стоїть проблема створення
загальномовного частотного словника, а для цього необхідно винайти комп’ютерний
алгоритм групування ієрогліфів/складів у слова.
Наступним етапом плануємо опублікувати сутність нових методів вивчення та
викладання іноземних мов – „метод частотного штурму” і метод „ознайомтеся з мовами!”,
та результати спроби побудови експериментального підручника на їхній основі.
Нам вдалося в загальних рисах розробити напівавтоматичний алгоритм
створення частотних словників китайської та корейської мов. Тому одним із
наступних завдань мусить бути опис і спроба реалізації такого алгоритму.
__________________________
LINGVO-STATISTICAL CHARACTERISTICS OF THE
VOCABULARIES OF THE HOLY SCRIPTURES TRANSLATIONS
ON THE EXAMPLE OF ORIENTAL LANGUAGES
Bogdan RUDYJ
Taras Shevchenko Kyiv National University, Linguistics’ museum,
Volodymyrska str., 60, 01033, Kyiv, Ukraine,
tel.: (0038044)2393497; (38068)1239318; e-mail: cri-evol@ukr.net
The paper presents the results of comparative analyses of lingvo-statistical
characteristics of the translations of the Gospel of John in 60 languages, icluding 19 oriental
ones. For this reason frequency dictionaries for all this translations have been built. It is seen
that of all oriental languages the Turkic languages have the most developed (complicated)
morphology system, whereas the Chamorro, Tagalog and Cebuano – the most simple
morphology system. It can be seen also that Chinese and Korean frequency dictionaries are
not the word-ones, but hieroglyph/syllable ones, – meaning that an algorithm for creating
frequency dictionaries is still unrealized.
Key words: lingvo-statistical characteristics, frequency dictionary, translations of the
Holy Scriptures.
Стаття надійшла до редколегії 27.09.2007
Прийнята до друку 03.03.2008

Літературне місто - Онлайн-бібліотека української літератури. Освітній онлайн-ресурс.