Лінгвістичні студії: Збірник наукових праць.

Соломія Бук – ЧАСТИНИ МОВИ У СЛОВНИКУ І ТЕКСТІ ІВАНА ФРАНКА (НА МАТЕРІАЛІ ВЕЛИКОЇ ПРОЗИ)

На основі частотних словників до шести романів І. Франка загальним обсягом понад 370 тис. отримано
кількісні дані про функціонування частин мови у словнику й тексті письменника. Виявлено їх співвідношення за
романами, зіставлено ці дані з аналогічними показниками текстів інших українських письменників та
художньої прози загалом. Обчислено індекси епітетизації, номіналізації та дієслівних означень.
Ключові слова: частини мови, частотність, статистичні характеристики, частотний словник,
кількісні реляції між частинами мови.

1. Вступ. Загальні властивості слів, їх значення набувають у мові спеціального узагальненого вираження,
яке передають частини мови, тому аналіз частин мови науковці справедливо вважають однією з основних
проблем дослідження тексту, зокрема статистичного [Перебийніс 1985: 152].
Оскільки кожна частина мови має своє узагальнене категорійне значення, то логічною є гіпотеза, що
кількісне співвідношення частини мови у творчості письменника може свідчити про особливості його
ідіостилю, а зміна цього співвідношення на хронологічній шкалі – про зміну його стилю у часі. ―Вважається,
що частини мови надто абстрактні та інертні, що би брати участь у формуванні стилів окремих авторів. Однак
цифри говорять протилежне. … Адже наші поняття та уявлення одягнені у форму слів, а самі слова реально
відомі нам у формі тієї чи іншої частини мови. Мовленнєвий потік подібний до потоку людей взимку та
навесні: змінюється співвідношення одягнених по-весняному або по-зимовому – змінюється і загальний вигляд
натовпу.‖ [Головин 1971: 7]. Кількісний аналіз частин мови здійснено на матеріалі багатьох мов, зокрема
англійської [Потапенко 1999], польської [Ruszkowski 2004; Skubalanka 1986, Zembaty-Michalakowa 1982],
російської [Климова 2004, Шайкевич 2003], чеської [Čermбk 2007] тощо. Є й частотні словники, в яких подають
частотні списки окремо для кожної частини мови [Leech 2001: 271-293; Čermбk 2007]. На матеріалі української
мови виявлено особливості поведінки частин мови у різних функціональних стилях [Перебийніс 1967,
Тищенко 1970] й у творах деяких українських письменників (О. Довженка, Г. Тютюнника, Ю. Смолича,
М. Стельмаха та ін.) [Перебийніс 1985: 152-159]. Дослідження частин мови у тексті й реєстрі вважають
важливим етапом встановлення індивідуально-авторських особливостей [Перебийніс 1985: 186-187;
Ruszkowski 2004: 50].
Велика проза І. Франка ще не була об’єктом дослідження у такому ракурсі, хоча І. Франко й сам надавав
великої ваги використанню тієї чи іншої частини мови у тексті, наприклад, свою працю про переклад
С. Твердохлібом ―Каменярів‖ він завершує квантитативними узагальненнями: ―В оригіналі усіх слів ужито 388,
а в перекладі 426, т. є. о 27 слів більше. … В оригіналі іменників 109, прикметників 46, а дієслів 49; у перекладі
іменників 104, прикметників 59, а дієслів 57. … Обчислюючи процентові відносини іменників, прикметників і
дієслів до загального числа слів у обох творах, бачимо, що в оригіналі іменники творять 25,37%, прикметники
11,56%, а дієслова 12,31%, коли натомість у польськім перекладі іменники творять 33,36%, прикметники
13,84%, а дієслова 13,38%‖ [Франко 1979: 19–20]. Предметом дослідження у нашій статті став розподіл слів за
частинами мови у словнику і тексті великої прози І. Франка. Роботу виконано на базі морфологічно
маркованого електронного корпусу романів письменника [Бук 2007], на основі якого вже укладено частотні
словники до творів ―Перехресні стежки‖, ―Для домашнього огнища‖, ―Основи суспільності‖, ―Великий шум‖,
―Захар Беркут‖, ―Борислав сміється‖.
2. Співвідношення частин мови у великій прозі І.Франка. Частотні словники до вказаних творів
укладено в межах проекту комплексного квантитативного обстеження творів І. Франка, що реалізується у
Львівському університеті [Бук 2010]. Вони подають інформацію про частоту вживання кожного слова у
згаданих текстах. У результаті для кожної частини мови було автоматично отримано її частотність у словнику
(реєстрі) і тексті кожного роману. Оскільки обсяги романів різні (―Борислав…‖ – 77 456, ―Захар…‖ – 50 206,
―Для домашнього…‖ – 44 840, ―Основи…‖ – 67 174, ―Перехресні…‖ – 93 888, ―Великий шум‖ – 37 005
слововживань), то порівнювати можна лише відносні частоти їх одиниць. Дані наведено в Таблиці 1, де твори
розташовано у хронологічному порядку.
У статті викладено класичний поділ слів на частини мови. До службових зараховано прийменник,
сполучник, частку та, умовно, вигук.
3. Активність частин мови у прозі І. Франка. Як видно із Таблиці 1, найчастотнішими словами у тексті
очікувано є службові частини мови. Цей замкнутий і відносно не багатий клас слів виявляє найбільшу
активність: займаючи всього від 2,7% до 3,4% у словнику, вони становлять від 24,2% до 27,4% тексту.
© Бук С.Н., 2011 Розділ ІІ. АКТУАЛЬНІ ПРОБЛЕМИ МОРФОЛОГІЇ

63
Подібний замкнутий клас слів становлять займенники. Їх поведінка у тексті ще активніша: загальна кількість
займенників у різних формах у тексті становить 14,3-16,5% від загального обсягу романів. Усього ж у реєстрі
словників займенники займають 0,8-1,2% від загальної кількості слів у словнику. Іншими словами, займенник,
займаючи приблизно 1% у словнику, покриває до 16,5% тексту. Прислівники та числівники займають
приблизно однакову частку у словнику (відповідно 7,1-8,8% і 0,6-0,9%) й тексті (відповідно 7,0-9,1% і 0,8-
1,3%).
Таблиця 1
Відносна й середня частотність частин мови у словнику і тексті
великої прози І. Франка та української художньої прози1
Захар Беркут Великий шум Проза І. Франка
частини мови текст словн текст словн текст словн текст словн текст словн текст словн текст словн текст
службові 27,4% 3,1% 24,2% 2,7% 24,2% 3,1% 25,9% 3,1% 25,7% 2,6% 26,9% 3,4% 25,8% 2,2% 26,8%
іменники 21,3% 30,8% 26,3% 31,0% 22,8% 33,3% 23,5% 33,9% 23,6% 36,6% 24,4% 36,9% 23,5% 35,5% 25,8%
дієслова 18,4% 36,9% 16,8% 35,3% 18,8% 32,9% 18,1% 34,0% 18,6% 33,6% 17,4% 32,3% 18,1% 33,2% 18,3%
прикметники 7,0% 18,4% 9,8% 20,8% 7,8% 20,3% 7,2% 18,7% 6,9% 17,9% 7,5% 17,6% 7,5% 20,5% 8,6%
займенники 15,4% 1,0% 14,3% 0,9% 16,5% 1,0% 15,6% 1,0% 16,0% 0,9% 15,8% 1,2% 15,6% 0,8% 11,0%
прислівники 9,1% 8,8% 7,6% 8,8% 8,8% 8,7% 8,9% 8,5% 8,0% 7,4% 7,0% 7,6% 8,4% 7,1% 8,4%
числівники 1,3% 0,9% 1,0% 0,6% 1,0% 0,7% 0,8% 0,6% 1,2% 0,9% 1,0% 0,9% 1,1% 0,7% 1,0%
100,0% 100,0% 100,0% 100,0% 100,0% 100,0% 100,0% 100,0% 100,0% 100,0% 100,0% 100,0% 100,0% 100,0% 100,0%
Борислав
сміється
Для
домашнього
огнища
Основи
суспільності
Перехресні
стежки
Українська
проза

Відносна кількість усіх інших частин мови у словнику навпаки перевищує їх відносну кількість у тексті.
Іменники становлять 30,8-36,9% словника і 21,3-26,3% тексту; частка дієслів у словнику (32,3-36,9%) майже
вдвічі більша за їх частку у тексті (16,8-18,8%); а частка прикметників у словнику (17,6-20,8%) перевищує їх
частку у тексті (6,9-9,8%) більше ніж удвічі. Ці факти свідчать, що найбагатшим шаром у лексиці романів
І. Франка є дієслова та прикметники (їх найбільше у словнику), а найактивнішими морфологічними одиницями
– службові та займенники (вони покривають найбільшу частку тексту, займаючи при цьому невелику частину
реєстру).
4. Співвідношення частин мови у романах І. Франка. Впадає у вічі, що співвідношення частин мови у
романах неоднакове, тому зіставимо частотність кожного морфологічного класу за конкретним твором. У
лінгвістичній літературі неодноразово вказувалося на важливість службових слів у художньому світі
письменника. ―На відміну від повнозначних слів, які вживають свідомо … , службові слова художник, як і будь-
який носій мови, вживає переважно інтуїтивно. … Тому службові слова дають змогу заглянути в авторське
світовідчуття глибше, ніж слова повнозначні‖ [Фоменко 1998]. Детальний аналіз функціональних властивостей
прийменника, сполучника, частки, вигука у творчості І. Франка заслуговує окремого об’ємного дослідження,
тому у статті їх умовно об’єднано в одну групу ―службові частини мови‖. Саме вони кількісно стоять на
першому місті у тексті п’яти з шести обстежених романів І. Франка: ―Борислав…‖ (тут вони займають
найбільшу частку тексту – 27,4%), ―Великий шум‖ (26,9%), ―Основи…‖ (25,9%), ―Перехресні…‖ (25,7%), ―Для
домашнього…‖ (24,2%). Найменшу частку вони займають у творі ―Захар…‖ (24,21) – тут найчастотнішою
частиною мови є іменник, що займає 26,25%.
Далі ранг частин мови у всіх романах збігається: на третьому місці дієслова, яких найбільше у ―Для
домашнього…‖ (18,8%) та ―Перехресних…‖ (18,6%) і найменше у ―Захарі…‖ – 16,8%); на четвертому –
займенники, яких також найбільше у ―Для домашнього…‖ (16,5%) і також найменше у ―Захарі…‖ (14,3%); на
п’ятому місці прислівники, яких також найбільше у ―Бориславі…‖ – 9,1%, а найменше у ―Великому шумі‖ –
7,0%). На другому з кінця місці за частотністю перебувають прикметники, що, навпаки, домінують в ―Захарі…‖
(9,8%) а найменшу кількість мають в ―Перехресних…‖ (6,9%) та ―Бориславі…‖ (7,0%). На останній позиції –
числівники – переважають у ―Бориславі…‖ (1,3%), що зумовлено тематикою твору, де важливу роль відіграє
обчислення коштів, необхідних для повстання, і сума зібраних грошей. Найменше числівників у тексті
―Основ…‖ (0,8%).
Таким чином, тексти романів І. Франка дещо відрізняються кількістю вживання частин мови. Так, у
тексті ―Захара…‖ найактивніші іменники та прикметники за рахунок менш активних службових частин мови,
дієслів, займенників. Романи ―Для домашнього…‖ та ―Перехресні…‖, навпаки, мають відносно найбільше
дієслів та займенників, тобто з цього погляду їх дію можна характеризувати як більш динамічну, а дію в
―Захарі… ‖ – як більш статичну й описову. Інші романи не вирізняються чітким домінуванням тої чи іншої
частини мови.

1
Дані для художньої прози подано за [Перебийніс 1985: 157], де їх отримано на матеріалі шести виборок по
20 тис. слововживань з творів п’яти авторів: О. Довженко ―Поема про море‖, М. Стельмах 1 ―Кров людська – не водиця‖ та
М. Стельмах 2 ―Хліб і сіль‖, Ю. Смолич ―Мир хатам, війна палатам‖, Г. Тютюнник ―Вир‖, О Гончар ―Прапороносці‖. ЛІНГВІСТИЧНІ СТУДІЇ. Випуск 22

64
У словнику відповідних творів картина інша. Словник іменників відносно найбагатший у ―Великому
шумі‖ (36,90%), а відносно найбідніший у ―Бориславі…‖ (30,79%). Реєстр дієслів, навпаки, найбільший в
―Бориславі…‖ (36,91%), а найменший у ―Великому шумі‖ (32,34%). Різних прикметників найбільше в ―Захарі…‖
(20,77%), а найменше в пізніших романах: ―Перехресні…‖ (17,95%) і ―Великий шум‖ (17,56%). Прислівники
виявляють подібну тенденцію: кількісно переважають в раніших романах ―Борислав…‖ (8,84%) та ―Захар…‖
(8,80%) і зменшуються у словнику пізніших творів ―Перехресні…‖ (7,39%), ―Великий шум‖ (7,64%). Частка
займенників та числівників у словниках романів відносно стала. Службові частини мови найбільшу частку
реєстру займають у ―Великому шумі‖ (3,45%), а найменшу – в ―Перехресних…‖ (2,64%).
5. Зіставлення частиномовних показників ідіостилю І. Франка з українською художньою прозою.
Дані про активність частин мови у словнику і тексті великої прози І. Франка загалом корелюють із даними,
обчисленими для українських письменників середини XX ст. [Перебийніс 1985: 155], проте мають деякі
особливості. Для адекватного порівняння, обчислено їх середню частотність у романах І. Франка (Таб. 1,
колонка 8). Із Таблиці 1 видно, що ранги усіх частин мови в І. Франка та українській художній прозі збігаються.
За відносною кількістю іменників до текстів та словника І. Франка (23,5% і 35,5% відповідно) найближчий
Г. Тютюнник (24,5% і 34,6% відповідно). За кількістю дієслів – М. Стельмах 1 текст (18,6/18,3%) і словник
(34,1/33,1%), за кількістю прислівників у тексті – Ю. Смолич (8,4/8,8%), а в словнику – Г. Тютюнник (7,1/7,9%).
Зіставлення отриманих усереднених частиномовних показників ідіостилю І. Франка з усередненими
показниками стилю художньої прози [Перебийніс 1985: 157] дає такі результати: у середньому, в текстах
І. Франка кількість іменників (23,5%) дещо менша, ніж у прозі (25,8%), натомість обсяги службових слів
(25,8%), дієслів (18,1%), прикметників (7,5%), прислівників (8,4%) та числівників (1,1%) якраз збігаються.
Займенники в І. Франка (15,6%) переважають над їх кількістю в прозі (11,0%). Таким чином, стиль І. Франка у
частинах мови подібний до усередненого стилю художньої прози за винятком дещо більшої кількості
займенників і дещо меншої кількості іменників. Для остаточних висновків про особливості функціонування
частин мови у великій прозі І. Франка необхідно залучити до розгляду решту романів письменника, проте вже
зараз можна констатувати відносну сталість співвідношення кількості морфологічних класів у словнику, окрім
описаної тенденції зміни відносної кількості прикметників та прислівників залежно від часу написання твору.
6. Кількісні реляції між частинами мови у творах І. Франка. Кількісні реляції між частинами мови є
одним з елементів статистичної характеристики тексту. Обчислюють, наприклад, індекс іменних означень,
тобто індекс епітетизації (відношення суми вживань іменників до суми вживань прикметників), індекс
дієслівних означень (відношення суми вживань прислівників до суми вживань дієслів) [Kamińska-Szmaj 1988:
128], ступінь номінальності (відношення суми вживань іменників до суми вживань дієслів) [Ruszkowski 2004:
50]. Вказані величини для романів І. Франка подано в Таблиці 2.
Існує думка, що вживання іменника тягне за собою наслідок у сфері добору інших частин мови,
насамперед прикметника (чим більше в тексті іменників, тим участь прикметників більша). Індекс епітетизації
показує, скільки іменників припадає на один прикметник, тобто, чим менший цей показник, тим ступінь
епітетизації вищий. У Франка в середньому один прикметник припадає на 3,13 іменника, найбільше – в
―Бориславі…‖ (на 3,04) і найменше в ―Перехресних‖ (на 3,45). За кількістю епітетів твори І. Франка дещо
поступаються середньому показнику художньої прози (3,00), будучи найбільш наближеними до М. Стельмаха 1
(3,10). На думку М. Рушковського, величина аналізованого параметру має великий потенціал для виявлення
стилістичної належності тексту, бо може характеризувати як окремий текст, так й ідіостиль, літературний жанр,
функціональний стиль, вказувати на вік мовця тощо [Ruszkowski 2004: 52].
Таблиця 2
Кількісні реляції між частинами мови
у творах І. Франка та в українській художній прозі
Захар Беркут Великий шум Проза І. Франка
3,04 2,69 2,92 3,28 3,45 3,25 3,13 3,00
0,50 0,46 0,47 0,49 0,43 0,40 0,46 0,46
1,15 1,56 1,22 1,30 1,27 1,40 1,30 1,41
Борислав
сміється
Для
домашнього
огнища
Основи
суспільності
Перехресні
стежки
Українська
проза
індекс
епітетизації
індекс
дієслівних
означень
ступінь
номінальності

Індекс дієслівних означень І. Франка повністю збігається з художньою прозою (0,46), знову будучи
найбільш наближеним до М. Стельмаха 1 (0,43). Найбільша ця величина в ―Бориславі…‖ (4 прислівники на 10
дієслів), а найменша – у ―Великому шумі‖ (5 прислівників на 10 дієслів).
Співвідношення у тексті двох найважливіших частин мови – іменника та дієслова – відіграє важливу
роль для окреслення стилістичної якості тексту. Індекс номіналізації в художній прозі (1,41) дещо перевищує Розділ ІІ. АКТУАЛЬНІ ПРОБЛЕМИ МОРФОЛОГІЇ

65
цю цифру в І. Франка (1,30), тобто в І. Франка на одне дієслово припадає більше іменників (найбільше в
―Бориславі…‖ (1,15) і найменше в ―Захарі…‖ (1,56)). За значенням цієї величини, до І. Франка наближений
О. Гончар (1,28).
Хоча індекси епітетизації, номіналізації та дієслівних означень є лише одним із багатьох інструментів,
використовуваних для стилістичного аналізу тексту, їх можна вважати потужним інструментом для доповнення
якісного аналізу тексту.
7. Висновки. На основі даних про розподіл частин мови у великій прозі І. Франка, отриманих завдяки
морфологічній анотації корпусу його текстів обсягом понад 370 тис. слововживань, виявлено особливості
поведінки цих класів слів у тексті та словнику творів письменника, зокрема те, що найбільшу різноманітність
показують прикметники та дієслова.
Тексти романів І. Франка дещо відрізняються кількістю вживання частин мови, наприклад, дію романів
―Для домашнього…‖ та ―Перехресні…‖ за відносно більшою кількістю дієслів можна вважати більш
динамічною, а дію в ―Захарі… ‖, за активністю іменників та прикметників, – більш статичною та описовою. У
реєстрі слів І. Франка прикметники та прислівники виявляють подібну тенденцію: кількісно переважають в
раніших романах ―Борислав…‖ та ―Захар…‖ і зменшуються у пізніших творах ―Перехресні…‖, ―Великий шум‖.
Стиль І. Франка у частинах мови подібний до усередненого стилю художньої прози за винятком дещо більшої
кількості займенників і дещо меншої кількості іменників. Загалом, співвідношення частин мови у різних
романах І. Франка приблизно однакове, що свідчить про стабільність авторської манери письма.
Основні кількісні реляції між частинами мови у творах І. Франка теж мають свої особливості. Так, на
один прикметник у нього припадає в середньому 3,13 іменника (що трохи менше, ніж в середньому в художній
прозі), на один прислівник – майже два дієслова (так само, як і в художній прозі), а на одне дієслово –
1,41 іменника, що трохи менше, як в художній прозі. Вказані індекси епітетизації, номіналізації та дієслівних
означень є важливою статистичною характеристикою тексту, що має потенціал розрізнення ідіостилів.

Література
Бук 2010: Бук, С. Квантитативна параметризація текстів Івана Франка: спроба проекту [Електронний
ресурс] / С.Н. Бук // Іван Франко: Студії та матеріали. – Львів, 2010. – http://arxiv.org/abs/1005.5466
Бук 2007: Бук, С. Корпус текстів Івана Франка: спроба визначення основних параметрів [Текст] /
С.Н. Бук // Прикладна лінгвістика та лінгвістичні технології: MegaLing-2006: Зб. наук. пр. – К.: Довіра, 2007. –
С. 72–82.
Головин 1971: Головин, Б.Н. Язык и статистика [Текст] /Б.Н. Головин. – М.: Наука, 1971. – 190 с.
Климова 2004: Климова, Л.В. Высокочастотные имена существительные, прилагательные и
числительные в современном русском языке: Дис. … канд. филол. наук: 10.02.01 [Текст] / Л.В. Климова. –
Екатеринбург, 2004. – 189 с.
Перебийніс 1985: Перебийніс, В.С., Муравицька, М.П., Дарчук, Н.П. Частотні словники та їх
використання [Текст] – К.: Наук. думка, 1985. – 204 с.
Перебийніс 1967: Статистичні параметри стилів [Текст] / за ред. В.С. Перебийніс. – К.: Наук. думка,
1967. – 260 с.
Потапенко 1999: Потапенко, А.Б. Стилеметричні характеристики прикметників різної морфемної
структури в сучасній англійській мові: Автореф. дис… канд. філол. наук: 10.02.04 [Текст] / А.Б. Потапенко;
Київ. держ. лінгв. ун-т. – К., 1999. – 20 с.
Тищенко 1970: Тищенко, В. Частота частин мови в різних функціональних стилях сучасної української
мови // Питання структурної лексикології [Текст] – К.: Наукова думка, 1970. – С. 215-224.
Фоменко 1998: Фоменко, И.В. Художественный мир и мир, в котором живет автор [Текст] /
И.В. Фоменко, Л.П. Фоменко // Литературный текст: проблемы и методы исследования. – Тверь: Тверской ун-т,
1998. – С. 3-9.
Франко 1979: Франко, І. Каменярі. Український текст і польський переклад. Дещо про штуку
перекладання [Текст] // Зібрання творів у 50-ти томах. Т. 39. – К.: Наукова думка, 1979. – С. 7–20.
Шайкевич 2003: Шайкевич, А. Статистический словарь языка Достоевского [Текст] / А.Я. Шайкевич,
В.М. Андрющенко, Н.А. Ребецкая. – М.: Яз. слав. культуры, 2003. – 832 с.
Čermбk 2007: Slovnнk Karla Čapka [Text] / Hl. ed. Frantińek Čermбk. – Praha : Nakladatelstvн Lidovй noviny;
Ъstav Českйho nбrodnнho korpusu, 2007. – 715 s.
Leech 2001: Leech, G. Word Frequency in Written and Spoken English. Based on the British National Corpus
[Text] / G. Leech, P. Raygon, A. Wilson. – Pearson Educational Ltd., 2001. – 304 p.
Ruszkowski 2004: Ruszkowski, M. Wskaźnik epitetyzacji w badaniach stylistycznych [Text] / Mariusz
Ruszkowski // Respectus Philologicus. – 2004. – № 5(10). – S. 48-53.
Skubalanka 1986: Skubalanka, T. Założenia gramatyki stylistycznej [Text] / Teresa Skubalanka // Typy opisуw
gramatycznych języka. – Wrocław, 1986. – S. 141-155.
Zembaty-Michalakowa 1982: Zembaty-Michalakowa, M. Poezja Juliana Przybosia w świetle badań
statystyczno-językowych na tle porуwnawczym [Text] / Maria Zembaty-Michalakowa. – Wrocław, 1982. – 312 s.

На основании частотных словарей к шести романам И. Франко общим объѐмом более 370 тыс.
получены количественные данные о функционировании частей речи в словаре и тексте писателя. Выявлено их
соотношение по романам, эти результаты сопоставлены с аналогичными показателями текстов других
украинских писателей и с художественной прозой вообще. Рассчитаны индексы эпитетизации, номинализации
и глагольных определений.
Ключевые слова: части речи, частотность, статистические характеристики, частотный словарь,
количественные отношения между частями речи.

Quantitative data about parts-of-speech functioning in a text and a vocabulary are obtained on the basis of
frequency dictionaries of six novels by Ivan Franko having 370 thousands word occurrences in total. The relations
between parts of speech in different novels are determined and the data are compared to the respective parameters of
texts written by other Ukrainian authors and to the averaged values of the prose fiction. The indexes of epithetization,
nominalization, and verbal definitions are calculated.
Keywords: parts of speech, frequency, statistical parameters, frequency dictionary, quantitative relations
between parts of speech.
Надійшла до редакції 7 вересня 2010 року.

Літературне місто - Онлайн-бібліотека української літератури. Освітній онлайн-ресурс.