Донецький Вісник Наукового Товариства ім. Шевченка

СТАТУС ПРИКЛАДНОЇ ЛІНГВІСТИКИ В СИСТЕМІ ЛІНГВІСТИЧНИХ НАУК

загрузка...

Анатолій ЗАГНІТКО,
доктор філологічних наук, професор, завідувач кафедри
української мови та прикладної лінгвістики
Донецького національного університету, член НТШ
СТАТУС ПРИКЛАДНОЇ ЛІНГВІСТИКИ
В СИСТЕМІ ЛІНГВІСТИЧНИХ НАУК
Розкрито статус прикладної лінгвістики в системі
лінгвістичних наук, схарактеризовано її зв’язки з іншими
науками, встановлено основні напрями сучасних
лінгвоприкладних досліджень, виявлено особливості
комп’ютерно-прикладних досліджень, простежено
перспективи розвитку прикладних досліджень, з’ясовано
напрями гіпертекстових лінгвотехнологій та прокоментовано
найактуальніші лінгвоприкладні дослідження.
Ключові слова: прикладна лінгвістика, комп’ютерна
лінгвістика, гіпертекст, машинний переклад, автоматичне
опрацювання мови.

загрузка...

Сучасна система лінгвістичних наук є нерівнорядною,
охоплюючи класичну теоретичну лінгвістику, де основні
напрями вивчення пов’язані з розглядом фонології, морфології,
синтаксису, семантики лексичної, до складу яких сучасні
науково-лінгвістичні парадигми додали когнітивну лінгвістику,
функційну лінгвістику і генеративну лінгвістику; дескриптивну
лінгвістику, що містить антропологійну лінгвістику, еволюційну
лінгвістику (порівняльно-історичне мовознавство, етимологія),
фонетику і соціолінгвістику, а прикладна лінгвістика – це
комп’ютерна лінгвістика, математична лінгвістика, судова
лінгвістика, юридична лінгвістика, методики викладання і
291вивчення мови (Language assessment / Language development),
прескриптивна лінгвістика, нейролінгвістика, психолінгвістика,
стилістика тощо. Для прикладної лінгвістики, що безпосередньо
зорієнтована і пов’язана з вивченням мови, властиві такі
напрями: лексикографія, лінгводидактика, термінознавство,
перекладознавство; а основними напрямами прикладної
лінгвістики (англ. applied linguistics), пов’язаної з практичним
застосуванням, постають: 1) комп’ютерна лінгвістика (англ.
computational / computerized linguistics) з її основними
завданнями машинного перекладу, автоматичного розпізнавання
символів (англ. OGR), автоматичне розпізнавання мовлення
(англ. ASR), автоматичне віднаходження даних (англ. Data
Minning), автоматичне реферування, побудова систем
управління знаннями, створення електронних словників,
тезаурусів, онтологій, корпусна лінгвістика; 2) лінгвістична
експертиза (наприклад, у судовій практиці); 3) наука про
упорядкування і стандартизацію науково-технічної термінології
[Андрейчук, Карамишева, Семотюк 2008; Асоціативний 2001;
Бук 2006; Пиотровский, Бектаев, Пиотровская 1977].
У мовознавстві склалося два розуміння прикладної
лінгвістики – широке і вузьке. Для першого прикладна
лінгвістика – це будь-яке застосування наукових знань про мову
в нелінгвістичних науках. У західноєвропейській традиції
аналоги цього терміна (анл. applied linguistics, нім. angewandte
Linguistik) застосовувані насамперед на позначення теорії і
практики викладання іноземних мов, охоплюючи методику,
особливості опису граматики для навчальних потреб тощо. Так,
інститут у Дубліні з назвою School of Applied Languages (Школа
прикладної лінгвістики) є за своєю суттю інститутом іноземних
мов. У вітчизняних студіях від часу появи терміна (п’ятдесяті
роки ХХ століття) цей термін був зорієнтований на автоматичне
опрацювання текстової інформації (машинного перекладу,
автоматичного реферування і под.), чим і мотивоване
використання в цьому розрізі двох термінів прикладна
лінгвістика і комп’ютерна лінгвістика, інколи автоматична
лінгвістика, обчислювальна лінгвістика, інженерна
лінгвістика, що не можна вважати мотивованим, тому що
кожна з цих дисциплін у рамах прикладної лінгвістики має
292 свої методи, завдання, предмет та об’єкт роботи.
Найприйнятнішим для прикладної лінгвістики, що
безпосередньо зорієнтована і пов’язана з вивченням мови, у
вишівській практиці як спеціальності є напрям комп’ютерної
лінгвістики (за своєю суттю до нього прилягають: математична
лінгвістика, обчислювальна лінгвістика (англ. computational
linguistics) – зорієнтований на штучний інтелект, що передбачає
або ставить основним завданням використання математичних
моделей для опису природних мов [Воронина 2007; Заваруєва
2008; Краснобаєва-Чорна 2007; Ситар, Куценко 2009]. У цьому
розрізі комп’ютерна лінгвістика перетинається з опрацюванням
природних мов, але в останній час у центрі уваги перебувають
прикладні методи опису та опрацювання природної мови для
комп’ютерних систем, а для комп’ютерної лінгвістики основним
є утворення і використання абстрактних моделей. У цьому
розрізі основне поле діяльності – це опрацювання алгоритмів і
прикладних програм для опрацювання мовної інформації (цьому
завданню відповідає «лінгвіст-програміст»).
Прикладні проблеми поставали перед мовознавством від
самого початку його зародження. Ці проблеми спрямовані на
оптимізацію функцій мови – від формування і підтримування
традиції читання та розуміння сакральних текстів (екзегетика і
герменевтика) до забезпечення й активізації міжнародних
контактів. У теоретико-філософських та лінгво-теоретичних
пошуках здебільшого розрізняють комунікативну, епістемічну
(гносеологічну) та когнітивну функції мови, кожна з яких
об’єднує частковіші функції. Так, комунікативна функція
охоплює фатичну (контактновстановлювальну) та інформаційну
(у вузькому сенсі) функції, функції впливу, соціальну функцію
(виявляється у мовній політиці). В епістемічному
(гносеологічному) плані мовна система постає як спосіб
збереження та передавання знань, як вияв специфічно
особливого національного погляду на світ. Когнітивна функція
належить до тих сфер життя мови, що пов’язані з мисленням та
пізнанням людиною дійсності [Краснобаєва-Чорна 2009;
Ткачук, Чумак 2006; Федоров 2006].
У функційному аспекті прикладна лінгвістика постає як
академічна дисципліна, що охоплює вивчення і дослідження
293способів оптимізації різних сфер функціонування мовної
системи. Мовні функції є опертям класифікації нерівнорядних
сфер застосування лінгвістичних знань. На оптимізацію
комунікативної функції зорієнтовані насамперед такі наукові
дисципліни: теорія перекладу, машинний переклад, теорія і
практика викладання рідної і нерідної мови, теорія і практика
інформаційно-пошукових систем, створення інформаційних
(ширше – штучних) мов, теорія кодування. З оптимізацією
соціальної функції мови (частина комунікативної) співвіднесені
дослідження із соціолінгвістики (зокрема, вивчення та
обґрунтування мовної політики), орфографії та орфоепії, теорії
впливу, політичної лінгвістики. На оптимізацію епістемічної
(гносеологічної) функції зорієнтовані лексикографія (зокрема
комп’ютерна), дослідження з термінології і термінографії,
корпусна і польова лінгвістика. Оптимізація когнітивної функції
мови прямо корелює зі студіями з комп’ютерної лінгвістики,
психолінгвістики й афазіології, квантитативної лінгвістики,
«лінгвістичної кримінології».
Прикладну лінгвістику можна розглядати у сфері засобів
оптимізації функціонування мови як засобу передавання
інформації. Тут на перше місце постають перекладознавчі
виміри. У межах комп’ютерної лінгвістики (для зручності слід
користуватися поняттям прикладна комп’ютерна лінгвістика)
особливу вагу має машинний переклад, що є процесом
перекладу текстів (письмових, а в загальноцивілізаційному
вимірі також і усних) однієї природної мови іншою за
допомогою спеціальної комп’ютерної програми, тому таким
важливим є напрацювання навичок створення алгоритмів
перекладу та побудови подібних систем [Демська-Кульчицька
2005; Карпіловська 2006; Краснобаєва-Чорна 2007]. Наука про
переклад (англ. translation studies; нім. Ǖbersetzungswissenschaft
Translationswissenschaft) охоплює кілька важливих напрямів:
теорія перекладу, аналіз перекладу, методика навчання
перекладу. Особливий статус належить машинному перекладу –
наукова і технологічна дисципліна, пов’язана з наукою про
переклад, з комп’ютерною лінгвістикою. Наука про переклад –
міжгалузева, значною мірою активізована зв’язками з
літературознавством, когнітивною наукою і культурною
294 антропологією. За активністю перекладацької діяльності
розмежовують усний і письмовий переклади, різниця між якими
постає особливою в психологічному аспекті. Прикладний аспект
теорії перекладу пов’язаний насамперед з тим, що необхідно
послідовно враховувати особливості невідповідності між
граматичними і лексичними системами різних мов, різницю в
прагматичному функціонуванні мовної системи. Сюди можна
віднести труднощі в категоризації дійсності, зумовлені
граматичними особливостями різних мов (наприклад,
розбіжності в граматичних категоріях тощо), особливості
лексичного значення і под. Найважливішою лінгвістичною
проблемою науки про переклад є адекватне відтворення так
званих «прихованих категорій» – категорії невідчужуваної
належності, означеності-неозначеності тощо. Виступаючи в
одних мовах граматичними, в інших – набуваючи нерегулярного
вираження, вони складають надзвичайну трудність у перекладі.
Машинний переклад своїми витоками та постанням
мотивований практичними потребами, що особливо
актуальними постали в п’ятдесяті роки двадцятого століття,
коли зросли обсяги і ємність науково-технічної інформації
[Краснобаєва-Чорна 2009; Ситар 2009; Ткачук, Чумак 2006;
Чейлитко 2009]. У 1949 році фахівець з дешифрування Уоррен
Уївер (США) склала меморандум з обґрунтуванням
принципової можливості створення систем машинного
перекладу. Ця ідея ґрунтувалася на тому, що структурну
подібність між мовами можна описати формально, що є
необхідною умовою опрацювання алгоритмів для ЕОМ.
Спочатку прогнозувалось, що системи машинного перекладу
можуть легко забезпечувати переклад будь-яких науково-
технічних текстів. Це сприятиме інтенсифікації перекладних
студій, значною мірою вивільнивши процедуру перекладу від
людських ресурсів. Уже перші спроби створення систем
машинного перекладу засвідчили, що в цьому разі необхідні
суттєві і нетривіальні інформації різного типу про
функціонування мовних систем, їхнє облаштування,
закономірності внутрішньої будови, що не була адекватно
висвітлена в традиційно-класичних граматичних описах.
Водночас комп’ютерне моделювання людської здібності
295перекладу вимагало врахування і суто лінгвістичних, і
психологічних, і соціальних, і гендерних та інших чинників.
Перші спроби опрацювання програм автоматичного перекладу
дали незадовільний результат: переклад ЕОМ вимагав
прискіпливого і глибокого редагування, а вартість машинного
перекладу часто була вищою від оплати звичайного
перекладача. Сьогодні розвиток і напрацювання систем
машинного перекладу має кілька напрямів: 1) опрацювання
людино-машинних систем, що враховує і прогнозує пряму
участь людини в процесі перекладу на різних етапах;
2) проблемна сфера обмежувана конкретною підмовою, або
підстилем, наприклад текстами космічної галузі або будівельної
індустрії; 3) системи машинного перекладу розглядаються як
різновид підсистем / систем штучного інтелекту (останнє
уможливлює використання комп’ютерних технологій,
опрацьовуваних у комп’ютерному моделюванні людського
мислення). Набуті в теоретичній лінгвістиці знання про
структуру і систему, особливості функціонування мови
знаходять застосування в теорії і методиці викладання мови.
Напрацювання в теорії, зміна теоретичних передумов ставали
опертям динаміки методичних підходів у викладанні мови –
рідної і нерідної. «Граматично-перекладний» метод мав опертям
уявлення про ідеальність будови граматичної системи мови, що
підтверджувалося студіюванням такого зразка логічності і
несуперечності – граматичного ладу латинської мови. Тому
вивчення мови мало постулатом засвоєння певних граматичних
правил з обов’язковим засвоєнням усіх винятків дії певного
граматичного правила. Методика ґрунтувалася на визнанні
двомовності навчання: усі завдання та пояснення викладаються і
пишуться рідною мовою, а визначальною метою є читання
текстів та їхній переклад рідною мовою [Краснобаєва-Чорна
2009; Перебийніс, Сорокін 2009; Ситар 2009]. Наприкінці
дев’ятнадцятого століття цей метод (граматично-перекладний)
піддають сумніву в силу того, що він не забезпечував швидке
оволодіння мовою, на початку двадцятого століття виник
«прямий метод» навчання, що полягав в опрацюванні комплексу
вправ, орієнтованих на моделювання оволодіння дитиною мови.
Граматична система в цьому випадку вторинна, а оволодіння
296 мовою первинне. Особливістю цього методу є одномовність,
його використання передбачає опрацювання досконалої системи
способів пояснення значення слова через синоніми, антоніми,
дефініцію, опис, рисунок, картинку тощо. Прямий переклад у
такому методі не застосовуваний. Активне використання в
прямому методі технічних засобів навчання зумовило створення
«аудіолінгвального» і «аудіовізуального» методів навчання
іноземним мовам. Активізація прагмалінгвістичних досліджень
зумовила виникнення «комунікативно-орієнтованого підходу»,
основу якого складає навчання спілкуванню іноземною мовою,
максимальне наближення до того, як користуються певною
мовою її носії. Це зумовило послідовне використання понять
комунікативної ситуації і комунікативного наміру як
визначальних, внаслідок чого мовні форми розглядають у
зв’язку з конкретною ситуацією і намірами мовця. До того ж
постулат наближення до реальності вимагає використання не
тільки мовних висловів, але й застосування інших знакових
систем, притаманних для відповідної ситуації спілкування, –
дорожніх знаків, піктограм, розкладу руху потягів, плану міст,
розташування вулиць і майданів тощо. Вивчення мови
перебуває в активній взаємодії з культурою народу (пор.
завантаження навчальних дисциплін «Лінгвокультурологія»,
«Лінгвокраїнознавство» тощо). Усе це мотивувало кваліфікацію
такої концепції як «інтегроване країнознавство».
Опертям прикладної комп’ютерної (комп’ютерно-
прикладної) лінгвістики є опрацювання математичного
апарату, методології та методики інформатики з
розрізненням їхніх аспектів та природна мова – рідна або
іноземна, що уможливлює застосування тих чи інших
алгоритмів на практиці. Вивчення мови як основного фаху
дозволяє також належним чином напрацьовувати програми
аналізу і синтезу природного мовлення, інтелектуальний аналіз
даних (англ. Data Minning) – вияв прихованих закономірностей
або взаємозв’язків між змінними у великих масивах
неопрацьованих даних. У цьому вимірі вони диференційовані на
задачі: класифікації, моделювання, прогнозування,
структурування і под. Англомовний термін Data Minning
перекладають то як добування даних, то як віднаходження
297даних, то як віднайдення даних, то як інформаційний прохід, то
як витягнення даних/інформації, що зумовлює активне його
використання мовою-оригіналом. Значного поширення набув
термін «інтелектуальний аналіз даних» (ІАД), що вважається
найбільш прямим відповідником. ІАД охоплює методи і моделі
статистичного аналізу, машинного навчання, дистанціюючись
від останніх в напрямі автоматичного аналізу даних.
Інструментарій ІАД уможливлює проведення аналізу даних
фахівцями (аналітиками), які не оперують відповідними
математичними знаннями.
Створення електронних словників також належить до
актуальних завдань комп’ютерно-прикладної лінгвістики, де
електронний словник витлумачувано як відповідну комп’ютерну
базу даних, що містить особливим способом закодовані
словникові статті. Це дозволяє зреалізувати швидкий пошук
необхідних слів, здебільшого з урахуванням морфологічних
форм та з можливістю пошуку сполук слів (прикладів вжитку), а
також з можливістю зміни напряму перекладу (наприклад,
англо-український або українсько-англійський, російсько-
український або українсько-російський і под.), що дозволяє
поповнювати наявні на сьогодні словники і програми [Федоров
2006; Чейлитко 2009]. Оптимізація епістемічної (гносеологічної)
мовної функції прямо пов’язана зі створенням словників та
їхнім функційним призначенням. Центром уваги будь-якої
лексикографії загалом, а прикладово-комп’ютерної зокрема є
способи організації словникової статті, структурування
словника і технологія його створення. Створення словників
безпосередньо корелює з особливостями мовно-державної
політики, постає однією зі сфер прикладної лінгвістики. Сучасна
лексикографія суттєво поліпшила інструментарій
комп’ютерними технологіями створення та експлуатації
словників. Взаємодія власне-словникового підходу з
комп’ютерними технологіями постала результатом створення
напряму прикладної лінгвістики – комп’ютерної лексикографії,
де активно застосовними є спеціальні програми – бази даних,
комп’ютерні картотеки, програми опрацювання текстів. Такі
програми уможливлюють в автоматичному режимі формування
словникових статей, збереження словникової інформації та
298 опрацювання її. Сукупність комп’ютерних лексикографічних
програм містить два компоненти: 1) програми підтримки
лексикографічних праць; 2) автоматичні словники різних типів,
у тому числі і лексикографічні бази даних.
З оптимізацією епістемічної функції пов’язана також і
термінографічна робота, предметом якої є термінологія, що
співвідноситься в широкому вимірі з усіма термінами природної
мови, а у вузькому – з термінами певної конкретної наукової
дисципліни або спеціальної сфери практичної діяльності
людини. У межах тієї чи іншої наукової сфери, окремої наукової
теорії терміни утворюють терміносистему [Краснобаєва-Чорна
2008; Пиотровский, Бектаев, Пиотровская 1977; Ткачук, Чумак
2006]. Терміни – це слова (словосполучення) метамови науки і
застосувань наукових дисциплін, та слова на позначення
специфічних реалій конкретних сфер людської практичної
діяльності. Поняття терміна здебільшого визначуване через
реалізовувані в терміносистемі його властивості. Використання
термінів є не інтуїтивним, а мотивоване відповідними
дефініціями. Результат термінографічної роботи є
термінологічні словники, що наближають цей напрям
прикладної лінгвістики до лексикографії.
Про опрацювання природної мови (Natural Language
Processing, NLP) як один із загальновизнаних напрямів
штучного інтелекту і математичної лінгвістики слід окремо
говорити в розрізі комп’ютерно-прикладної лінгвістики, тому
що цей різновид спрямований на вивчення проблеми
комп’ютерного аналізу (у штучному інтелекті – розуміння мови)
і синтезу (у штучному інтелекті – генерація грамотного тексту)
природних мов. Активізація цього напряму сприяє
оптимальному вирішенню проблеми взаємодії й активного
діалогу комп’ютера і людини. Найбільшою проблемою і
водночас магістральною виступає сприйняття комп’ютером
слова, його розпізнавання, а поряд з нею – розуміння слова з
усім розмаїттям його смислових площин, розпізнавання
неологізмів, оказіоналізмів з диференціюванням і
розпізнаванням таких похідних від звичайних технічних,
коректорських та інших помилок, розмежування омонімів
(особливо омофонів тощо).
299Прикладний напрям з опрацювання природної мови
(переклад англійського терміна Natural Language Processing)
виник наприкінці 1960-х років і розвивався в рамах науково-
технічної дисципліни, що називається штучний інтелект. За
своєю внутрішньою формою словосполучення «опрацювання
природної мови» повинно охоплювати усі сфери, де комп’ютери
використовуються для опрацювання мовних даних [Бук 2006;
Заваруєва 2008; Краснобаєва-Чорна 2007]. Реальним постало
вузьке закріплення і мотивоване використання терміна –
опрацювання методів, технологій і конкретних систем, що
забезпечують спілкування людини з ЕОМ природною або
обмеженою природною мовою. Особливо активно розвивався
цей напрям в 1970-ті роки, що розглядався в прикладній
лінгвістиці як частина проблематики комп’ютерної лінгвістики.
Це мотивувалось стрімким збільшенням кількості користувачів
ЕОМ. У цьому разі постала проблема: якщо не можна і
недоцільно навчати і навчити усіх користувачів ЕОМ
відповідним мовам і технологіям програмування, то необхідні
напрацювання взаємодії граничних користувачів з
комп’ютерними програмами. Розв’язання цієї комунікативної
проблеми передбачало або мало два основних шляхи: 1) постала
спроба адаптації мов програмування та операційних систем до
кінцевого користувача (мови низького рівня типу Ассемблера
було замінено мовами вищого рівня типу Visual Basic,
відбувався розвиток операційних систем у напрямі
мобільнішого зображення та наочності; для створення
комунікативного комфорту та мобільнішого розуміння в
операційних системах почали використовувати метафори, що
ґрунтуються на зрозумілих людиною поняттях – наприклад,
робочий стіл, бібліотека, картотека тощо. Інший напрям –
опрацювання систем, що уможливлювали б взаємодію з ЕОМ у
конкретній сфері природною мовою або відповідному її
обмеженому варіанті. У сфері опрацювання природної мови
активними поставали встановлення особливостей спілкування,
закономірностей структурування діалогу, типів і виявів
комунікації в гуманітарних науках. Основна відмінність
комп’ютерного моделювання комунікації в системах взаємодії з
ЕОМ полягає в тому, що за обмеження проблемної сфери
300 розробникам доводиться враховувати усі аспекти, всі рівні
реального спілкування, що складає досить вагому проблему
теоретичного і прикладного аспектів [Демська-Кульчицька
2005; Карпіловська, Ситар 2006; Пиотровский, Бектаев,
Пиотровская 1977].
Архітектура систем опрацювання природної мови в
загальному вимірі охоплює блок аналізу мовленнєвого
спілкування користувача, блок інтерпретації повідомлення, блок
породження смислу відповіді і блок синтезу поверхневої
структури висловлення. Особливу частину системи охоплює
діалогічний компонент, у якому фіксовані стратегії ведення
діалогу, його модифікації, умови застосування цих стратегій,
способи подолання можливих комунікативних невдач. У цьому
розрізі здебільшого вирізняють системи питання-відповідь
(пор. систему ПОЕТ, створену колективом дослідників,
очолювану Е.В. Поповим), діалогічні системи вирішення
завдань (наприклад, система SNUKA, що вирішує в
інтерактивному режимі завдання планування військових
операцій), системи опрацювання зв’язних текстів (такими є
різноманітні системи опрацювання патентних документів, що
підтримують і розуміння тексту, і відповіді на питання).
В сучасну епоху особливо актуальним і значущим є
уміння правильної організації редагування з окресленням тих
чи інших аспектів і вимірів цієї проблеми, зокрема
автореферування. Основним завданням в цьому розрізі постає
напрацювання вільного осмислення інформації та її
структурування з послідовним відбором найбільш значущої та
актуальної, що може досягатися розробкою різноманітних
методик стиснення текстів, простеження базових структурних
компонентів, наростання їхньої спектральної заангажованості
[Дарчук 2008; Карпіловська 2006; Краснобаєва-Чорна 2008].
Управління знаннями (англ. knowledge management) – це
особлива методологія в комп’ютерно-прикладній лінгвістиці,
спрямована на підвищення рівня конкурентоспроможності і
захисту компанії за рахунок максимального й оптимального
використання повного інструментарію охорони, управління та
економії матеріальних активів компанії. До цього слід віднести
стратегії, спрямовані на надання вчасно необхідного обсягу і
301ємності знань тим членам спільноти, яким ці знання (очевидні та
неочевидні – типу ноу-хау різні, секрети майстерності, інтуїція
тощо) необхідні для підвищення ефективності дієвості
співтовариства (від 2000 року курси з управління знаннями
наявні на кафедрах менеджменту, їхня змонтованість у
комп’ютерно-прикладну лінгвістику очевидна і незаперечна). У
комп’ютерно-прикладній лінгвістиці реальним є розгляд
особливостей типології спіральності знань (Ікуджіо Нонака),
внутрішньої структурованості і зовнішньої структурованості
знань, створення мап (карт) знань і вивчення особливостей
корпоративної культури. Управління знаннями як напрям
комп’ютерно-прикладних студіювань постав унаслідок активної
дії трьох причин: 1) соціальної (інтелект, пам’ять, досвід,
ініціатива тощо постають безпосередніми учасниками
виробництва); 2) економічна (статус інформаційних технологій,
рівень їхнього впровадження та запитуваність останніх
працівниками, співвідношення таких технологій з оперативним
інтелектуальним фондом, формування на цьому тлі прибутку);
3) технологічна (еволюційний процес розвитку інформаційних
технологій – комунікація, підтримка мисленнєвої діяльності та
віднімання). Усе це мотивує зв’язок теорії управління знаннями
з теорією інтелектуального капіталу щодо поняттєвого поля
організаційного, соціального (або структурного), і насамперед –
людського капіталу [Демська-Кульчицька 2005; Загнітко 2008;
Звегинцев 1968; Ситар 2009].
Як складник комп’ютерно-прикладної лінгвістики
корпусна лінгвістика спрямована на оптимізацію епістемічної
(гносеологічної) функції мови і своїм виміром проблем
мотивована опрацюванням, створенням та використанням
текстових (лінгвістичних) корпусів (термін з’явився в 60-ті роки
ХХ століття (перший комп’ютерний корпус – Браунівський в
Університеті Брауна з 500 фрагментів текстів по дві тисячі слів
у кожному з ємністю один мільйон слововживань; модель цього
корпусу була використана при створенні корпусів інших
національних мов (російської у 1980-ті роки в Університеті
Уппсали (Швеція), активізація ж корпусно-лінгвістичних
досліджень постала у вісімдесяті роки двадцятого століття у
зв’язку з розвитком обчислювальної техніки). Для комп’ютерно-
302 прикладної лінгвістики характерним є опрацювання загальних
принципів побудови лінгвістичних корпусів даних з
використанням сучасних комп’ютерних технологій, розуміння
лінгвістичного корпусу як сукупності текстів, зібраних
відповідно до визначених принципів, проіндексованих за
визначеним стандартом і забезпечених спеціальною пошуковою
системою. Крім власне-конструювання корпусів даних,
корпусна лінгвістика створює комп’ютерний інструментарій для
опрацювання текстів. Частковим виявом корпусу постає корпус
текстів. Одиницями останнього виступають тексти або їхні
достатні фрагменти. Ілюстративні корпуси створюються після
проведення наукового дослідження, де метою постає не вияв
нових фактів, а підтвердження отриманих результатів, їхнє
обґрунтування [Дарчук 2008; Карпіловська, Ситар 2006;
Федоров 2006]. Це не ідеальні корпуси національної мови,
навіть окремого функційного стилю, а тільки вияв окремого
проблемного явища. У корпусній лінгвістиці значущим постає
розмежування динамічних (моніторних) і статичних корпусів.
Спочатку корпуси текстів створювалися як статичні утворення,
що виявляють відповідний часовий зріз мовної системи.
Типовим виявом такого різновиду корпусів є авторські корпуси –
колекції текстів письменників, наприклад, Корпус художніх
текстів Павла Загребельного (кафедра української мови та
прикладної лінгвістики Донецького національного
університету), Корпус художніх текстів Ф.М. Достоєвського
(Інститут російської мови РАН). Значна частина суто
лінгвістичних та екстралінгвістичних завдань вимагає вияв і
простеження історичних, еволюційно-динамічних процесів та
змін у функціонуванні мовних явищ, пор., наприклад, зміни
значення слів, частотність використання тих чи інших
синтаксичних конструкцій, видозміни в їхньому структуруванні,
співвідношення первинних і вторинних виявів функцій
морфологічних форм тощо. На реалізацію таких завдань і
спрямована опрацьована спеціальна програмна технологія
побудови та експлуатації динамічного корпусу текстів. Такі
корпуси кваліфікують як монітарні, особливість монтування
таких корпусів полягає в тому, що вони не передбачають
назавжди усталеного набору текстів. Протягом завчасно
303фіксованого часового проміжку наявне оновлення і/або
доповнення множинності текстового корпусу. До таких
монітарних корпусів належать, насамперед, Бірмінгемський
корпус, створений завдяки творчій ініціативі та керівництву
Дж. Сінклера. За концептуальним баченням користувача, такі
корпуси повинні бути репрезентативні (представницькі), повні
та економічні. Інколи диференціюють корпуси, вирізняючи
корпуси першого порядку – просте зібрання текстів, об’єднаних
якою-небудь спільною ознакою (мовою, жанром, автором,
періодом створення текстів, епохою, темою і под.). Доцільність
створення текстових корпусів мотивована: 1) поданням
лінгвістичних даних у реальному контексті; 2) досить розмаїтим
поданням даних (особливо у великому за обсягом корпусі);
3) можливістю багаторазового використання разово створеного
корпусу для розв’язання різних лінгвістичних завдань [Баранов
2001; Данилюк 2008; Карпіловська, Ситар 2006]. Сьогодні
репрезентативні корпуси існують (опрацьовуються) для
німецької, польської, сербської, словенської, новогрецької,
вірменської, чеської, китайської, японської, угорської та інших
мов, хоча важливими є дотримання авторських прав, зведення
усіх текстів у єдино-цілісну систему і форму, тематичне і
жанрове структурування корпусу тощо, що вимагає значної
затрати сил та енергії. Поряд з репрезентативними корпусами
(охоплення жанрових і функційно-стильових різновидів) наявні
й опортуністичні колекції текстів – газетні, новинарні (Рейтер),
колекції художньої літератури (Проект Гутенберг або Бібліотека
Мошкова) та ін. З-поміж корпусів вирізняються дослідницькі
корпуси та ілюстративні корпуси. Перші призначені для
розгляду та аналізу особливостей функціонування мовної
системи в різних аспектах, а останні – ставлять за мету не тільки
і не стільки вияв нових фактів, скільки підтвердження й
аргументація уже встановлених або здобутих результатів.

загрузка...

Літературне місто - Онлайн-бібліотека української літератури. Освітній онлайн-ресурс.