Оптимізація епістемної функції мови 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Оптимізація епістемної функції мови



1. Термінознавство і термінографія.

2. Корпусна лінгвістика.

Термінознавство є розділом лексикології, що вивчає терміносистеми мови, принципи їхньої організації, механізми творення термінів, вимоги до них, а також розв'язує прикладні завдання впорядкування й кодифікації терміносистем і їхніх відповідників у різних мовах. Терміносистема є системою слів і сполук, що позначають коло понять однієї спеціальної сфери спілкування в науці, виробництві, техніці, мистецтві тощо. Терміносистемі властиві певні ознаки:

1) прагнення до одно-однозначної відповідності, тобто моносемії, хоч така однозначність порушується практично у всіх терміносистемах, що спричинене різними аспектами дослідження того самого поняття або невпорядкованістю термінологічного апарату певної течії, галузі чи теорії через їхню новизну;

2) прагнення до усунення синонімії шляхом конкретизації строгої дескрипції синонімічних пар чи дублетів;

3) відкритість і динамізм системи, що виявляється у процесах термінологізації, ре- й детермі­нологізації, постійному поповненні системи новими термінами;

4) жорстка конвенційність, що дає змогу застосовувати терміни в певній обмеженій сфері спілкування;

5) стилістична нейтральність. Терміносистема не відповідна метамові певної галузі, оскільки до метамови входять формули, символіка, які не належать до природної мови.

Термін (від лат. terminus - межа, Terminus у давніх римлян був богом межі й межового каменя, який охороняв недоторканність земельної ділянки, установлював межу) кваліфікується як слово чи сполука, що позначає поняття спеціальної сфери спілкування в науці, виробництві, техніці, мистецтві, в конкретній галузі знань чи людської діяльності. Як зазначає українська дослідниця термінології Л. Симоненко, «термін, з одного боку, стає засобом закріплення результатів пізнання в певних галузях, а з другого - засобом фіксації нових знань» [Українська термінологія 2007, 21]. Вважається, що слово «термін» уперше з'явилося у 1876 р. у Німеччині. В українському мовознавстві «термін» фіксується з XVIII ст. у працях Г. Кониського. Термін є складником системи мовних знаків, яка обслуговує сферу спілкування у відповідній галузі разом із загальновживаним лексиконом. Слово загальновживаної лексики співвідноситься з загальновідомим об’єктом, а слово термінологічної лексики співвідноситься з об’єктом специфічним, відомим лише вузькому колу спеціалістів. Формули, математичні і символьні вирази різного роду = терміни, хоча вони можуть входити в терміни (бета-каротин).

Уперше у східнославістичних студіях розгляд терміна як складника терміносистеми здійснений у фундаментальній праці радянського лінгвіста Д. Лотте, де вказано також на ознаки термінів і вимоги до термінології [1961]. Загалом ознаки термінів розглянуто у працях О. Реформатського, В. Виноградова, Р. Піотровського, О. Ахманової, К. Горалека, Ф. Данеша, Н. Родзевича, Е. Скороходька, В. Лейчика, О. Герда, Б. Головіна, О. Суперанської, Л. Симоненко, Т. Кияка й ін. Попри дискусійність дефініції терміна російський термінознавець В. Лейчик вважає, що це традиційне питання може бути розв'язане на підставі кваліфікації терміна як «лексичної одиниці мови для спеціальних потреб». Дослідник розглядає номінативну, сигніфікативну, дефінітивну, комунікативну, прагматичну, евристичну, когнітивну, класифікаційну функції терміна [2006, 63-97]. Сучасні термінознавчі студії спрямовані на динамічний розгляд терміна як функціонального, текстового явища [Алексеева 2003, 18-40], яке матеріалізується в мовленні, точніше - в дискурсі [Лейчик 2006, 233-234] і являє собою вербалізований концепт, що надає терміно­логічним дослідженням когнітивного спрямування.

Головними вимогами до термінів є

- системність, що стосується понятійного змісту, словесного вираження й відповідності між змістом і формою [Головин, Кобрин 1987, 16-17];

- наявність класифікаційної дефініції (тлумачення, яке ґрунтується на ключовому гіперонімі й видовій специфіці або холонімі);

-  стислість;

- відповідність позначуваному поняттю;

- однозначність і конкрети­зація в межах терміносистеми;

- прозорість внутрішньої форми; жорстка конвенційність;

- стилістична нейтральність;

- залученість до відповідної системи понять певної галузі;

- відповідність нормам мови, що запобігає появі професійних жаргонізмів;

- точність і короткість;

- дериваційна здатність;

- інваріантність як відсутність варіантів і синонімів;

- висока інформативність.

Деякі з цих вимог існують лише в ідеалі. На нараді з лінгвістичних проблем науково-технічної термінології у 1967 році, проведеній Академією наук СРСР, було висловлено думку, що основні характеристики терміна є лише «провідною тенденцією в даному функціональному класі слів і ніколи не реалізуються повністю» [Кутина 1967, 94]. Дійсно, в реальній терміносистемі нерідко наявна багатозначність, яка «створює неточність системи» [Лотте 1961, 15]. Притаманні терміносистемам синонімія й варіантність, яка, на думку В. Даниленко, є характерною особливо для початкових етапів формування термінологічних систем, коли ще не відбувся природний або штучний відбір кращого терміна і співіснують багато варіантів [1977, 73]. Дискусійним питанням залишається співвідношення синонімії й варіантності: варіантність розглядають як вияв синонімії, синонімію вважають виявом варіантності, або вони кваліфі­куються як окремі явища мови. Найбільш реалістичною видається думка О. Ахманової, яка вбачає межу між синонімами й варіантами у спільності коренів, яка належить варіантам, а різнокореневі слова є синонімами [1957, 232]. Тим самим синоніми й варіанти є різними виявами мовного семіозису.

Будь-яка терміносистема включена до відповідної мовної системи, але не подібна до неї за загальними принципами побудови (у терміносистемі відсутні фонетична, морфологічна, синтаксична специфіка й особливі семантичні процеси; наявні лише слова, сполуки й переваги у певних способах творення). У складі термінологічної лексики можна виділити декілька «прошарків», які відрізняються сферою застосування, особливостями об’єкту, що позначається:

а) перш за все це загальнонаукові терміни, які використовуються в різноманітних областях знань і належать науковому стилю мови в цілому. Наприклад, такі терміни як: «граматика», «мова», «система», «структура», «зв’язки» і т.д. Такі терміни утворюють загальний поняттєвий фонд різних наук та мають найбільшу частоту застосування.

б) розрізняються також і вузькоспеціальні терміни, які закріплені за певними науковими дисциплінами, галузями виробництва та техніки. Наприклад, в лінгвістиці: «підмет», «присудок», «займенник», «прикметник»; в медицині: «інфаркт», «хірургія», «кардіологія» і т.д. В цих термінологіях концентрується квінтесенція кожної науки.

в) терміни-абревіатури та скорочення. Наприклад, «R&A» (reliability and availability), «AFBC», «V-MOS», «X-ray» та інші.

Творення термінів відбувається здебільшого шляхом семантичної деривації (метонімізації та найчастіше метафоризації як використання знака однієї предметної сфери на позначення іншої); запозичення; калькування з інших мов; морфологічних способів словотворення, часто із застосуванням інтернаціональних елементів, стандартних спеціалізованих морфем (терміно-елементів); абревіації й аналогії, а інколи і шляхом креації - створення абсолютно нового знака. Між загальною системою мови й залученими до неї терміносистемами відбувається певна взаємодія, яка кваліфікується дослід­никами як явище детермінологізації (переходу терміна до загальновживаної лексики) чи термінологізації (переходу загальновживаного слова чи сполуки до терміносистеми). Дискусійним питанням є визначення межі терміно­логізації. Я. Климовицький вважає, що «термін перетинає межу терміно­логізації, коли він займає певне місце в термінологічній матриці, певну вільну клітинку» [1969, 85]. Між терміносистемами також спостерігається процес ретермінологізації - перенесення терміна з однієї терміносистеми до іншої при збереженні чи зміні понятійного змісту.

У межах терміносистем постійно відбувається планове вдосконалення як здійснення її систематизації (упорядкування згідно з відповідною організацією та категоризацією сфери науки й техніки), унормування, або кодифікації (приведення у відповідність до наявних у мові норм), уніфікації (приведення у відповідність змісту терміна до позначених понять, усунення варіантності) і стандартизації (приведення до стандартів терміносистем).

Спірною проблемою термінознавства є розмежування терміна й номена як номенклатурного знака, на що вперше звернули увагу Г. Винокур й О. Реформатський. Номенклатура відрізняється від термінології, на думку термінознавців, способом позначення (відносно довільним, подібним до ярлика), об'єктом позначення (номени іменують одиничні поняття або, точніше, предмети), функцією (дефінітивною для терміна й сигніфікативною для номена). Однак загалом дослідники здебільшого вказують на перевагу спільних рис номенів і термінів й доволі непослідовне розрізнення цих понять у науковій літературі [Дудик 1980, 84]. В. Лейчик розглядає номени на межі термінів і власних назв [1974].

Сучасне термінознавство поступово виходить за межі лексикології мови і знаходить точки дотику із соціолінгвістикою, комп'ютерною лінгвістикою, перекладознавством, отримуючи прикладне спрямування. Як зазначає А. Баранов, сьогодні у світі налічується понад 20 тисяч термінологічних стандартів, особливі стандарти з організації терміносистем розробляються не лише на державному й міжнародному рівнях, а й окремими компаніями та фірмами. У цих умовах стандартизація й уніфікація термінів і терміносистем постає не лише як наукова, а і як практична, промислова задача [2003, 90]. Напрямки діяльності у термінознавстві та термінології

Уніфікація термінів: 20 тис. термінологічних стандартів. Стандарти розробляються на державному, міжнародному рівнях, окремих компаніях, фірмах.

Причини: багатозначність термінів однієї терміносистеми, омонімія, відсутність узгодження між близькими терміносистемами. Держава фінансує розробку термінологічних стандартів, обов’язкових для застосування в тих чи інших документах. Є збірники рекомендованих для використання термінів. Напрямом мовної політики держави є стандартизація й упорядкування терміносистем, формування комп'ютерних версій термінологічних банків даних і систем їхнього машинного перекладу.

Особливістю нашого часу, який межує не лише зі століттями, а й тисячоліттями, є те, що нарешті після багатьох років поневірянь та утисків українська мова знову зайняла своє достойне місце в усіх сферах життєдіяльності, і зокрема у науковій галузі. Поступово на державну мову перейшла освіта і переходить наука. Як писав колись І. Огієнко, "українська мова здатна бути мовою науки, як і всі інші мови...".

Національна термінологія як складова частина наукової мови знаходиться на гребені свого третього національного відродження. На запити середньої і вищої освіти упродовж 1990-х років з'явилася низка термінологічних словників, які в тій чи іншій мірі заповнювали прогалину спеціальних назв і понять. Звичайно, не усі лексикографічні праці відповідали духові і завданням часу, але кожна з них по краплиночці додавала снаги нашій науковій мові, пробуджувала її від десятилітньої сонливості, заставила запрацювати на рівні найпрестижніших європейських мов, а може, й краща.

Уже давно побутує думка, що в Україні на сьогодні є кілька термінологічних центів, основні з яких знаходяться у Харкові, Києві і Львові. Зокрема Львівський термінологічний центр, започаткований у свій час на кафедрі української мови Львівського національного університету ім. Івана Франка, успішно функціонує як самостійна номенклатурна одиниця і установа при державному університеті «Львівська політехніка». Це Комітет науково-технічної термінології, який веде широку просвітницьку роботу, виконує державне замовлення на створення держстандартів,а також плідно працює в лексикографічному та організаційному напрямах. Так, під егідою центру за останні десять років з'явилися такі словники: «Російсько-український електрорадіотехнічний словник» (за ред. В.С Перхача), «Російсько-український та українсько-російський словник з радіоелектроніки» (Б. Рицар, К. Семенистий, І. Кочан); «Російсько-український словник термінів і зворотів з технологїї нафти» (А. Зелізний, Г.О. Літковець, З.В. Гуменецький, М. Ганіткевич); «Російсько-український словник з хімії та хімічної технології» (А. Зелізний та М. Ганіткевич); «Російсько-український автошляховий словник» (І. Фецович), «Англійсько-український словник-довідник інженерії довкілля" (Т. Балабан) тощо.

Переклад науково-технічної термінології. В ідеальному випадку переклад передбачає пошук еквівалента у мові – цілі: dynamic process – динамічний процес, A-plant – атомна станція, lexicology – лексикологія. При відсутності еквівалента новий термін може бути створений на основі вже наявних в ній інших слів, близьких за значенням.

Переклад термінів налічує низку проблем. Слід пам'ятати, що з однієї мови на іншу терміни не перекладаються як звичайні слова. Оптимальним є такий шлях перекладання термінів: «поняття -український термін», а не «іншомовний термін - український термін», з якої мови не відбувався б переклад. Тобто пошук терміна-відповідника починається з аналізу властивостей нового поняття. Цілком можливо, що якась з властивостей «підкаже» іншу назву цьому поняттю, ніж вона є у мові, з якої здійснюється переклад. Проілюструвати це можна таким прикладом. У російській термінології, наприклад, одна деталь ізолятора називається «юбка» - очевидно назву підбирали за подібністю. Українська термінологія для цього поняття має термін «острішок» (від слова «стріха»). Як бачимо, асоціації у творців двох термінів були різні. Тому перекладати російський електромеханічний термін «юбка» українським словом «спідниця» не можна - це нетермінологічний підхід. Так само помилково буде перекладися російський будівельний термін «грохот» як «гуркіт» чи «грюкіт», оскільки йдеться про назву пристрою для пересіювання піску чи цементу, і в українській терміносистемі для того існує слово «решето».

Переклад термінології здійснюється різними прийомами, а саме за допомогою таких міжмовних трансформацій як: лексичих, лексико-семантичнх та лексико-граматичних. Задача перекладача полягає у вірному виборі того чи іншого прийому в ході процесу перекладу, щоб якнайточніше передати значення будь-якого терміна.

Лексичні прийоми перекладу термінів.

Одним з найпростіших прийомів перекладу терміна є прийом транскодування. Транскодування - це побуквенна чи пофонемна передача вихідної лексичної одиниці за допомогою алфавіту мови перекладу. Даний прийом є рідким виключенням в практиці технічного перекладу (наприклад, lаsеr - лазер, діод - diode). При перекладі способом транслітерації не слід забувати й про «фальшивих друзів перекладача» (таких, як сопtributiоп, datа, snstапсе, stimulatiоп, еtс.), транслітераційний спосіб перекладу яких призводить до грубих викривлень смислу.

Терміни також підлягають іншому лексичному прийому перекладу - калькуванню - передача не звукового, а комбінаторного складу слова, коли складові частини слова (морфеми) чи фрази (лексеми) перекладаються відповідними елементами мови перекладу. Даний прийом застосовується при перекладі складних за структурою термінів. Наприклад: а standart kеу-сотbіпаtіоп - стандартна комбінація клавіш, формат рози вітрів – wind rose format.

Також переклад термінів можливий шляхом опису значення. Такий прийом застосовується при перекладі новітніх авторських термінів-неологізмів, які подаються зазвичай в лапках. Наприклад: Тoday we are all members of many global “non-place” - сьогодні ми всі є членами багатьох глобальних спільнот, що не прив'язані до якоїсь певної території.

У випадку, коли словник не дає точного еквівалента тому чи іншому терміну, або ж коли застосування калькування, транслітерації чи описового перекладу недоречне, можливими також є інші прийоми перекладу.

Лексико-семантичні та лексико-граматичні прийоми перекладу. До інших трансформаційних прийомів, що застосовуються при перекладі термінів можна віднести: конкретизацію та генералізацію.

Конкретизація - процес, при якому одиниця більш широкого конкретологічного змісту передається в мові перекладу одиницею конкретного змісту. В українській мові необхідно робити заміну слова чи словосполучення, що мають більш широкий спектр значень, еквівалентом, який конкретизує значення згідно контексту або стилістичних вимог. Наприклад, поняття «досліджувати» може відноситися до різних ситуативних умов, і в значній мірі упорядковується контекстом; в англійській мові цьому поняттю будуть відповідати різні більш вузькі за значенням одиниці, в залежності від контексту:

to explore - досліджувати місцевість (порівн. to explore the environment)

to investigate - досліджувати ринок (порівн. to investigate the market)

to research into - досліджувати явище (порівн. to research into the classical literature).

При перекладі термінів також важливим є застосування прийому генералізації. Генералізація вихідного значення має місце в тих випадках, коли міра інформаційної упорядкованості вихідної одиниці вища за міру упорядкованості одиниці, що відповідає їй за змістом в мові перекладу. Наприклад: щілинний фільтрedge-type filter.

Деякі інші трансформаційні прийоми перекладу термінів вимагаються в тих випадках, коли значення того чи іншого терміну для української мови є новим. Для прикладу можна взяти англійські тексти з різних вузькопрофесійних сфер людської діяльності.

Скажімо, в англійському тексті з оптичної інтерферометрі! є терміни, переклад яких не зареєстрований галузевими англо-українськими словниками. Наприклад, термін field time of the camer. Відразу спадає на думку те, що найважчим при перекладі даного словосполучення є значення field. Тим не менше, зрозумівши, що мова йде про роботу камери з отримання сигналів від об'єкту, що знімається, можна зробити висновок, що field time - це «час, протягом якого камера отримує сигнал від об'єкта», «час зйомки». В цілому для перекладу терміна field time of the camer краще за все підходить існуючий в українській мові термін «такт камери». Збереження при перекладі цього терміну буде означати, що перекладач скористається прийомом логічної синонімії.

Також можна перекладати терміни, скориставшись прийомом експлікації. Експлікація - коли лексична одиниця мови оригіналу замінюється словом (словосполученням), яке передає його значення. Наприклад термін localized filter, який в даному контексті - контексті з оптичної інтерферометри перекласти як «локалізований фільтр» чи «місцевий фільтр» неможливо через правила сполучуваності слів в українській мові. Цей термін довелося б перекласти як «фільтр, який працює в рамках кожної точки».

В іншому англійському тексті, де мова йде про екологічні проблеми, а саме, про боротьбу з пожежами в тропічних лісах, зустрічаються такі терміни: slash - and - burn fires, land - maintenance. Виясняється, що першим терміном позначеного поняття, що є частим випадком для поняття, позначеного другим терміном. Перший термін можна перекласти з допомогою прийому експлікації (в залежності від вузького контексту) або ж як «вогнища при спалюванні відходів під час чищення лісного масиву», або ж як «розчищення площі лісного масиву шляхом вирубки і випалювання». Для другого терміну, що має більш широке значення, допустимими є наступні варіанти перекладу (знову ж таки в залежності від вузького контексту): «ґрунтозахисне випалювання рослинності» (спосіб добавлення), «природоохоронне випалювання рослинності» (спосіб генералізації та добавлення). Так чи інакше, а слово «пожежі» в українських термінах, що характеризують природоохоронну діяльність людини - небажані.

Розглянемо ще деякі прийоми. Компресія - більш компактне викладення думок завдяки випущенню зайвих елементів та позамовного контексту. Наприклад: перехід від одного виду зношення до другого — wear transition. Інверсія - це зворотній порядок слів, для привернення уваги до конкретних елементів. Наприклад: spring-engaged piston - поршень, притиснутий(до дисків) пружинами.

Можливе також семантичне калькування (tree structure – деревовидна структура), структурне калькування (philosophia – любомудрість), запозичення (know – how), описова конструкція.

Розробка Термінологічних Банків Даних (з допомогою комп’ютерних технологій) за різними областями знання і сферами практичної діяльності.

 За типом ТБД: перекладні (орієнтовані на завдання перекладу науково-технічної термінології), інформаційно-нормативні (визначають стандарти викор. н-т. термінології).

Найбільш потужним у світі є термінологічний банк даних фірми «Сіменс», що містить близько двох із половиною мільйонів термінологічних записів на 8 мовах світу. Міжнародні дослідження в галузі термінології координують Віденський Міжнародний центр інформації з термінології (Інфотерм), Міжнародна організація з уніфікації термінологічних неологізмів у Варшаві і Міжнародна організація зі стандартизації. Протягом 1992-1996 р. р. в Україні видано понад 600 Державних стандартів термінів і визначень, що відображене у створеному Технічним комітетом стандартизації науково-технічної термінології банку даних української наукової термінології [Рицар 2001,87-88]. Українська термінологія уже впродовж двох століть привертає до себе увагу багатьох учених, фахівців, ентузіастів національного відродження. Адже українська мова стоїть як рівноправна серед інших мов, і є цілком придатною для творення наукового стилю. Інша справа, що через історичні обставини та політичні спекуляції вона не завжди мала право вільно і беззастережно виконувати свої прямі функції, обслуговуючи різні сфери людського життя.

Створення словників спеціальних термінів. Словники для людей: перекладні, тлумачні, більш. – дескриптивні, нормативні. Машинні словники: 1) інформаційно-пошукові тезауруси, 2) частотні словники, 3) рубрикатори, 4) класифікатори.

Інформаційно-пошукові тезауруси (ІПТ) – призначені для автоматичного пошуку інформації у значних за об’ємом масивах. Описують терміни-дескриптори з точки зору їх родо-видових та асоціативних відношень, вказуються синонімічні терміни.

 

 

Корпусна лінгвістика.

Корпусна лінгвістика є галуззю прикладного мовознавства, яка займається формуванням комп'ютерних корпусів текстів у різних мовах і спрямована на максимально об'єктивний аналіз мовних явищ в умовах реальної живої комунікації. Поява цієї галузі у 70-80-ті р. р. ХХ ст. пов'язана з розвитком комп'ютерної науки. У 60-ті р. р. уперше до засад корпусної лінгвістики звернувся британський професор Р. Квірк, який очолив колектив по формуванню Лондонсько-Лундського корпусу текстів. Обсяг цього корпусу дорівнював 1 млн. слововживань (у 100 писемних і 100 усних текстах). Цей корпус у машинному варіанті упорядковувався в Лундському університеті (Швеція) до 1979 року під керівництвом Я. Свартвіка. На його базі у 1985 році було укладено Повну граматику англійської мови.

У США корпусна лінгвістика зазнала критики з боку основоположника генеративізму Н. Хомського, який назвав корпусний спосіб накопичення мовних даних неадекватним і хибним для опису породжувальної здатності природної мови, оскільки лише інтуїція мовця може замінити корпус і стати джерелом мовного матеріалу [The Linguistic encyclopedia 2004, 85].

Найбільш відомим корпусом американського варіанта англійської мови є Браунівський, що створювався у Браунівському університеті з 1961 року під керівництвом У. Френсіса і X. Кучери. Цей корпус має такий самий обсяг слововживань, як і Лондонсько-Лундський. До нього ввійшли 500 текстів літературного варіанта англійської мови й тексти 15 жанрів американського варіанта (індексована версія з'явилася у 1980 році). Британським аналогом Браунівського корпусу є Ланкастерсько-Осло-Бергенський (індексована версія вийшла у 1985 році). У СРСР робота над створенням корпусів текстів була розпочата з першої половини 70-х років. Із 1987 року в Уппсальському університеті створюється «Уппсальський машинний фонд російської мови» (близько 1 млн. слововживань). Спільним російсько-французьким проектом упорядковано корпус за дискурсивними словами російської мови, одиницею зберігання якого були зв'язні тексти відповідного часу, автора й жанру (15 тис. сторінок) [Дискурсивные слова русского языка 1998].

Головним поняттям корпусної лінгвістики є корпус мовленнєвої реалізації мови, що кваліфікується як сформована за певними вимогами вибірка мовленнєвого матеріалу, який може використовуватися для опису й дослідження мови як системи. Базовий, вихідний масив текстів разом із програмним забезпеченням формує динамічний корпус текстів. Складниками корпусу є одиниця зберігання, або базова одиниця, яка може відповідати слову, сполуці, синтагмі, висловленню, фрагменту тексту й цілому тексту залежно від мети створення корпусу. Одиниця зберігання може супроводжуватися параметризацією відповідних характеристик, у тому числі і джерела вилучення, а також маркерами деяких просодичних і паралінгвістичних особливостей природного мовлення. Одиниці усного мовлення обов'язково фіксуються на матеріальних носіях звукозапису, мають транскрибований вигляд, деякі корпуси містять відеозапис усного спілкування, тобто мають мультимедійний складник.

Корпуси можуть охоплювати всі мовні стилі й жанри або бути обмеженими певною дискурсивною сферою чи жанром (наприклад, Боннський корпус газетних текстів, німецький корпус текстів публічної політики за період з 1989-1990 p. p. «Wendekorpus»; російський корпус текстів словника Ф. Достоєвського тощо). Обмеження сфери вибірки певним жанром, типом дискурсивної практики, зразком текстів, автором визначає проблемну галузь корпусу одиниць зберігання. Співвідношення між корпусом текстів й обраною проблемною галуззю при пропорційному звуженні назване порогом відображення. Чим вищий поріг відображення, тим імовірніші випадки відсутності якихось явищ проблемної галузі в корпусі.

Залежно від мети створення корпусу вони поділяються на дослідницькі, що призначені для вивчення різних аспектів і проблем функціонування мови й мови як системи і передують дослідженню; ілюстративні, що підтверджують висновки дослідника та створюються після проведення аналізу. Останнім часом з'являються так звані моніторні корпуси, які, порівняно зі статичними, відтворюють зміни мовної системи протягом певного хронологічного періоду, наприклад, процеси архаїзації та неологізації тощо. Таким чином укладався Бірмінгемський корпус, ідеологом якого став Дж. Синклер. Цей корпус постійно поповнювався й відображав зміни в мові. До того ж користувачі отримали можливість створювати робочі корпуси з генерального корпусу, що містив 7,3 млн. слововживань. У Росії протягом 1996-1997 р. р. авторською групою у складі А. Баранова, М. Михайлова, Г. Сидорова у відділі експериментальної лексикографії Інституту російської мови РАН було створено динамічний корпус текстів сучасної публіцистики.

Головними проблемами корпусної лінгвістики є:

1) спосіб представлення та збереження мовленнєвих репрезентацій (виокремлюють структурований та неструктурований способи);

2) вимоги до корпусу текстів із боку укладачів і користувачів (дослідники наголошують на принципах репрезентативності відносно проблемної галузі; повноти з метою представлення релевантних явищ; економічності, яка повинна балансувати з репрезентативністю й повнотою; прозорості та зрозумілості одиниці збереження як її самодостатності, що усуває двозначність і неясність; обов'язкової комп'ютерної підтримки [Баранов 2003, 118-121]);

3) специфіка програмного забезпечення корпусів;

4) принципи відбору параметрів проблемної галузі;

5) способи структурації корпусу;

6) транскрипція текстів усного мовлення;

7) мультимедійна підтримка корпусів усного мовлення;

8) розробка пошукових систем у корпусі;

9) способи формування робочих корпусів зі складу генерального;

10) кодування дескрипцій одиниць збереження тощо.

Оскільки корпуси текстів створені або продовжують створюватися в різних країнах світу, координація зусиль дослідників є дуже незначною, що зумовлює різні формати репрезентації корпусного матеріалу, а значить, неможливість суміщення програм.

На підставі обробки комп'ютерного корпусу текстів здійснюється корпусний аналіз - один з об'єктивних методів мовного аналізу, спрямований на вивчення певних закономірностей й особливостей мови та мовлення. Застосовується в лінгвістичній семантиці з метою встановлення спектра контекстуальних значень й особливостей уживання лексем. Найбільш істотними недоліками цього методу є спрощення обробки мовного матеріалу й експланаторна негнучкість, тому оптимальним є поєднання корпусного аналізу з іншими методиками мовознавства.


Лекція 7, 8



Поделиться:


Последнее изменение этой страницы: 2021-12-15; просмотров: 51; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.12.161.77 (0.042 с.)