Як наукова дисципліна. Смп, засновані на правилах Основні типи машинного перекладу помилки автоматичного

Підходи до машинного перекладу

Системи машинного перекладу можуть використовувати метод перекладу заснований на лінгвістичних правилах. Найбільш підходящі слова з вихідного мови просто замінюються словами переказного мови.

Існує твердження, що для успішного вирішення проблеми машинного перекладу, необхідно вирішити проблему розуміння тексту на природній мові.

Як правило, метод перекладу заснований на правилах використовує символічне уявлення (посередника), на основі якого створюється текст на переказному мовою. А якщо враховувати природу посередника то можна говорити про інтерлінгвістіческом машинному перекладі або трансферному машинному перекладі. Ці методи вимагають дуже великих словників з морфологічної, синтаксичної і семантичної інформацією і великого набору правил.

Якщо у системи машинного перекладу буде достатня кількість даних, то можна отримати переклад хорошої якості. Основна складність полягає в формуванні цих даних. Наприклад, великі корпуси тексту необхідні для статистичних методів перекладу, для перекладу, заснованого на граматиці, виявляються недостатніми. Більш того, для останніх, потрібне додаткове завдання граматики.

Для перекладу родинних мов (російська, українська) може виявитися достатньої проста заміна слів.

Сучасні системи машинного перекладу ділять на три великі групи:

· Засновані на правилах;

· Засновані на прикладах;

СМП, засновані на правилах

Системи машинного перекладу засновані на правилах - загальний термін, який позначає системи машинного перекладу на основі лінгвістичної інформації про вихідний іпереказному мовами.

Вони складаються з двомовних словників і граматик, що охоплюють основні семантичні, морфологічні, синтаксичні закономірності кожної мови. Такий підхід до машинного перекладу ще називають класичним.

На основі цих даних вихідний текст послідовно, за пропозиціями, перетворюється в текст перекладу. Часто, такі системи протиставляють системам машинного перекладу, які засновані на прикладах.

Принцип роботи таких систем - зв'язок структури вхідного і вихідного пропозиції. Переклад при цьому виходить не особливо гарної якості. Але на простих прикладах працює.

Переклад з англійської на німецьку буде виглядати як:

A girl eats an apple. Ein Madchen isst einen Apfel.

Ці системи діляться на три групи:

· Системи послівного перекладу;

· Трансфертні системи;

· Інтерлінгвістіческом;

послівний переклад

Такі системи використовуються зараз вкрай рідко через низьку якість перекладу. Слова вихідного тексту перетворюються (як є) в слова перекладного тексту. Часто таке перетворення відбувається без лематизації і морфологічного аналізу. Це найпростіший метод машинного перекладу. Він використовується для перекладу довгих списків слів (наприклад, каталогів). Так само він може бути використаний для складання подстрочечніка для TM-систем.

трансферні системи

Як трансфертні системи, Так і інтерлінгвістіческом, мають одну і ту ж загальну ідею. Для перекладу необхідно мати посередника, який в собі несе сенс перекладного виразу. У інтерлінгвістіческом системах посередник не залежить від пари мов, в той час як в трансфертних - залежить.

Трансферні системи працюють за дуже простим принципом: до вхідного тексту застосовуються правила, які ставлять у відповідність структури вихідного і переказного мов. Початковий етап роботи включає в себе морфологічний, синтаксичний (а іноді і семантичний) аналіз тексту для створення внутрішнього уявлення. Переклад генерується з цього подання з використанням двомовних словників і граматичних правил. Іноді на основі первинного уявлення, яке було отримано з вихідного тексту, будують більш «абстрактне» внутрішньо уявлення. Це робиться для того, щоб акцентувати місця важливі для перекладу, і відкинути несуттєві частини тексту. При побудові тексту перекладу перетворення рівнів внутрішніх уявлень відбувається в зворотному порядку.

При використанні цієї стратегії виходить досить високу якість перекладів, з точністю в районі 90% (хоча це сильно залежить від мовної пари). Робота будь-якої системи трансфертного перекладу складається як мінімум з п'яти частин:

· Морфологічний аналіз;

· Лексичний трансфер;

· Структурний трансфер;

· Морфологічна генерація.

Морфологічний аналіз. Слова вихідного тексту класифікуються за частинами мови. Виявляються їх морфологічні ознаки. Визначаються леми слів.

Лексичні категоризації. У будь-якому тексті деякі слова можуть мати більш ніж одне значення, викликаючи неоднозначність в аналізі. При лексичної категоризації виявляється контекст слова. Можливі різного роду позначки і уточнення.

Лексичний трансфер. На основі двомовного словника відбувається переклад лем слів. Дія дуже схоже на послівний переклад.

Структурний трансфер. Слова узгоджуються в реченні.

Морфологічна генерація. На основі вихідних даних структурного трансферу створюються словоформи перекладного тексту.

Однією з основних особливостей трансфених систем машинного перекладу є етап, під час якого проміжне представлення тексту мовою оригіналу «передається» в проміжне представлення тексту в цільовому мовою. Це може працювати на одному з двох рівнів лінгвістичного аналізу, або відразу на обох.

1. Поверхневий (синтаксичний) трансфер. Цей рівень характеризується передачею «синтаксичних структур» між вихідним і перекладним мовою. Підходить для мов в тій же сім'ї або того ж типу, наприклад, в романських мов, між італійським іспанським, каталонським, французьким, і т.д.

2. Глибинний (семантичний) трансфер. Рівень характеризується семантичним представленням. Воно залежить від мови оригіналу. Це уявлення може складатися з ряду структур, які представляють значення. Переклад також зазвичай вимагає структурного трансферу. Цей рівень використовується для перекладу між більш віддаленими мовами.

Інтерлінгвістіческом машинний переклад

Інтерлінгвістіческом машинний переклад - один з класичних підходів до машинного перекладу. Початковий текст трансформується в абстрактне уявлення, яке не залежить від мови (на відміну від трансфертного перекладу). Перекладний текст створюється на основі цього подання. Основною перевагою такого підходу є те, що для додавання нової мови в систему. Можна довести математично, що в рамках цього підходу, створення кожного нового інтерпретатора мови для такої системи буде здешевлювати її, в порівнянні, наприклад, з системою трансфертного перекладу. Крім того, в рамках такого підходу можна

· Реалізувати «переказ тексту», перефразування вихідного тексту в рамках однієї мови;

· Відносно проста реалізація перекладу сильно відрізняються мов, таких як, наприклад російський та арабський.

Однак, до цього часу не існує реалізацій такого підходу, які б коректно працювали б хоча б для двох мов. Багато експертів висловлюють сумніви в можливості такої реалізації. Сама велика складність для створення подібних систем полягає в проектуванні міжмовної уявлення. Воно повинно бути одночасно абстрактним і незалежних від конкретних мов, але в той же час воно має відображати особливості будь-якого існуючого мови. З іншого боку, в рамках штучного інтелекту, завдання виділення сенсу тексту на даний момент до цих пір не вирішена.

Вперше інтерлінгвістіческом підхід був запропонований в 17 столітті Декартом і Лейбніцем, які запропонували універсальні словники, які використовують числові коди. Інші, такі як Кейв Бек, Афанасій Кірхер і Йоганн Йоахім Бехер працювали над розробкою однозначного універсальної мови, заснованого на принципах логіки і іконографікі.

У 1668 році Джон Уілкінс в трактаті «Досвід про Справжньою символіки і філософському мовою» розповів про своє інтерлінгва.

У 18 і 19 століть було розроблено багато універсальних мов, в тому числі і Есперанто. Відомо, що ідея універсальної мови для машинного перекладу, ніяк не виявилася на початкових етапах розвитку цієї технології. Замість неї розглядалися тільки пари мов. Однак, протягом 1950-х і 60-х років, дослідники в Кембриджі очолювані Маргарет Мастерман, в Ленінграді на чолі з Миколою Андрєєвим і в Мілані Сильвіо Ceccato почали роботу в цій галузі.

У 1970-х і 1980-x роках були зроблені певні успіхи в цій галузі і був побудований ряд систем машинного перекладу.

У цьому методі перекладу, міжмовна уявлення можна розглядати як спосіб опису аналізу тексту, на мові оригіналу. При цьому, в поданні зберігаються морфологічні, синтаксичні характеристики тексту. Передбачається, що таким чином можна передати «сенс» при створенні перекладного тексту.

При цьому іноді використовується два міжмовних уявлення. Одне з них більш відображає характеристики вихідного мови. Інше - мови перекладу. Переклад в даному випадку проводиться в два етапи.

У деяких випадках використовуються два і більше уявлення одного рівня (однаково близькі до обох мов), але різняться за тематикою. Це необхідно для підвищення якості перекладу специфічних текстів.

Такий підхід не новий для лінгвістики. Він заснований на ідеї близькості мов. Для поліпшення якості перекладу, природна мова використовується в якості моста між двома іншими мовами. Наприклад, при перекладі з української на англійську, іноді використовується російська мова.

Для використання системи інтерлінгвістіческом машинного перекладу необхідні:

· Словники для аналізу і генерації текстів;

· Опис граматик мов;

· База знань понять (для створення міжмовної уявлення);

· Правила проекції понять для мов та подання.

Найскладнішим моментом при створенні такого типу є неможливість побудувати базу для широких областей знань. А ті бази, які створюються для дуже специфічною тематики, мають високу обчислювальну складністю.

  • ДЕ-1. Основи будови і властивості матеріалів. Фазові перетворення.
  • ДЕ-2.Основи термічної обробки і поверхневого зміцнення сплавів
  • Лекція 13. Машинний переклад тексту. Комп'ютерні мовні словники

    Основи машинного перекладу

    Переклад- це вид мовного посередництва, який орієнтований на іншомовний оригінал. Переклад розглядається як іншомовна форма існування повідомлення, що міститься в оригіналі. Міжмовна комунікація, здійснювана за посередництвом перекладу, в найбільшою мірою відтворює процес безпосереднього мовного спілкування, при якому комуніканти користуються одним і тим же мовою.

    машинний переклад - це автоматичне вилучення знань і текстів, написаних природною мовою за допомогою комп'ютерних програм з опорою на лінгвістичне забезпечення.

    Процес машинного перекладу - це дії комп'ютера по перетворенню тексту на одному природною мовою в еквівалентний за змістом текст на іншій мові, а також результат такої дії.

    Система автоматичного розуміння тексту, Виходить з того, що текст на природній мові, побудований у відповідності зі словниками, граматикою і алгоритмами природної мови, що спирається на семантичну мережу, фрейми та тезауруси, розуміється користувачем завдяки тому, що у нього існують лінгвістичні знання - синтактіко-семантичні структури, а також спеціальні знання.

    Більшість систем автоматичної обробки мови ставлять своїм завданням аналіз текстів, заздалегідь розбитих на пропозиції. Однак мовні дані доступні нам найчастіше у вигляді текстів, розмічених на абзаци, глави і інші більші одиниці. Тому для їх ефективного автоматичного аналізу необхідні відповідні алгоритми сегментації.

    Завдання при створенні системи автоматичного розуміння тексту:

    · Аналіз вихідного природного тексту, який забезпечує побудову лінгвістичних структур, в тому числі різних семантичних структур, повних, часткових, стислих, що прагнуть представити зміст тексту в формі баз даних,

    · Порівняння лінгвістичних структур тексту зі спеціальними або індивідуальними знаннями, також представленими у формі бази даних

    · Генералізація текстів на основі інформації, що містяться в традиційних реляційних базах даних, а також в концептуальних текстових структурах або в індивідуальних базах даних.

    для здійснення машинного перекладу в комп'ютер вводиться спеціальна програма, яка реалізує алгоритм перекладу, під яким розуміється послідовність однозначно і строго певних дій над текстом для знаходження перекладних відповідностей в заданій парі мов при заданому напрямку перекладу (з одного конкретного мови на іншу). Є також окремі системи машинного перекладу, розраховані на переклад в рамках трьох і більше мов, але вони в даний час є експериментальними.

    Сучасний машинний, або автоматичний переклад здійснюється за допомогою людини: перед-редактора, який тим чи іншим чином попередньо обробляє підлягає перекладу текст, інтер-редактора, який бере участь в процесі перекладу, або пост-редактора, який виправляє помилки і недоліки в перекладеному машиною тексті .

    Система машинного перекладу включає в себе двомовні словники, забезпечені необхідною граматичною інформацією (морфологічної, синтаксичної та семантичної), які забезпечують передачу еквівалентних, варіантних і трансформаційних перекладних відповідностей, тлумачні і спеціальні тематичні словники, а також алгоритмічні засоби граматичного аналізу, які реалізують будь-яку з прийнятих для автоматичної переробки тексту формальних граматик.

    Найбільш поширеною є наступна послідовність формальних операцій, забезпечують аналіз і синтез в системі машинного перекладу:

    · Введення тексту і пошук вхідних словоформ у вхідному словнику з супутнім морфологічним аналізом, в ході якого встановлюється приналежність даної словоформи до визначеної лексеми. У процесі аналізу з форми слова можуть бути отримані також відомості, що відносяться до інших рівнів організації мовної системи.

    · Переклад ідіоматичних словосполучень, фразеологічних єдностей або штампів даної предметної області, визначення основних граматичних характеристик елементів вхідного тексту, дозвіл омографів, лексичний аналіз і переклад лексем. Зазвичай на цьому етапі однозначні слова відокремлюються від багатозначних, після чого однозначні слова переводяться за списками еквівалентів, а для перекладу багатозначних слів використовуються так звані контекстологіческого словники, словникові статті яких представляють собою алгоритми запиту до контексту на наявність / відсутність контекстних визначників значення.

    · Остаточний граматичний аналіз, в ході якого доопределяется необхідна граматична інформація з урахуванням даних вихідного мови.

    · Синтез вихідних словоформ і пропозиції в цілому на вихідному мовою.

    Аналіз і синтез можуть проводитися як пофразно, так і для всього тексту, введеного в пам'ять комп'ютера; в останньому випадку алгоритм перекладу передбачає визначення так званих анафорических зв'язків.

    Якість машинного перекладу залежить від:

    · Обсягу словників,

    · Обсягу інформації, що приписується лексичним одиницям,

    · Ретельності складання і перевірки роботи алгоритмів аналізу і синтезу,

    · Ефективності програмного забезпечення.

    Однак ні від однієї з програм поки не можна очікувати «правильного», літературного перекладу тексту, що складається з складних фраз.

    Сучасні апаратні і програмні засоби допускають використання словників великого обсягу, що містять детальну граматичну інформацію. Інформація може бути представлена \u200b\u200bяк в декларативною(Описової), так і в процедурної(Враховує потреби алгоритму) формі.

    Удосконалення програм з машинного перекладу пов'язане з концепцією м'якого розуміння тексту, згідно з якою різні користувачі отримують свою інформацію і свій індивідуальний сенс з одного і того ж тексту. Модель м'якого розуміння тексту складається в здатності породжувати різні осмислені інтерпретації вихідного об'єкта в залежності від різних умов і складових його сприйняття.

    Більш приватні "машинні засоби" на допомогу перекладачеві і редактору - це автоматичні словники і термінологічні бази даних, комп'ютерні тезауруси, засоби екранного редагування, системи орфографічною, термінологічної і граматичної корекції текстів.

    Сучасний машинний переклад слід відрізняти від використання комп'ютерів в допомогу людині-перекладачеві. В останньому випадку мається на увазі автоматичний словник, Що допомагає людині швидше підбирати потрібний перекладної еквівалент. Хоча і в тому, і в іншому випадку комп'ютер працює разом з людиною (перекладачем або редактором), у зміст терміну «машинний переклад» входить уявлення про те, що головну, більшу частину роботи по переводу і відшукання перекладних еквівалентів і перекладних відповідностей машина бере на себе, залишаючи людині лише контроль і виправлення помилок.

    комп'ютерний словник в допомогу людині - це допоміжний засіб для швидкого знаходження перекладних відповідностей; при цьому, в такого роду словниках в обмеженій мірі можуть бути реалізовані і деякі функції, властиві системам машинного перекладу.

    В інформаційній технології розрізняються 2 основні підходи до машинного перекладу:

    · Поверхове ознайомлення зі змістом документа чужою мовою

    · Використання машинного перекладу замість звичайного «людського». Це передбачає ретельне редагування та налаштування системи перекладу на певну предметну область.

    Тут грають роль повнота словника, орієнтованість його на утримання і набір мовних засобів перекладних текстів, ефективність способів вирішення лексичної багатозначності, результативність роботи алгоритмів вилучення граматичної інформації, знаходження перекладних відповідностей і алгоритмів синтезу.

    Як вид мовної діяльності переклад зачіпає всі рівні мови - від розпізнавання графем (і фонем при перекладі усного мовлення) до передачі змісту висловлювання і тексту. Крім того, машинний переклад надає можливість перевіряти теоретичні гіпотези про будову тих чи інших мовних рівнів і ефективності пропонованих алгоритмів.

    Необхідність в удосконаленні машинного перекладу постійно зростає, так як це є найважливішою умовою забезпечення міжмовної комунікації, обсяг якої зростає з кожним роком.

    Інші способи подолання мовних бар'єрів на шляху комунікації - розробка або прийняття єдиної мови, а також вивчення іноземних мов - не можуть зрівнятися з перекладом по ефективності.

    датою народження машинного перекладу як дослідницької області зазвичай вважають березень 1947; саме тоді фахівець з криптографії Уоррен Вівер в своєму листі Норбертові Вінерові вперше поставив завдання машинного перекладу, порівнявши її з завданням дешифрування.

    Проблемами машинного перекладу займається комп'ютерна лінгвістика, Яка народилася в січні 1954 року, коли в Джорджтаунському університеті (США) був проведений перший в світі публічний експеримент по машинному перекладу. У ті ж часи під керівництвом найбільшого математика і кібернетика Олексія Ляпунова почалися активні роботи з машинного перекладу і в Москві. На початку 1956 року в Інституті прикладної математики (ІПМ) ім.М.В.Келдиша почала працювати перша вітчизняна система машинного перекладу з французької на російську мову.

    Лідери серед сучасних програм машинного перекладу в Росії - система PROMT (розробка компанії ПРОМТ, www.e-promt.ru) і система СОКРАТ (розробка компанії «Арсенал '», www.ars.ru).

    В останній версії PROMT з'явилася принципово нова функціональність, «Асоційована Пам'ять». Механізм «Асоційованої Пам'яті» дозволяє навчати систему. З його допомогою можна зберегти задовольняє вас переклад тексту в базі знань і надалі використовувати його фрагменти при перекладі схожих текстів.

    СОКРАТ намагається знайти однозначне рішення і не дає варіантності в термінах: слово, якого немає у словнику, залишається в вихідному написанні. PROMT ж зазвичай пропонує кілька варіантів перекладу слів і словосполучень.

    Машинний переклад, який пройшов кілька стадій свого розвитку, в даний час сконцентрований на ідеї моделювання дій людини-перекладача. Процес перекладу дуже важкий, а правильне використання переваг програмного забезпечення багато в чому визначає якість перекладу. Сучасні системи машинного перекладу включають в себе безліч додаткових словників. Грунтуючись на особливостях архітектурних рішень для лінгвістичних алгоритмів, системи поділяються на два типи - "Трансфер" і "Інтерлінгва". Програми автоматичного перекладу будуються відповідно до цього поділом. Так, наприклад програма "Сократ" переводить набагато краще, ніж скажімо "Меджік Гудді" тому, що лінгвістичне забезпечення першої програми набагато сильніше, а словники набагато більше за обсягом.

    Результати машинного перекладу завжди доводиться редагувати. Так, наприклад, в програмі "Парс" передбачена функція додаткового підключення словників різної тематики. Адже від якості забезпечення програми залежить і якість видається машиною перекладу. Але навіть тонка настройка системи під лексику тексту, що не враховує всіх його особливостей, тому перекладені слова, що мають кілька синонімів, позначаються зірочкою, або наводяться в дужках як варіант.

    Інтернет технології дали новий розвиток машинного перекладу, допомогли вивести його на нову стадію розвитку. Машинний переклад - це ефективний засіб для перегляду і пошуку інформації іноземною мовою, а саме ця функція є головною при роботі в Інтернеті. Сучасний стан машинного перекладу дозволяє отримувати відносно коректний текст перекладу веб-сторінок з більшості мов. І хоча повністю автоматичний високоякісний переклад неможливий, вже є програмне забезпечення, яке полегшує сам процес перекладу.

    В результаті настройки на предметну область і інтеграції з іншими програмами обробки документів машинний переклад дозволяє автоматизувати отримання переказного тексту.

    основною проблемою всіх програм машинного перекладу є правильний вибір тематичного словника, а також вибудовування допоміжних словників.

    Переклад частково залежить і від рівня підготовки користувача (знання мови, навички роботи з програмами, почуття мови), а також більшою мірою його вміння правильно працювати з текстовим редактором, допоміжними утилітами, словниками та фразеологічними довідниками. Варіанти перекладів, вироблених з підключенням тематичних словників, дає хороший переклад, правильний вибір значення слова і вживання фраз в тексті. Це пояснюється тим, що машина налаштовує свій словник на вибір тих синонімів, які б відповідали більшою мірою тематиці входить мови, і переводила б відповідно до тематики вихідного мови.

    2 підходи до проблеми розвитку машинного перекладу:

    · Установка на використання універсальної мови сенсу, прямий підхід до перекладу, перетворення тексту оригіналу в текст перекладу

    · Установка на проміжний мову, моделювання людського володіння мовою

    Проблема полягає в тому, що зміст тексту на природній мові залежить не тільки від самої пропозиції, але також і від контексту, який пов'язаний з багатозначністю слів і синтаксичних конструкцій, практичною неможливістю глобального опису семантичної структури світу навіть в обмеженій предметної області, відсутністю ефективних формальних методів опису лінгвістичних закономірностей.

    невирішені проблеми машинного перекладу - це

    · Рішення неоднозначності формального синтаксичного аналізу ізольованих речень тексту

    · Подолання структурної і смислової неповноти ділянок (фрагментів) тексту

    · Організація гнучкого підключення різних предметних областей

    · Необхідність розуміння тексту як цілого освіти

    Програми машинного перекладу краще обробляють наукові, технічні та освітні тексти, яким притаманне суворе виклад матеріалу.

    Розмовний та публіцистичний стиль, де багато специфічних оборотів, але більшість слів використовується в прямому сенсі, придатні для ознайомлювального перекладу, однак для отримання грамотного вихідного тексту потрібно ручна правка. Одержуваний переклад є таким собі ознайомчим текстом, де передається лише загальна тематична спрямованість тексту.

    Переклад же художньої літератури та поезії не відповідає вимогам машини. Сенс тексту, побудованого на алегоричних висловлюваннях, при машинному перекладі спотворюється і недоступний навіть для ознайомлення. Машина не розуміє багатозначності, що в свою чергу призводить до неправильної інтерпретації тексту, що перекладається, який перетворюється на безглуздя.

    Постаратися мінімізувати такі непорозуміння можна, дотримуючись такі правила:

    · Правильно вибудовувати тематичні словники

    · Перевіряти текст оригіналу на стадії передпідготовки його перекладу

    · Редагувати на кінцевій стадії перекладу

    · Правильно використовувати програми словників

    · Добре знати граматику і лексику, а також тематику вихідного тексту

    · Правильно оперувати словниковим запасом, кліше і словоформами

    · Своєчасно поповнювати спеціальні словники новими термінами

    Яким чином здійснюється робота програми перекладача?

    В її основі лежить алгоритм перекладу - послідовність однозначно і строго певних дій над текстом для знаходження відповідностей в даній парі мов L1 - L2 при заданому напрямку перекладу (з одного конкретного мови на іншу). Звичайні словники і граматики різних мов не застосовні для машинного перекладу, так як описують значення слів і граматичні закономірності в нестрогой формі, що не прийнятною для «машинного» використання. Отже, потрібна формальна граматика мови, тобто логічно несуперечлива і явно виражена (без жодних подразумеванія і недомовок). Як тільки почали з'являтися формальні описи різних областей мови - перш за все морфології та синтаксису, - намітився прогрес і в розробці систем автоматичного перекладу. Щоб успішно працювати, система машинного перекладу включає в себе, по-перше, двомовні словники, забезпечені необхідною інформацією (морфологічної, що відноситься до форм слова, синтаксичної, яка описує способи поєднання слів у реченні, і семантичної, тобто відповідає за зміст), а по-друге - кошти граматичного аналізу, в основі яких лежить яка-небудь з формальних, тобто строгих, граматик. Найбільш поширеною є наступна послідовність формальних операцій, які забезпечують аналіз і синтез в системі машинного перекладу.

    • 1. На першому етапі здійснюється введення тексту та пошук вхідних словоформ (слів в конкретній граматичній формі, наприклад давального відмінка множини) у вхідному з супутнім морфологічним аналізом, в ході якого встановлюється приналежність даної словоформи до визначеної лексеми (слова як одиниці словника). У процесі аналізу з форми слова можуть бути отримані також відомості, що відносяться до інших рівнів організації мовної системи, наприклад, яким членом речення може бути дане слово. Для машини поєднання двох цих операцій - і граматичного розбору, і звернення до сенсу слів - завдання важке. Краще зробити синтаксичний аналіз не залежних від змісту слів, а словник використовувати на інших етапах перекладу.
    • 2. Що таке незалежний синтаксичний аналіз, можна зрозуміти, якщо спробувати розібрати фразу, з якої «прибрані» значення конкретних слів. Блискучим зразком фрази такого роду є придумане академіком Л.В. Щербой пропозицію: Глока куздра штетко будланула бокра і кудрячіт бокрёнка. Безглузда фраза? Начебто так: в російській мові немає слів, з яких вона складається (крім союзу і). І все ж в якійсь мірі ми її розуміємо.
    • 3. Тобто машина здійснює синтаксичний аналіз пропозиції без опори на значення складових його слів, з використанням інформації тільки про їх граматичних властивостях. В результаті синтаксичного аналізу виникає синтаксична структура, яка зображується у вигляді дерева залежностей: «корінь» - присудок, а «гілки» - синтаксичні відносини його з залежними словами. Кожне слово пропозиції записується в своїй словникової формі, а при ній вказуються ті граматичні характеристики, якими володіє це слово в аналізованому реченні.
    • 4. 2. Наступний етап включає в себе переклад ідіоматичних словосполучень, фразеологічних єдностей або штампів даної предметної області (наприклад, при англо-російській перекладі обороти типу in case of, in accordance with отримують єдиний цифровий еквівалент і виключаються з подальшого граматичного аналізу); визначення основних граматичних (морфологічних, синтаксичних, семантичних і лексичних) характеристик елементів вхідного тексту (наприклад, числа іменників, часу дієслова, їх ролі в даній пропозиції та ін.), яке виробляється в рамках вхідного мови; дозвіл неоднозначності (скажімо, англ. round може бути іменником, прикметником, прислівником, дієсловом або ж приводом); аналіз і переклад слів. Зазвичай на цьому етапі однозначні слова відокремлюються від багатозначних (що мають більше одного переказного еквівалента в вихідному мовою), після чого однозначні слова переводяться за списками еквівалентів, а для перекладу багатозначних слів використовуються так звані контекстологіческого словники, словникові статті яких представляють собою алгоритми запиту до контексту на наявність / відсутність контекстних визначників значення.
    • 5. 3. Остаточний граматичний аналіз, в ході якого доопределяется необхідна граматична інформація з урахуванням даних вихідного мови.
    • 6. 4. Синтез вихідних словоформ і пропозиції в цілому на вихідному мовою. Тут не вийде обійтися простим переказом «вузлів» дерева на іншу мову. Синтаксис кожної мови влаштований на свій лад: то, що в російській реченні - підмет, в іншій мові може (або повинно) бути виражено доповненням, а доповнення, навпаки, має перетворитися в підмет; то, що в одній мові позначається групою слів, перекладається на інший за все одним словом і т.д. Такий перехід від структури до реального пропозицією називається синтаксичним синтезом.
    • 7. В залежності від особливостей морфології, синтаксису і семантики конкретної мовної пари, а також напрямки перекладу загальний алгоритм перекладу може включати і інші етапи, а також модифікації названих етапів або порядку їх слідування, але варіації такого роду в сучасних системах, як правило, незначні . Для вирішення проблеми багатозначності слова використовується аналіз контексту. Справа в тому, що кожне з декількох значень багатозначного слова в більшості випадків реалізуються в своєму наборі контекстів. Тобто у кожного з «конкуруючих» (при інтерпретації) значень - свій набір контекстів. І саме ось ця залежність значення від оточення дозволяє слухає зрозуміти висловлювання правильно. Для правильного розуміння висловлювання необхідно повною мірою враховувати також правила обумовленості цього значення лексичним оточенням (діючі при «фразеологічної» інтерпретації слова), правила обумовленості цього значення семантичним контекстом (так звані закони семантичного узгодження) і правила обумовленості цього значення граматичним (морфолого-синтаксичним) контекстом.
    • 8. Діючі системи машинного перекладу, як правило, орієнтовані на конкретні пари мов (наприклад, французьку та російську або японська та англійська) і використовують, як правило, перекладні відповідності або на поверхневому рівні, або на деякому проміжному рівні між вхідним і вихідним мовою. Якість машинного перекладу залежить від обсягу словника, обсягу інформації, що приписується лексичним одиницям, від ретельності складання і перевірки роботи алгоритмів аналізу і синтезу, від ефективності програмного забезпечення. Сучасні апаратні і програмні засоби допускають використання словників великого обсягу, що містять детальну граматичну інформацію. Інформація може бути представлена \u200b\u200bяк в декларативної (описової), так і в процедурній (враховує потреби алгоритму) формі.
    • 9. У практиці перекладацької діяльності і в інформаційній технології розрізняються два основні підходи до машинного перекладу. З одного боку, результати машинного перекладу можуть бути використані для поверхневого ознайомлення зі змістом документа чужою мовою. У цьому випадку він може використовуватися як сигнальна інформація і не вимагає ретельного редагування. Інший підхід передбачає використання машинного перекладу замість звичайного «людського». Це передбачає ретельне редагування та налаштування системи перекладу на певну предметну область. Тут грають роль повнота словника, орієнтованість його на утримання і набір мовних засобів перекладних текстів, ефективність способів вирішення лексичної багатозначності, результативність роботи алгоритмів вилучення граматичної інформації, знаходження перекладних відповідностей і алгоритмів синтезу. На практиці переклад такого типу стає економічно вигідним, якщо обсяг перекладаються текстів досить великий (не менше кількох десятків тисяч сторінок на рік), якщо тексти досить однорідні, словники системи повні і припускають подальше розширення, а програмне забезпечення зручно для постредагування.

    Машинний, а точніше, комп'ютерний переклад - це також письмовий переклад, оскільки в результаті ми отримуємо письмовий текст. Однак здійснює його НЕ перекладач, а особлива комп'ютерна програма. Сучасні комп'ютерні програми перекладу досить досконалі, але вони до сих пір не можуть дозволити найскладнішу задачу процесу перекладу: вибір контекстуально необхідного варіанту, який в кожному тексті зумовлений багатьма причинами. В даний час результат цього виду перекладу може бути використаний як чорновий варіант майбутнього тексту, який буде редагувати перекладач, а також як засіб, щоб і крайньої ситуації відсутності перекладача отримати загальне уявлення про тему і зміст тексту.

    Ще більш складну задачу представляє переклад усного тексту за допомогою комп'ютерних програм, так як проблема розпізнавання усного мовлення знаходиться лише на початковому етапі свого рішення. До сих пір непереборною перешкодою є індивідуальна забарвлення звучання сегмента мови - на будь-якій мові така мова погано формалізується.

    Попереднє редагування синтаксичноїструктури може полягати в:

    · розбитті наддовгих пропозиції (більше 40 слів) на кілька коротших, додаючи при цьому (якщо необхідно) зв'язкові елементи;

    · введенні в англійський текст артиклів там, де це необхідно або граматично виправдано;

    · повторенні елементів при сочинительной зв'язку словосполучень в реченні;

    · введенні спілок при використанні безсполучникового зв'язку між пропозиціями;

    · усуненні конструкцій в дужках в середині іменний групи або в середині речення;

    · заміні оказіональних абревіатур на повні найменування або введення спеціальних символів, що не допускають їх переклад;

    · усунення лексичних і логічних Еліпс, неформальних конструкцій і метафор;

    · приведення до єдиного вигляду конструкцій або складних слів, які можуть зустрічатися в тексті в злитому, дефисном і вільному написанні.

    Відредагований вручну текст потім автоматично обробляється в системі МП.

    25. Загальна схема машинного перекладу.

    У всьому світі використання систем машинного перекладу, не дивлячись на всі їх слабкі сторони, давно стало елементом професійної роботи перекладача, який повинен вміти використовувати комп'ютер не тільки як друкарську машинку. Поняття автоматизованого робочого місця перекладача, що включає комплекс резидентних словників, тезаурусів, систем перевірки орфографії, систем доступу до інформації по різних мережах передачі даних має увійти в ужиток спеціаліста_філолога.

    Система машинного перекладу (МП) текстів може використовуватися як частина такого автоматизованого робочого місця перекладача, забезпечуючи при цьому отримання високоякісного перекладу, жорстко орієнтованого на конкретну предметну область, завдання користувача і тип документації. Крім того, така система може допомогти користувачеві, що не знає іноземну мову, дуже швидко і з невеликими витратами отримати приблизний (грубий) переклад текстів в цікавій для його галузі знань, переклад, достатній для розуміння інформації, що передається текстом іноземною мовою.

    Загальні вимоги до практичних системам

    машинного перекладу (МП)

    · Стійкість роботи системи. Система МП повинна давати результат, який можна використовувати навіть в разі дефектів вихідного матеріалу і неповноти словникового забезпечення.

    · тиражованою системи. Система повинна мати досить прості програмні і лінгвістичні засоби для розширення областей її застосування.

    · адаптованість системи. Система МП повинна мати кошти настройки на потреби конкретних користувачів і особливості оброблюваних документів.

    · Оптимальність часових параметрів. Швидкість перекладу текстів повинна відповідати або обсягу надходить в одиницю часу інформації, або нормам роботи користувачів.

    · комфорт користувача. Сервісні засоби системи повинні забезпечувати зручність роботи користувача у всіх можливих в системі режимах роботи.

    При роботі з конкретною системою машинного перекладу потрібно пам'ятати, що переклад здійснюється на декількох супідрядних рівнях реалізації системи.

    До таких рівнях в загальному випадку відносяться:

    · рівень автоматичного предредактірованія тексту;

    · рівень лексико-морфологічного аналізу;

    · рівень контекстного аналізу і аналізу груп;

    · рівень аналізу функціональних сегментів;

    · рівень аналізу пропозицій;

    · рівень синтезу вихідного тексту;

    · рівень автоматичного постредагування.

    58. Рецкер Я.І. Про закономірних відповідностях при перекладі на рідну мову // Теорія і методика навчального перекладу. - М., 1950. С.

    59. Рецкер Я.І. Теорія перекладу і перекладацька практика. - М., 1974

    60. Семенова М.Ю. Основи перекладу тексту. - М., 2009

    61. Стрілківський Г.М. Теорія і практика військового перекладу. - М., 1979

    62. Тер-Минасова С. Г. Мова і міжкультурна комунікація. - М .. 2000

    63. Тюленєв С.В. Теорія перекладу. - М .: Гардарики, 2004

    64. Федоров А.В. Основи загальної теорії перекладу. - СПБ., 2002

    65. Флорін С., Влахов С. Неперекладне в перекладі. - М., 1980

    66. Халеева І.І. Основи теорії навчання розумінню іноземної мови (підготовка перекладачів). - М., 1989

    67. Хомський Н. Мова і мислення. - М., 1972

    68. Чернов Г.В. Теорія і практика синхронного перекладу. - М., 1978

    69. Чужакін А., Палажченко П.Мір перекладу, або Вічний пошук взаєморозуміння. М., 1997 - 2004

    70. Чуковський К.І. Високе мистецтво. - М., 1968.

    71. Швейцер А.Д. Теорія перекладу (статус, проблеми, аспекти). М., 1998.

    72. Швейцер А. Д. Переклад і лінгвістика. - М., 1973.

    73. Ширяєв А. Ф. Переклад як об'єкт комплексного наукового вивчення // Лінгвістичні проблеми перекладу. - М., 1981.

    74. Ширяєв А.Ф. Посібник з синхронного перекладу. - М., 1982.

    75. Ширяєв А.Ф. Теорія перекладу. Статус. Проблеми, аспекти. М., 1988

    76. Шадрін В.І.Теорія sкороsв сучасному перекладознавстві // Матеріали XXVІІІ міжвузівської науково-методичної конференції викладачів і аспірантів. Вип. 5. Актуальні проблеми теорії і практики перекладу. 15-22 березня 1999 СПб., 1999..

    Алис шетелде шиққан әдебіеттер:

    1. Bassnett-McGuire S. Translation Studies. - Methuen, L. and N.-Y., 1980.

    2. Brislin R.W. (ed). Translation. Application and Research. - N.-Y., 1976.

    3. Brower R. (ed). On Translation. - Cambridge (Mass.), 1959.

    5. Catford J. A Linguistic Theory of Translation. - L., 1965.

    6. Coseriu E. Teoria del lenguaje у lingliistica general. Cinco estudias. - Madrid, 1973.

    7. Dolet E. De la manie're de bien traduire d'une langue en l'autre. - P., 1540

    8. Delisle J. L'analyse du discourse comme methode de traduction. - Ottawa, 1984

    9. Dryden J. Ovid "s Episteles // W.P.Ker (ed.) Essays of John Dryden. - Oxford, 1926.

    10. Firth J.R. Linguistic Analysis and Translation // For Roman Jakobson. - The Hague, 1956.

    11. Goethe J.W. Drei Stucke vom Übersetzen // H.J.Storig (Hrsg.). Das Problem des Übersetzen. - Stuttgart, 1963.

    12. Gutt E.-A. Translation and Relevance. Cognition and Context. - Cambridge (Mass.), 1991.

    13. Güttinger F. Zielsprache. Theorie und Technik des Übersetzens. - Zürich, 1963.

    14. Halliday M.A.K. Comparison and Translation // M.A.K. Halliday, A.Mclntosh, P.Strevens. The Linguistic Sciences and Language Teaching. - L., 1964.

    15. Halliday M.A.K. The comparison of languages \u200b\u200b// A.Mclntosh, M.A.K.

    16. Halliday. Patterns of Language. L., 1966.

    17. Holz-Mänttäri J. Transtatorisches Handeln. Theorie und Methode. - Helsinki, 1964.

    18. Humboldt, W. Einleitung zu «Agamemnon» // H.J. Störig (Hrsg.). Das Problem des Übersetzens. - Stuttgart, 1963.

    19. Jäger G. Translation und Translationslinguistik. - Halle (Saale), 1975.

    20. Jäger G., Müller D. Kommunikative und maximale Äquivalenz von Texten

    // Äquivalenz bei der Translation. - Leipzig, 1982.

    21. Jäger G. Die sprachlichen Bedeutungen - das zentrale Problem bei der Translation und ihrer wissenschaftlichen Beschreibung // Bedeuting und Translation. Leipzig, 1986.

    22. Jakobson R. On Linguistic Aspects of Translation // R.Brower (ed.). On Translation. - Cambridge (Mass.), 1959.

    23. Kade O. Zufall und Gezetzmassigkeit in der Übersetzung. - Leipzig, 1968.

    24. Kade O. Die Sprachmittling als gesellschaftliche Erscheinung und Gegenstand wissenschaftlicher Untersuchung. - Leipzig, 1980.

    25. Kelletat A.F. Die Ruckschritte der Übersetzungstheorie. - Vaasa, 1986.

    26. Koller W. Einfürung in die Übersetzungswissenschaft // 6. Auflage. Wiebelsheim, 2001.

    27. Krings H.P. Was in den Kopfen von Übersetzern vorgeht. - Tübingen, 1986.

    28. Lederer, M. La traduction simultanée. Experiance et théorie. - Paris, 1981.

    29. Luther M. Sendbrief vom Dolmetschen // H.J.Störig (Hrsg.). Das Problem des Übersetzens. - Stuttgart, 1963.

    30. Людсканов А. Превеждат човек'т і машіната. - Софія, 1957.

    31. Mounin С. Les Problèmes théoriques de la traduction. - Paris, 1963.

    32. Mounin G. Teoria et storia, della traduzione. - Turin, 1965.

    33. Mounin G. Linguistique et traduction. - Bruxelles, 1976.

    34. Neubert A. Pragmatische Aspekte der Übersetzung // A.Neubert (Hrsg.).

    Grundfragen der Übersetzungswissenschaft. - Leipzig, 1968.

    35. Neubert A. Text and Translation. - Leipzig, 1985.

    37. Nida E. Principles of Translation as Exemplified by Bible Translating. // R.Broper (ed.) On Translation. - Cambridge (Mass.), 1959.

    38. Nida E. Toward a science of translating. - Leiden, 1964

    39. Nida E., Taber C.R. The Theory and Practice of Translation. - Leiden, 1964.

    40. Nida E, Reyburn W.D. Meaning Across Cultures. - N-Y., 1976.

    41. Quine W. Meaning and Translation. // R.Brower (ed.) On Translation. - Cambridge (Mass.), 1959.

    42. Reiss K. Möglichkeiten und Grenzen der Übersetzungskritik. - München, 1971.

    43. Reiss K .. Vermeer H.J. Grundlegung einer allgermeinen Translationstheorie. Tübingen, 1984.

    44. Rose M.D. (Ed.). Translation Spectrum. Essays in Theory and Practice. - Albany, 1981.

    45. Ross C.D. Translation and Similarity // M.D.Rose (ed.) Translation Spectrum. - Albany, 1981.

    46. \u200b\u200bSavory T. The Art of Translation. - L., 1952.

    47. Schleiermacher F. Methoden des Übersetzens // H.J.Störig. Das Problem des Übersetzens. - Stuttgart, 1963.

    48. Seleskovich D., Lederer M. Interpreter pour traduire. - Paris., 1987.

    49. Snell-Hornby M. Translation Studies. An Integrated Approach. - Amsterdam, Philadelphia, 1988.

    50. Sperber D., Wilson D. Relevance: Communication and cognition. - Oxford, 1986.

    51. Tirkkonen-Condit S. Textual Criteria in Translation Quality Assessment, - Jyvaskyla, 1982.

    52. Toury G. In Search of a Theory of Translation. - TelAviv, 1980.

    53. Tytler A.F. Essay on the principles of translation. - L., одна тисяча сімсот дев'яносто один.

    54. Vehmas-Lehto I. Quasi-Correctness. - Helsinki, 1989.

    55. Vinay J.-P., Darbelnet J. Stilistique comparée du français et de 1 "anglais. - Paris, 1968.

    56. Voegelin C.F. Multiple Stage Translation // IJAL. - Vol.20, No.4, 1954.

    57. Wilss W. Übersetzungswissenschaft: Probleme und Methoden. - Stuttgart, 1978.

    58. Wilss W. Kognition und Übersetzen: Zu Theorie und Praxis der menschlichen und der maschinellen Übersetzung. - Tüsbingen, 1988.

    59. Shuttleworth M., Cowie M. Dictionary of Translation Studies. - Manchester, UK: St.Jerome Publishing, 1997. - 234 p.

    Пайдаланған сөздіктер, ресмі құжаттар, оқулиқтар, аударилған еңбектер:

    1. Аяпова Ж.М., Аринов Е.М. Іскер адамниң орисша-қазақша економікалиқ түсіндірме сөздігі. А., 1993

    2. Егеубай А. Кісілік кітаби. - Алмати, 1998..

    3. Ібатов А. Қутбтиң «Хусрау уа Шірін» поемасиниң сөздігі (XІV ғасир) .- Алмати, 1974.

    4. Ібраєва А. Заң терміндерінің қазақша-орисша және орисша-қазақша қисқаша түсіндірме сөздігі. А., 1996.

    5. Қазақстан Республікасиниң Констітуціяси. А., 1995

    6. Қазақстан Республікасиниң Констітуціясиниң түсіндірме сөздігі. А., 1996.

    7. Қаліев Ғ. Тіл білімі терміндерінің түсіндірме сөздігі. А., 2005.

    8. Қаліев Ғ., Болғанбаев Ә. Қазіргі қазақ тілінің лексікологіяси мен фразеологіяси. А., 2006

    9. Қожахметова Х.К., т.б. Қазақша-орисша фразеологіялиқ сөздік. А., 1988

    10. Рахматуллін Х. Банк терміндерінің орисша-қазақша қисқаша сөздігі. А., 1992

    11. Рүстемов Л.З. Араб-іран кірме сөздерінің қазақша-орисша түсіндірме сөздігі. А., 1989

    12. Російсько-казахські прислів'я і приказки / Упоряд. А.Туреханов і ін. - А., 1999.

    13. Сапарғаліев Ғ. Заң терміндерінің түсіндірме сөздігі. А., 1995

    14. Тәзкіре-і-Бұғра хан - ауд.Серікбай Қосан. - Алмати: Толағай, 2007.

    Пайдаланған дереккөздер:

    1. Абай. Шиғармалариниң екі томдиқ толиқ жінағи. Екінші тому. Өлеңдер мен аудармалар. Поемалар. Қара сөздер. А., 1995

    2. Ібрай Ибирай. Екі томдиқ шиғармалар жінағи. А., 1988

    4. Ауезов М. Шлях Абая /Пер.А.Кіма. - А., 2007. Кн.1.

    5. Әуезов М. Жіирма томдиқ шиғармалар жінағи. А., т.XІІ, 1983, т. XІX, 1985.

    6. Әуезов Мұхтар. Абай залізниця: Роман-епопея. А., 1989.

    7. Джамбул. Вибрані твори. А., 1981

    8. Есенберлін І. Алмас қилиш (Тарихи роман). А., 1971