Główne rodzaje błędów tłumaczenia maszynowego. jako dyscyplina naukowa. Ogólne wymagania dotyczące praktycznych systemów

Schody. Grupa wejściowa. Materiały. Drzwi. Zamki. Projekt » materiały Główne rodzaje błędów tłumaczenia maszynowego. jako dyscyplina naukowa. Ogólne wymagania dotyczące praktycznych systemów

Główne rodzaje błędów tłumaczenia maszynowego. jako dyscyplina naukowa. Ogólne wymagania dotyczące praktycznych systemów

PRZEDMIOT, PRZEDMIOT I ZADANIA JĘZYCZNEJ TEORII TŁUMACZENIA

Obecnie lingwistyczna teoria przekładu ugruntowała swoją pozycję jako niezależna dyscyplina naukowa. Jednak szereg fundamentalnych kwestii, które determinują status teorii przekładu, wciąż pozostaje nierozwiązanych. Jednym z tych pytań jest pytanie o podmiot i przedmiot teorii przekładu.

W literaturze prezentowane są różne, często przeciwstawne punkty widzenia na temat tego, co należy uznać za przedmiot i przedmiot teorii przekładu. I.I.Revzin i V.Yu.Rozentsveig twierdzą, że przedmiotem przekładu jest sam proces przekładu, podczas którego następuje przejście od jednego systemu znaków do drugiego i który można opisać w terminach semiotycznych 86 . Autorzy ci dokonują zasadniczego rozróżnienia między procesem przekładu a wynikiem przekładu. Wychodzą one z faktu, że tradycyjnie przekład budowany był jako nauka normatywna, której głównym celem było ustalenie wyniku przekładu i opracowanie kryteriów oceny jakości przekładu. Normatywną teorię przekładu zbudowano empirycznie, na podstawie analizy porównawczej oryginałów i przekładów. Postanowienia teoretyczne zapożyczono z leksykologii, gramatyki, stylistyki i krytyki literackiej. Przy takim podejściu, zdaniem I. I. Revzina i V. Yu Rozentsvey, nie można osiągnąć teoretycznego zrozumienia procesu tłumaczenia. Nauka stara się opisać

„Revzin I. I., Rozentsveig V. Yu. M.: Wyższe. szkoła, 1964. s.21.

68 W. W. Sdobnikow, O. W. Pietrowa♦ TEORIA TŁUMACZENIA

Tłumaczenie jako proces nie powinno mieć charakteru normatywnego, ale teoretycznego. Oznacza to, że powinien opisywać nie to, co powinno być, ale to, co tkwi w samej naturze zjawiska 87 .

A.D. Schweitzer nie zgodził się z tym punktem widzenia i uważa, że tak ostra opozycja między podejściem teoretycznym a normatywnym nie jest uzasadniona. Wyłączenie z rozważania wyników procesu przekładu nadmiernie zawęża przedmiot teorii przekładu i nie pomaga w ujawnieniu jej istoty. Według A.D. Schweitzera tłumaczenie jest celową czynnością, spełniającą określone wymagania i standardy oraz nastawioną na osiągnięcie określonego rezultatu. Normy te odzwierciedlają orientację tłumacza na wartości, bez której nie da się w sposób zadowalający wyjaśnić logiki decyzji tłumaczeniowych 88 . Tak więc A.D. Schweitzer włącza w przedmiot teorii przekładu zarówno sam proces tłumaczenia, jak i wynik procesu tłumaczenia.

Wydaje się, że badacze przekładu, próbując określić przedmiot teorii przekładu, nie w pełni uwzględnili fakt, że przekład jest złożonym, złożonym zjawiskiem, na które ma wpływ wiele bardzo różnorodnych czynników. Zrozumienie tej okoliczności osiąga się w większym stopniu w pracach VN Komissarova, który całkiem słusznie zauważa, że nieuzasadnione jest przeciwstawianie procesu przekładu jego wynikowi. To wynik przekładu reprezentuje tę bezpośrednio obserwowalną rzeczywistość, na podstawie której można pośrednio ocenić, jak przebiegał proces przekładu, a która jest niedostępna dla bezpośredniej obserwacji.

„Revzin I. I., Rosenzweig V. Yu. Podstawy tłumaczenia ogólnego i maszynowego. M.: Wyższe. szkoła, 1964. s.21.

„Schweitzer A.D. Teoria przekładu: status, problemy, aspekty. M: Nauka, 1988. S.7.

CZĘŚĆ DRUGA. Teoria przekładu jako dyscyplina naukowa 69

Językoznawcza teoria przekładu zajmuje się zarówno tekstami w języku źródłowym (SL), jak i docelowym (TL), a także procesem konwersji tekstu oryginalnego na tekst docelowy. Ale to podejście nie jest całkowicie wystarczające. Działalność tłumaczeniowa z definicji ma charakter pośredniczący. Tłumaczenie zapewnia możliwość komunikacji międzyjęzykowej. A to oznacza, że aby stworzyć pełnoprawne tłumaczenie, tłumacz musi wziąć pod uwagę specyfikę autora oryginalnego przekazu i odbiorców tego przekazu, ich wiedzę, doświadczenie, a także specyfikę percepcji przekazu. osoby, do których przeznaczone jest tłumaczenie itp. wszystkie inne aspekty komunikacji międzyjęzykowej, które wpływają na przebieg i wynik procesu tłumaczenia. Oznacza to, że przedmiot teorii przekładu jest złożony i nie ogranicza się do samego procesu tłumaczenia i jego wyniku. Językoznawcza teoria przekładu rozpatruje tłumaczenie w szerokich ramach komunikacji międzyjęzykowej i bada wszystkie jego aspekty oraz czynniki determinujące, zarówno językowe, jak i zewnętrzne w stosunku do języka, ale bezpośrednio lub pośrednio wpływające na wybór jednostek językowych w procesie tłumaczenia 89 .

Z tego przedstawienia problemu widać, że wśród badaczy przekładu nie ma jedności w zakresie stosowanej terminologii. Przede wszystkim zwraca się uwagę na brak wyraźnego rozróżnienia pojęć przedmiotu badań naukowych i przedmiotu badań naukowych. Nawiasem mówiąc, analiza definicji oferowanych przez słowniki języka rosyjskiego również nie wyjaśnia tej kwestii. Na przykład, Przedmiot badania naukowe definiuje się jako „temat, który służy jako treść myśli, mowy, do której poznawczy lub twórczy”

89 Komissarov V.N. Teoria przekładu (aspekty językowe). M.: Wyższe. szkoła., 1990. S.40-41.

70 W. W. Sdobnikow, O. W. Pietrowa♦ TEORIA TŁUMACZENIA

Działania” 99 . Obiekt definiowany jest jako „ten, który przeciwstawia się podmiotowi, do którego skierowana jest jego merytoryczna działalność praktyczna i poznawcza” 100 . Jak widać, oba pojęcia definiowane są jako coś, ku czemu ukierunkowana jest praktyczna, poznawcza i twórcza aktywność przedmiotu badań. Jednocześnie celowe byłoby rozważenie jako przedmiotu badań czegoś, co naprawdę należy do kręgu materialnych zjawisk świata, a jako przedmiot badań - pewnego problemu, którego rozwiązanie w rzeczywistości ma na celu badanie naukowe w. Oparte na tym, nog jako przedmiot lingwistycznej teorii przekładu będziemy rozumieć pośredniczącą działalność tłumaczeniową w ramach komunikacji międzyjęzykowej, przedstawianą zarówno bezpośrednio (proces), jak i pośrednio, czyli odzwierciedloną w wynikach procesu tłumaczeniowego. Przedmiotem teorii przekładu jest badanie prawidłowości procesu tłumaczenia, czynników wpływających na przebieg procesu tłumaczenia i determinujących wynik tłumaczenia.

VN Komissarov 101 formułuje co następuje: zadania lingwistyczna teoria przekładu:

1) ujawnić i opisać ogólny językowy system operacyjny
nowe tłumaczenia, tj. wskazać, które cechy języka
kovy systemy i wzorce funkcjonowania
Języki są w centrum procesu tłumaczenia
sa, umożliwić ten proces i określić
jego charakter i granice;

2) zdefiniować przekład jako przedmiot lingwistyki
którzy studiują, wskazują na jej różnicę od innych
rodzaje mediacji językowych;

3) opracować podstawy klasyfikacji rodzajów pe
działalność tłumaczeniowa;

99 Słownik języka rosyjskiego w 4 tomach. Tom III. M.: Rus yaz., 1983. S.366. „Słownik języka rosyjskiego w 4 tomach. Tom 11. M: Rus. yaz., 1983. S.579. 101 K o m is s a r o v V. N. Teoria przekładu (aspekty językowe). M.: Wyższy szkoła., 1990. S.35-36.

CZĘŚĆ DRUGA. Teoria przekładu jako dyscyplina naukowa 71

4) ujawnić istotę równoważności przekładu jako podstawy równoważności komunikacyjnej tekstów oryginału i przekładu;

5) opracować ogólne zasady i cechy
budowa prywatnych i specjalnych teorii przekładu
tak dla różnych kombinacji języków;

6) opracować ogólne zasady opisu naukowego”
procesu tłumaczenia jako czynności tłumacza
przekonwertować oryginalny tekst na przedruk tekstu
woda;

7) ujawnić wpływ na proces tłumaczenia
czynniki pragmatyczne i socjolingwistyczne;

8) zdefiniować pojęcie „współczynnika tłumaczenia” i czasu
pracy zasady oceny jakości tłumaczenia.

Zgodnie z tymi zadaniami zostanie zbudowany nasz kurs ogólnej teorii przekładu. Najpierw jednak powinniśmy rozważyć kwestię wstępnego składu studiów translacyjnych i lingwistycznej teorii przekładu.

Translatoryka jako dyscyplina naukowa jest szersza niż teoria przekładu i obejmuje kilka dyscyplin lub działów naukowych. Studia przekładowe obejmują teorię przekładu, historię przekładu, krytykę przekładu, leksykografię przekładu, dydaktykę przekładu (metody nauczania przekładu). Jak widać, lingwistyczna teoria przekładu jest tylko jednym z działów przekładoznawstwa, ale jednocześnie ma charakter złożony i obejmuje następujące działy:

Ogólna teoria przekładu- dział lingwistycznej teorii przekładu, który bada najbardziej ogólne wzorce językowe przekładu, niezależnie od konkretnej pary języków zaangażowanych w proces tłumaczenia, sposobu realizacji tego procesu i indywidualnych cech konkretnego aktu tłumaczeniowego.

Specjalna teoria tłumaczeń- dział lingwistycznej teorii przekładu badający cechy procesu tłumaczenia tekstów różnego typu i wpływów

72 W. W. Sdobnikow, O. W. Pietrowa♦ TEORIA TŁUMACZENIA

Nie na ten proces form mowy i warunki jego realizacji. Istnieje kilka specjalnych teorii przekładu: teoria przekładu literackiego, teoria przekładu naukowego i technicznego, teoria przekładu ustnego, teoria przekładu maszynowego itp.

Prywatna teoria przekładu- dział lingwistycznej teorii przekładu, który bada językowe aspekty przekładu z jednego języka na inny dany język. Istnieje wiele prywatnych teorii przekładu: teoria przekładu z angielskiego na rosyjski, teoria przekładu z niemieckiego na japoński, teoria przekładu z francuskiego na suahili itp.

ZWIĄZEK TEORII TŁUMACZENIA Z INNYMI DZIEDZINAMI JĘZYKOWYMI

Językoznawcza teoria przekładu jest ściśle związana z takimi dyscyplinami językoznawczymi jak językoznawstwo kontrastywne, socjolingwistyka, psycholingwistyka, językoznawstwo tekstu.

Teoria przekładu i lingwistyka kontrastywna

Językoznawstwo kontrastywne to kierunek badań w językoznawstwie ogólnym, którego celem jest badanie porównawcze dwóch, rzadziej kilku języków w celu zidentyfikowania ich podobieństw i różnic na wszystkich poziomach struktury językowej 102. Jak zauważa A.D. Schweitzer, kwestia związku między lingwistyką kontrastywną a teorią przekładu nadal jest przedmiotem kontrowersji. W przeszłości często nie było wyraźnego rozróżnienia

102 Lingwistyczny słownik encyklopedyczny. M: Sowy. encyklopedia, 1990. S.239.

. Teoria przekładu jako dyscyplina naukowa 73

Wydanie tych dyscyplin. JI Retsker napisał w 1950 roku, że „tłumaczenie… jest nie do pomyślenia bez solidnej podstawy językowej. Taką podstawą powinno być studium porównawcze zjawisk językowych oraz ustalenie pewnych zbieżności między językiem oryginalnym a językiem docelowym. Te korespondencje z zakresu słownictwa, frazeologii, składni i stylu powinny stanowić językową podstawę teorii przekładu” 103 . Tak więc porównanie języków i zjawisk językowych zostało faktycznie utożsamione z lingwistyczną teorią przekładu.

Niekiedy teorię przekładu utożsamia się nie z lingwistyką kontrastywną w ogóle, ale z jednym z jej działów, a mianowicie ze stylistyką porównawczą. Tradycję tę zapoczątkowała praca J.-P. Vine'a i J. Darbelneta „Stylistyka porównawcza języka francuskiego i angielskiego” (1958), w której autorzy faktycznie stawiają znak równości między pojęciami stylistyki porównawczej a teorią przekładu. I.I Revzin i V.Yu Rozentsveig zwrócili później uwagę na tę cechę przekładoznawstwa lingwistycznego: „Uznając wartość dzieł tego kierunku dla teorii przekładu, ... jednocześnie nie można nie zauważyć zamieszania w nich koncepcji stylistyki i teorii przekładu” 104 . A jednak, nawet dekadę później, niektórzy badacze argumentowali, że „językowa teoria przekładu to nic innego jak „porównawcza lingwistyka tekstu”, czyli studium porównawcze identycznych semantycznie tekstów wielojęzycznych” 105 .

Już sam opis metody wskazuje na ścisły związek między lingwistyką kontrastywną a teorią przekładu.

103 Szwejcer n.e. M:
Nauka, 1988. S.Yu.

104 R e v z i n I. I., Ro zents v e g V. Yu. Podstawy ogólne i maszynowe
tłumaczenie. M.\ Wyższy szkoła, 1964. S.32.

105 B a r k hu d a r o v L. S. Język i tłumaczenie (kwestie ogólne i prywatne)
teoria tłumaczeń). M.: Międzynarodowy stosunki, 1975. S.28.

74 W. W. Sdobnikow, O. W. Pietrowa♦ TEORIA TŁUMACZENIA

Porównawcze badanie języków. Zasady opisu porównawczego sformułował A.V. Fiodorow w następujący sposób: „To, co jest specyficzne dla danego języka, to nie wyrażone znaczenie, które jest wspólne dla innego języka, ale kategorie formalne, w których jest wyrażane, cechy strukturalne. Z kategorii formalnej, jak z danego celu (np. z określonego typu słów, modeli słowotwórczych, z szyku wyrazów, z dwuczęściowych zdań o określonym rodzaju przedmiotu itp.), badacz przechodzi do określić jego znaczenia w jednym języku, a następnie tym, którzy te znaczenia wyrażają, do środków formalnych innego języka (słowa zbieżne lub innego rodzaju, ten sam lub inny szyk wyrazów, zdania dwuczęściowe lub jednoczęściowe itp.). Oczywiście przy takim sposobie analizy materiał przekładów jest bardzo wdzięczny...” 106 . Z tej definicji metody badawczej wynika, że językoznawcy, w interesie komparatystycznego badania języków, posługiwali się metodą porównywania poszczególnych utworów mowy w różnych językach, które w rzeczywistości są oryginałami i tłumaczeniami. Jest to w pełni zgodne ze stwierdzeniem E. Koseriu, że lingwistyka kontrastywna na poziomie normy językowej, badająca faktyczne użycie jednostek funkcjonalnych, obejmuje dokładnie ten obszar, w którym odbywa się proces tłumaczenia i jest z nim zbieżny. Teorii przekładu, zdaniem E.Koseriu, najbliższy jest obszar językoznawstwa kontrastywnego, który koncentruje się na języku w działaniu. Podobnie jak teoria przekładu, obszar ten zajmuje się realizacjami mowy struktury języka, obszarem funkcjonowania języka w mowie i podobnie jak prywatna teoria przekładu jest jednokierunkowy (np. problem odkrycie

106 op. autor: RevzinI. I., Rosenzweig, V. YU. Podstawy tłumaczenia ogólnego i maszynowego. M.: Wyższe. szkoła., 1964. P.33

CZĘŚĆ //. Teoria przekład jako dyscyplina naukowa 75

Korespondencja z rzeczownikami odsłownymi ma znaczenie tylko w przypadku przekładu z języka rosyjskiego i językoznawstwa kontrastywnego, którego oryginalnym językiem jest rosyjski) 107 .

Dane językoznawstwa kontrastywnego są niewątpliwie przydatne dla językoznawczej teorii przekładu. Językoznawstwo kontrastywne, badając relacje między jednostkami funkcjonalnymi języka A i języka B, tworzy niezbędne podstawy do budowy teorii przekładu. Rzeczywiście, wiele przekształceń tłumaczeniowych, które składają się na „technologię” tłumaczenia, ostatecznie wraca do funkcjonalnych i strukturalnych różnic między językami, które „zderzają się” ze sobą w procesie tłumaczenia. Językoznawstwo kontrastywne w wielu przypadkach odpowiada na pytanie, dlaczego ta czy inna operacja jest wykonywana w tłumaczeniu 107 . Jednym z powodów stosowania przekształceń translacyjnych jest obecność w jednym z języków oddziałujących tak zwanych „form nierównoważnych”, których identyfikację ułatwiają dane językoznawstwa kontrastywnego.

Można powiedzieć, że teoria przekładu potrzebuje lingwistyki kontrastywnej jako źródła danych wyjściowych. Dane te, które rzucają światło na rozbieżności między typami strukturalnymi, systemami i normami językowymi, stanowią punkt wyjścia do właściwej analizy przekładu 108 .

Mimo ścisłego związku między lingwistyką kontrastywną a teorią przekładu nie można ich utożsamiać. Zadaniem językoznawstwa kontrastywnego jest porównywanie języków, identyfikacja ich podobieństw i różnic. Teoria przekładu z kolei bada przekład jako specyficzny rodzaj komunikacji międzyjęzykowej, mediację językową. Jego celem jest ujawnienie istoty, przekładu, jego

107 Szwejcer n.e. Teoria tłumaczenia: status, problemy, aspekty M:
Nauka, 1988. SP.

108 Tamże. C.12.

76 W. W. Sdobnikow, O. W. Pietrowa♦ TEORIA TŁUMACZENIA

Mechanizmy, metody realizacji, czynniki językowe i pozajęzykowe wpływające na to. Teoria przekładu, poza tekstami źródłowymi i docelowymi, uwzględnia socjokulturowe i psychologiczne różnice między komunikantami wielojęzycznymi, a także szereg innych socjokulturowych i psycholingwistycznych uwarunkowań procesu przekładu. Jednocześnie bierze się pod uwagę, że przekład nie jest prostą zmianą kodu językowego, ale także przystosowaniem tekstu do jego percepcji przez pryzmat innej kultury.

Jak działa program tłumacza?

Opiera się na algorytmie tłumaczenia - sekwencji jednoznacznie i ściśle określonych działań na tekście w celu znalezienia dopasowań w danej parze języków L1 - L2 dla danego kierunku tłumaczenia (z jednego konkretnego języka na drugi). Zwykłe słowniki i gramatyki różnych języków nie mają zastosowania do tłumaczenia maszynowego, ponieważ opisują znaczenia słów i wzorców gramatycznych w formie nieścisłej, co w żaden sposób nie jest dopuszczalne do użytku „maszynowego”. Dlatego potrzebna jest formalna gramatyka języka, tj. logicznie spójne i jasno wyrażone (bez żadnych dorozumianych i pominięć). Gdy tylko zaczęły pojawiać się formalne opisy różnych dziedzin języka – przede wszystkim morfologii i składni – nastąpił postęp w rozwoju systemów tłumaczenia automatycznego. Aby system tłumaczenia maszynowego działał skutecznie, po pierwsze, słowniki dwujęzyczne zaopatrzone w niezbędne informacje (morfologiczne, dotyczące form wyrazowych, składniowe, opisujące sposób łączenia słów w zdanie oraz semantyczne, czyli odpowiedzialne za znaczenie) oraz po drugie, środki analizy gramatycznej, które opierają się na jednym z formalnych, tj. ścisłe, gramatyka. Najbardziej powszechna jest następująca sekwencja operacji formalnych, które zapewniają analizę i syntezę w systemie tłumaczenia maszynowego.

1. W pierwszym etapie wprowadza się tekst i przeszukuje wejściowe formy wyrazowe (słowa w określonej formie gramatycznej, na przykład celownik w liczbie mnogiej) wraz z towarzyszącą analizą morfologiczną, podczas której przynależność tej formy wyrazowej do ustalony jest pewien leksem (słowo jako jednostka słownikowa). W procesie analizy można również uzyskać z postaci słowa informacje związane z innymi poziomami organizacji systemu językowego, np. jakim elementem zdania może być dane słowo. Dla maszyny połączenie tych dwóch operacji – zarówno analizy gramatycznej, jak i odwoływania się do znaczenia słów – jest trudnym zadaniem. Lepiej jest uniezależnić analizę składniową od znaczenia słów i korzystać ze słownika na innych etapach tłumaczenia.
2. Czym jest niezależna analiza składniowa, możesz zrozumieć, jeśli spróbujesz przeanalizować frazę, z której „usunięto” znaczenia określonych słów. Genialny przykład tego rodzaju frazy ukuł akademik L.V. Sprytna sugestia: błyszcząca kuzdra podskakuje i zwija bokrę. Bezsensowne zdanie? Jakby tak: w języku rosyjskim nie ma słów, z których się składa (poza unią i). A jednak do pewnego stopnia to rozumiemy.
3. Oznacza to, że maszyna dokonuje analizy składniowej zdania bez polegania na znaczeniach słów składowych, wykorzystując jedynie informacje o ich właściwościach gramatycznych. W wyniku analizy składniowej powstaje struktura syntaktyczna, którą przedstawiamy jako drzewo zależności: „korzeń” to orzeczenie, a „gałęzie” to jego relacje syntaktyczne ze słowami zależnymi. Każde słowo w zdaniu jest zapisane w jego słownikowej formie, a wraz z nim wskazane są cechy gramatyczne, jakie ma to słowo w analizowanym zdaniu.
4. 2. Kolejny etap obejmuje tłumaczenie fraz idiomatycznych, jednostek frazeologicznych lub pieczęci z danego obszaru tematycznego (na przykład w tłumaczeniu angielsko-rosyjskim zwroty takie jak w przypadku, zgodnie z otrzymaniem jednego ekwiwalentu cyfrowego i są wyłączone z dalszej analizy gramatycznej); określenie głównych cech gramatycznych (morfologicznych, składniowych, semantycznych i leksykalnych) elementów tekstu wejściowego (na przykład liczby rzeczowników, czasu czasownika, ich roli w tym zdaniu itp.), wytwarzanych w języku wejściowym; ujednoznacznienie (powiedzmy, że angielska runda może być rzeczownikiem, przymiotnikiem, przysłówkiem, czasownikiem lub przyimkiem); analiza i tłumaczenie słów. Zwykle na tym etapie oddziela się wyrazy jednowartościowe od wieloznacznikowych (mających więcej niż jeden odpowiednik tłumaczeniowy w języku docelowym), po czym wyrazy jednowartościowe są tłumaczone według list odpowiedników i stosuje się tzw. słowniki kontekstologiczne do tłumaczenia słów polisemantycznych, których wpisy w słowniku są algorytmami do odpytywania kontekstu w obecności/braku wyznaczników wartości kontekstu.
5. 3. Końcowa analiza gramatyczna, podczas której dodatkowo określane są niezbędne informacje gramatyczne z uwzględnieniem danych języka wyjściowego.
6. 4. Synteza wyjściowych form wyrazowych i zdań w języku docelowym. Tutaj nie będzie możliwe proste tłumaczenie „węzłów” drzewa na inny język. Składnia każdego języka jest ułożona na swój sposób: to, co jest podmiotem w zdaniu rosyjskim, może (lub powinno) być wyrażone przez dopełnienie w innym języku, a dopełnienie, przeciwnie, musi zostać przekształcone w podmiot; to, co w jednym języku oznacza grupa słów, jest tłumaczone na inny tylko jednym słowem i tak dalej. To przejście od struktury do zdania rzeczywistego nazywamy syntezą syntaktyczną.
7. W zależności od cech morfologii, składni i semantyki danej pary językowej, a także kierunku tłumaczenia, ogólny algorytm tłumaczenia może obejmować inne etapy, a także modyfikacje tych etapów lub ich kolejności, ale wariacje tego rodzaju w nowoczesnych systemach są zwykle nieistotne. Analiza kontekstu służy do rozwiązania problemu niejednoznaczności wyrazów. Faktem jest, że każde z kilku znaczeń słowa polisemantycznego w większości przypadków jest realizowane we własnym zestawie kontekstów. Oznacza to, że każde z „konkurujących” (poddawanych interpretacji) znaczeń ma swój własny zestaw kontekstów. I to właśnie ta zależność znaczenia od otoczenia pozwala słuchaczowi poprawnie zrozumieć wypowiedź. Dla poprawnego rozumienia wypowiedzi konieczne jest również pełne uwzględnienie reguł warunkowości wybranego znaczenia przez środowisko leksykalne (operujących w „frazeologicznej” interpretacji tego słowa), reguł warunkowości znaczenie wybrane przez kontekst semantyczny (tzw. prawa zgodności semantycznej) oraz zasady warunkowości wybranego znaczenia przez kontekst gramatyczny (morfologiczno-syntaktyczny).
8. Istniejące systemy tłumaczenia maszynowego mają tendencję do ukierunkowania się na określone pary językowe (na przykład francuski i rosyjski lub japoński i angielski) i mają tendencję do wykorzystywania dopasowań tłumaczeniowych albo na poziomie powierzchownym, albo na pewnym poziomie pośrednim między językami wejściowymi i wyjściowymi. Jakość tłumaczenia maszynowego zależy od objętości słownika, ilości informacji przypisanych do jednostek leksykalnych, od dokładności kompilowania i sprawdzania działania algorytmów analizy i syntezy oraz od efektywności oprogramowania. Nowoczesny sprzęt i oprogramowanie pozwalają na korzystanie z dużych słowników zawierających szczegółowe informacje gramatyczne. Informacje mogą być prezentowane zarówno w formie deklaratywnej (opisowej), jak i proceduralnej (z uwzględnieniem potrzeb algorytmu).
9. W praktyce tłumaczeniowej iw technologii informacyjnej istnieją dwa główne podejścia do tłumaczenia maszynowego. Z jednej strony wyniki tłumaczenia maszynowego można wykorzystać do powierzchownego zapoznania się z treścią dokumentu w nieznanym języku. W takim przypadku może służyć jako informacja o sygnale i nie wymaga starannej edycji. Inne podejście polega na użyciu tłumaczenia maszynowego zamiast zwykłego „ludzkiego”. Wiąże się to ze staranną edycją i dostosowaniem systemu tłumaczeniowego do konkretnego obszaru tematycznego. Istotną rolę odgrywa tu kompletność słownika, skupienie się na treści i zestawie środków językowych tłumaczonych tekstów, efektywność metod rozwiązywania polisemii leksykalnej, efektywność algorytmów wydobywania informacji gramatycznych, znajdowania odpowiedników tłumaczeniowych i algorytmów syntezy. W praktyce tłumaczenie tego typu staje się opłacalne ekonomicznie, jeśli objętość tłumaczonych tekstów jest wystarczająco duża (co najmniej kilkadziesiąt tysięcy stron rocznie), jeśli teksty są wystarczająco jednorodne, słowniki systemowe są kompletne i pozwalają na dalszą rozbudowę, a oprogramowanie jest wygodne do późniejszej edycji.

Wstęp

Tłumaczenie maszynowe- proces tłumaczenia tekstów (pisemnych i najlepiej ustnych) z jednego języka naturalnego na inny przy użyciu specjalnego programu komputerowego. Nazywany jest także kierunek badań naukowych związanych z budową takich systemów.

Zamiast „maszyna” czasami używa się słowa „automat”, co nie wpływa na znaczenie. Nie należy jednak mylić tłumaczenia maszynowego z automatycznym, ma ono zupełnie inne znaczenie - dzięki niemu program po prostu pomaga człowiekowi tłumaczyć teksty.

Pomysł wykorzystania komputerów elektronicznych (komputerów) do tłumaczenia powstał w 1947 roku w Stanach Zjednoczonych, zaraz po pojawieniu się pierwszych komputerów. Pierwsza publiczna demonstracja tłumaczenia maszynowego miała miejsce w 1954 roku. Pomimo prymitywności tego systemu, ten eksperyment spotkał się z szerokim odzewem.

W połowie lat sześćdziesiątych w Stanach Zjednoczonych udostępniono do praktycznego użytku dwa systemy tłumaczenia rosyjsko-angielskiego:

ZNAK
GAT

Powołana do oceny takich systemów komisja ALPAC doszła jednak do wniosku, że ze względu na słabą jakość tłumaczonych maszynowo tekstów działalność ta jest w USA nieopłacalna. Chociaż komisja zalecała kontynuowanie i pogłębianie prac teoretycznych, generalnie jej wnioski doprowadziły do wzrostu pesymizmu, spadku finansowania, a często do całkowitego zaprzestania prac nad tym tematem.

Niemniej jednak badania były kontynuowane w wielu krajach, wspomagane ciągłym postępem w technologii komputerowej. Szczególnie istotnym czynnikiem było pojawienie się minikomputerów i komputerów osobistych, a wraz z nimi coraz bardziej skomplikowanych systemów słownikowych i wyszukiwarek nastawionych na pracę z danymi w języku naturalnym. Zapotrzebowanie na tłumaczenie jako takie rosło również ze względu na rozwój stosunków międzynarodowych. Wszystko to doprowadziło do nowego wzrostu w tym obszarze. Nadszedł czas na powszechne praktyczne wykorzystanie systemów tłumaczeniowych i pojawił się rynek dla rozwiązań komercyjnych w tym zakresie.

Jednak wysokiej jakości tłumaczenie tekstów o szerokiej tematyce jest wciąż nieosiągalne. Jednak przyspieszenie pracy tłumacza przy wykorzystaniu systemów tłumaczenia maszynowego jest niewątpliwe.

1. Główny korpus

Systemy tłumaczenia maszynowego dzielą się na trzy kategorie:

-systemy oparte na regułach gramatycznych(tłumaczenie maszynowe oparte na regułach, RBMT),
-systemy statystyczne(statystyczne tłumaczenie maszynowe, SMT)
-systemy hybrydowe połączenie zalet obu (są najbardziej obiecujące)

Tłumaczenie maszynowe oparte na regułach- ogólny termin odnoszący się do systemów tłumaczenia maszynowego opartych na informacjach językowych o języku źródłowym i docelowym. Składają się z dwujęzycznych słowników i gramatyk, obejmujących główne wzorce semantyczne, morfologiczne i składniowe każdego języka. Takie podejście do tłumaczenia maszynowego jest również nazywane klasyczny. Na podstawie tych danych tekst źródłowy jest sekwencyjnie, według zdań, konwertowany na przetłumaczony tekst. Zasada działania takich systemów polega na powiązaniu struktury zdań wejściowych i wyjściowych. komputerowe tłumaczenie maszynowe

Systemy RBMT dzielą się na trzy grupy:

systemy tłumaczenia słowo w słowo;
Systemy transferowe (Transfer) - przekształcają struktury języka wejściowego na struktury gramatyczne języka wyjściowego;
Systemy interlingwistyczne (Interlingua) - język pośredni do opisu znaczeń.

Główną zaletą systemów opartych na transferze jest wysoka kompletność pokrycia tekstu przy akceptowalnym poziomie jakości tłumaczenia, a także niskie koszty pierwotnego opracowania i modernizacji.

Składniki typowego RBMT:

· Bazy językowe: - słowniki dwujęzyczne; - pliki nazwisk, transliteracja; - tablice morfologiczne.
· Moduł tłumaczeniowy: - zasady gramatyczne; - algorytmy translacji.
· Zalety systemów RBMT:
- - dokładność składniowa i morfologiczna;
- - stabilność i przewidywalność wyniku;
- - możliwość dostosowania obszaru tematycznego.
· Wady systemów RBMT:
- pracochłonność i czas trwania rozwoju;
- konieczność utrzymywania i aktualizacji baz językowych;
- "akcent maszynowy" podczas tłumaczenia.

Statystyczne tłumaczenie maszynowe- rodzaj tłumaczenia maszynowego, gdzie tłumaczenie generowane jest na podstawie modeli statystycznych, których parametry wyprowadzane są z analizy dwujęzycznych korpusów tekstowych (korpusów tekstowych).

Statystyczne tłumaczenie maszynowe kontrastuje z systemami tłumaczenia maszynowego opartego na regułach (RBMT) i MT opartym na przykładach (EBMT).

Pierwsze pomysły na statystyczne tłumaczenie maszynowe zostały opublikowane przez Warrena Weavera w 1949 roku. „Druga fala” – początek lat 90., IBM. „Trzecia fala” - Google, Microsoft, Language Weaver, Yandex.

Statystyczne modele tłumaczeń:

według słów (tłumaczenie Word-based - WBT)
frazami (Tłumaczenie frazowe - PBT)
składnia (tłumaczenie oparte na składni - SBT)
Hierarchiczne tłumaczenie fraz - HPBT

Zalety SMT:

·Szybki montaż
· Łatwe dodawanie nowych wskazówek dotyczących tłumaczenia
Płynność tłumaczenia

Wady SMT:

„Niedobór” przypadków równoległych
Liczne błędy gramatyczne
Niestabilność tłumaczenia

Aby poprawić jakość, twórcy systemów tłumaczenia maszynowego wprowadzają pewne „przekrojowe” zasady, zmieniając w ten sposób systemy czysto statystyczne w Hybrydowe tłumaczenie maszynowe. Dodanie pewnych reguł, czyli tworzenie systemów hybrydowych, nieco poprawia jakość tłumaczeń, zwłaszcza gdy ilość danych wejściowych wykorzystanych do zbudowania indeksu translatora maszynowego jest niewystarczająca.

Hybrydowe tłumaczenie maszynowe- integracja różnych podejść tłumaczenia maszynowego z możliwych wariantów MT:

· Tłumaczenie maszynowe oparte na regułach (RBMT) - Tłumaczenie maszynowe oparte na regułach.
· Tłumaczenie maszynowe korpusowe (CBMT) - Tłumaczenie maszynowe korpusów tekstowych.
· Tłumaczenie maszynowe oparte na przykładach (EBMT)
· Statystyczne tłumaczenie maszynowe (SMT) - Statystyczne tłumaczenie maszynowe.

Oczekuje się, że architektura hybrydowa połączy zalety tych podejść.

Hybrydowa technologia tłumaczeń polega na wykorzystaniu metod statystycznych do automatycznego budowania baz słownikowych w oparciu o korpusy równoległe, generowania kilku możliwych tłumaczeń, zarówno na poziomie leksykalnym, jak i na poziomie struktury składniowej zdania w języku docelowym, stosowania postedycji w trybie automatycznym i wybrać najlepsze (najbardziej prawdopodobne) tłumaczenie tłumaczenia z możliwych na podstawie modelu językowego zbudowanego na określonym korpusie języka docelowego.

Statistical MT stara się wykorzystywać dane językowe, podczas gdy systemy z „klasycznym” podejściem opartym na regułach stosują metody statystyczne. Dodanie pewnych reguł „end-to-end”, czyli tworzenie systemów hybrydowych, nieco poprawia jakość tłumaczeń, zwłaszcza gdy ilość danych wejściowych wykorzystywanych do budowy plików indeksowych do przechowywania informacji językowych maszyny translator oparty na N-gramach jest niewystarczający.

Architektura technologii hybrydowej „SMT i RBMT”[

Uzupełnieniem systemu RBMT są dwa komponenty: statystyczny moduł postedycyjny oraz moduł modelu językowego. Statystyczna postedycja pozwala na płynne tłumaczenie RB, zbliżając je do języka naturalnego, przy jednoczesnym zachowaniu przejrzystej struktury syntetyzowanego tekstu. Modele językowe służą do oceny płynności i poprawności gramatycznej tłumaczeń generowanych przez system hybrydowy.

Typowa architektura HMT:

· Przypadek równoległy;
· Edukacja;
· Model językowy;
· Dane do postedycji;
· Zasady syntezy;
· Słowniczek terminologii.

Korzyści z tłumaczenia hybrydowego:

· Szybka automatyczna korekta na podstawie pamięci tłumaczeń klienta;
· Dokładność terminologiczna przekładu, a także jedność stylu;
· Pozyskiwanie dodatkowych przydatnych danych - dwujęzyczny słownik terminologiczny.

Wniosek

Główną zaletą tłumaczenia maszynowego jest to, że pozwala szybko poradzić sobie z bardzo dużymi objętościami tekstu i dlatego czasami okazuje się bardziej opłacalne niż tłumaczenie ręczne. Jednocześnie należy pamiętać, że jakość tłumaczenia maszynowego zawsze będzie gorsza od tłumaczenia wykonanego przez człowieka. Dlatego wskazane jest używanie go tylko w niektórych przypadkach.

Wiele rodzajów materiałów w zasadzie nie jest przeznaczonych do tłumaczenia maszynowego. Tym samym tekstów nie można powierzać maszynie, gdzie niedokładność tłumaczenia może zagrażać zdrowiu ludzkiemu, wykonaniu skomplikowanego urządzenia lub dużej umowie - zaoszczędzony tutaj czas nie usprawiedliwia ryzyka. Wszelkie dokumenty, które sugerują odpowiedzialność prawną, wymagają kontroli człowieka. Tłumaczenie maszynowe nie nadaje się do materiałów marketingowych, w których tekst jest właściwie przemyślany w nowym kontekście kulturowym i stworzony na nowo.

Przy tłumaczeniu tekstów technicznych ściśle sformalizowanych można oczekiwać akceptowalnej jakości, natomiast teksty literackie i reklamowe nie nadają się do tłumaczenia maszynowego.

W przypadku tłumaczenia maszynowego ważne jest nie tylko jasne wyobrażenie sobie pożądanego rezultatu i zrozumienie ograniczeń tej metody, ale także uwzględnienie jeszcze jednego czynnika. Systemy MT wymagają zwykle skomplikowanego indywidualnego dostrojenia i dopracowania, w tym „przeszkolenia” z określonego tematu – bez tego wykazują znacznie gorsze wyniki. W związku z tym korzystanie z tłumaczenia maszynowego ma sens tylko wtedy, gdy trzeba przetłumaczyć ogromne tomy tekstów tego samego rodzaju. W takim przypadku ekonomicznie opłacalne będzie poświęcenie trochę czasu na przeszkolenie systemu, a następnie zastosowanie tłumaczenia maszynowego i uzyskanie tekstu nadającego się do dalszej edycji jako wydruku. Jeśli mówimy o kilkudziesięciu stronach, próba wdrożenia tłumaczenia maszynowego jest bezcelowa i po prostu nieopłacalna.

Dlatego tłumaczenie maszynowe z postedycją może być naprawdę korzystne, jeśli teksty odpowiedniego typu są tłumaczone w bardzo dużych ilościach. Ponieważ duże wolumeny tłumaczeń przechodzą przez firmy tłumaczeniowe, które często specjalizują się w określonych obszarach tematycznych, wprowadzenie dość skutecznych, ale drogich systemów tłumaczenia maszynowego najnowszej generacji jest w takich firmach ekonomicznie uzasadnione: ani dostawców treści, nawet dużych, ani indywidualnych tłumacze będą mogli efektywnie korzystać z tłumaczenia maszynowego.

Używane książki

1. http://www.logrus.ru
2. http://www.moluch.ru/
3. https://www.academia.edu
4. http://study-english.info/

Tłumaczenie maszynowe, a właściwie tłumaczenie komputerowe, jest również tłumaczeniem pisemnym, ponieważ w efekcie otrzymujemy tekst pisany. Nie jest to jednak realizowane przez tłumacza, ale przez specjalny program komputerowy. Współczesne programy do tłumaczenia komputerowego są dość zaawansowane, ale wciąż nie są w stanie rozwiązać najtrudniejszego zadania procesu tłumaczenia: wyboru kontekstowo niezbędnej opcji, co w każdym tekście wynika z wielu powodów. Obecnie wynik tego typu tłumaczenia może być wykorzystany jako wstępna wersja przyszłego tekstu, który zostanie zredagowany przez tłumacza, a także jako środek do uzyskania ogólnego wyobrażenia tematu i treści tekstu chociażby w skrajnej sytuacji nieobecności tłumacza.

Jeszcze trudniejszym zadaniem jest tłumaczenie tekstu ustnego za pomocą programów komputerowych, gdyż problem rozpoznawania mowy ustnej jest dopiero na początkowym etapie jego rozwiązania. Do tej pory przeszkodą nie do pokonania jest indywidualne zabarwienie dźwięku segmentu mowy - w każdym języku taka mowa jest słabo sformalizowana.

Wstępna edycja struktury składniowej może być:

· rozbicie bardzo długiego zdania (powyżej 40 słów) na kilka krótszych, z jednoczesnym dodaniem (w razie potrzeby) elementów łączących;

· wprowadzanie artykułów do tekstu angielskiego tam, gdzie jest to konieczne lub gramatycznie uzasadnione;

· powtarzanie elementów w koordynacyjnym połączeniu fraz w zdaniu;

· wprowadzenie związków przy użyciu sojuszniczego połączenia między zdaniami;

· eliminacja struktur w nawiasach w środku frazy rzeczownikowej lub w środku zdania;

· zastąpienie okazjonalnych skrótów pełnymi imionami lub wprowadzenie znaków specjalnych, które nie pozwalają na ich tłumaczenie;

· eliminacja leksykalnych i logicznych elips, nieformalnych konstrukcji i metafor;

· sprowadzanie do jednej formy konstrukcji lub słów złożonych, które można znaleźć w tekście w pisowni ciągłej, z łącznikami i wolnej pisowni.

Ręcznie edytowany tekst jest następnie automatycznie przetwarzany w systemie MP.

25. Ogólny schemat tłumaczenia maszynowego.

Na całym świecie korzystanie z systemów tłumaczenia maszynowego, pomimo wszystkich ich słabości, od dawna jest elementem profesjonalnej pracy tłumacza, który musi umieć posługiwać się komputerem nie tylko jako maszyną do pisania. Pojęcie stacji roboczej tłumacza, na którą składa się zespół słowników rezydentnych, tezaurusy, systemy sprawdzania pisowni, systemy dostępu do informacji w różnych sieciach transmisji danych, powinno stać się powszechne dla specjalisty filologa.

W ramach stanowiska takiego tłumacza można zastosować system tłumaczenia maszynowego (MT) tekstów, zapewniając jednocześnie wysokiej jakości tłumaczenie, które jest ściśle skoncentrowane na określonej tematyce, zadaniach użytkownika i rodzaju dokumentacji. Ponadto taki system może bardzo szybko i niskim kosztem pomóc użytkownikowi nieznającemu języka obcego uzyskać przybliżone (zgrubne) tłumaczenie tekstów z interesującej go dziedziny wiedzy, tłumaczenie wystarczające do zrozumienia informacji przekazywane za pomocą tekstu w języku obcym.

Ogólne wymagania dotyczące praktycznych systemów

tłumaczenie maszynowe (MT)

· Stabilność systemu. System MT powinien dawać wynik, który można zastosować nawet w przypadku wad materiału źródłowego i niepełnego słownictwa.

· Replikalność systemu. System powinien posiadać dość proste oprogramowanie i narzędzia językowe, aby rozszerzyć zakres jego zastosowania.

· Możliwość dostosowania systemu. System MP powinien mieć możliwość dostosowania do potrzeb konkretnych użytkowników i cech przetwarzanych dokumentów.

· Optymalność czasu. Szybkość tłumaczenia tekstów musi odpowiadać albo ilości informacji otrzymywanych w jednostce czasu, albo normom pracy użytkowników.

· Komfort użytkowania. Narzędzia serwisowe systemu powinny zapewnić wygodę użytkownika we wszystkich możliwych trybach pracy w systemie.

Pracując z konkretnym systemem tłumaczenia maszynowego należy pamiętać, że tłumaczenie odbywa się na kilku podrzędnych poziomach wdrożenia systemu.

Te poziomy zazwyczaj obejmują:

· poziom automatycznej wstępnej edycji tekstu;

· poziom analizy leksykalnej i morfologicznej;

· poziom analizy kontekstowej i analizy grupowej;

· poziom analizy segmentów funkcjonalnych;

· poziom analizy propozycji;

· poziom syntezy tekstu wyjściowego;

· automatyczny poziom postedycji.

Podejścia do tłumaczenia maszynowego

Systemy tłumaczenia maszynowego mogą wykorzystywać metodę tłumaczenia opartą na regułach językowych. Najbardziej odpowiednie słowa z języka źródłowego są po prostu zastępowane słowami z języka docelowego.

Często mówi się, że aby skutecznie rozwiązać problem tłumaczenia maszynowego, konieczne jest rozwiązanie problemu rozumienia tekstu w języku naturalnym.

Z reguły metoda tłumaczenia regułowego wykorzystuje reprezentację symboliczną (pośrednik), na podstawie której tworzony jest tekst w języku docelowym. A jeśli weźmiemy pod uwagę charakter pośrednika, to możemy mówić o międzyjęzykowym tłumaczeniu maszynowym lub transferowym tłumaczeniu maszynowym. Metody te wymagają bardzo dużych słowników z informacjami morfologicznymi, składniowymi i semantycznymi oraz dużym zestawem reguł.

Jeśli system tłumaczenia maszynowego posiada wystarczającą ilość danych, można uzyskać tłumaczenie dobrej jakości. Główna trudność polega na tworzeniu tych danych. Na przykład duże korpusy tekstowe wymagane do statystycznych metod tłumaczenia nie są wystarczające do tłumaczenia opartego na gramatyce. Co więcej, dla tych ostatnich wymagane jest dodatkowe zadanie gramatyczne.

Do tłumaczenia języków pokrewnych (rosyjski, ukraiński) wystarczy zwykła zamiana słów.

Nowoczesne systemy tłumaczenia maszynowego dzielą się na trzy duże grupy:

oparte na regułach

na podstawie przykładów

Oparte na zasadach SMP

Systemy tłumaczenia maszynowego oparte na regułach to ogólny termin odnoszący się do systemów tłumaczenia maszynowego opartych na informacjach językowych o języku źródłowym i docelowym.

Składają się z dwujęzycznych słowników i gramatyk, obejmujących główne wzorce semantyczne, morfologiczne i składniowe każdego języka. Takie podejście do tłumaczenia maszynowego nazywane jest również klasycznym.

Na podstawie tych danych tekst źródłowy jest sekwencyjnie, według zdań, konwertowany na przetłumaczony tekst. Często takie systemy są porównywane z systemami tłumaczenia maszynowego, które są oparte na przykładach.

Zasada działania takich systemów polega na powiązaniu struktury zdań wejściowych i wyjściowych. Tłumaczenie nie jest szczególnie dobrej jakości. Ale to działa w przypadku prostych przykładów.

Tłumaczenie z angielskiego na niemiecki będzie wyglądać tak:

Dziewczyna zjada jabłko. Ein Madchen isst einen Apfel.

Systemy te dzielą się na trzy grupy:

systemy tłumaczenia słowo w słowo;

· systemy transferowe;

interlingwistyka;

Tłumaczenie słów

Takie systemy są obecnie używane niezwykle rzadko ze względu na słabą jakość tłumaczenia. Słowa tekstu źródłowego są konwertowane (tak jak jest) na słowa tekstu przetłumaczonego. Często taka transformacja zachodzi bez lematyzacji i analizy morfologicznej. To najprostsza metoda tłumaczenia maszynowego. Służy do tłumaczenia długich list słów (np. katalogów). Może być również używany do komponowania interlinii dla systemów TM.

Systemy transferowe

Jak systemy transferowe i interlingwistyczni mają tę samą ogólną ideę. Do tłumaczenia konieczny jest pośrednik, który niesie znaczenie przetłumaczonego wyrażenia. W systemach interlingwistycznych mediator nie jest zależny od pary języków, podczas gdy w systemach transferowych tak.

Systemy transferu działają na bardzo prostej zasadzie: do tekstu wejściowego stosowane są reguły, które odpowiadają strukturom języka źródłowego i docelowego. Początkowy etap pracy obejmuje analizę morfologiczną, składniową (a czasem semantyczną) tekstu w celu stworzenia reprezentacji wewnętrznej. Tłumaczenie jest generowane z tej reprezentacji przy użyciu dwujęzycznych słowników i reguł gramatycznych. Niekiedy w oparciu o reprezentację pierwotną, którą uzyskano z tekstu źródłowego, budowana jest bardziej „abstrakcyjna” reprezentacja wewnętrzna. Odbywa się to w celu podkreślenia miejsc ważnych dla tłumaczenia i odrzucenia nieistotnych części tekstu. Podczas konstruowania tekstu tłumaczenia przekształcenie poziomów reprezentacji wewnętrznych następuje w odwrotnej kolejności.

Stosując tę strategię, uzyskuje się dość wysoką jakość tłumaczeń, z dokładnością około 90% (choć jest to w dużym stopniu zależne od pary językowej). Działanie dowolnego systemu przesyłowego składa się z co najmniej pięciu części:

analiza morfologiczna;

transfer leksykalny;

transfer strukturalny;

pokolenie morfologiczne.

Analiza morfologiczna. Słowa tekstu źródłowego są klasyfikowane według części mowy. Ujawniają się ich cechy morfologiczne. Lematy słowne są zdefiniowane.

Kategoryzacje leksykalne. W każdym tekście niektóre słowa mogą mieć więcej niż jedno znaczenie, co powoduje niejednoznaczność analizy. Kategoryzacja leksykalna ujawnia kontekst słowa. Możliwe są różne uwagi i wyjaśnienia.

Przeniesienie leksykalne. Na podstawie dwujęzycznego słownika tłumaczone są lematy słów. Akcja jest bardzo podobna do tłumaczenia słowo w słowo.

transfer strukturalny. Słowa zgadzają się w zdaniu.

Pokolenie morfologiczne. Na podstawie danych wyjściowych przelewu strukturalnego tworzone są formy słowne przetłumaczonego tekstu.

Jedną z głównych cech transcendentnych systemów tłumaczenia maszynowego jest etap, w którym pośrednia reprezentacja tekstu w języku źródłowym zostaje „przeniesiona” na pośrednią reprezentację tekstu w języku docelowym. Może to działać na jednym z dwóch poziomów analizy językowej lub na obu.

1. Transfer powierzchniowy (syntaktyczny). Poziom ten charakteryzuje się przenoszeniem „struktur składniowych” między językiem źródłowym a docelowym. Nadaje się do języków z tej samej rodziny lub tego samego typu, takich jak języki romańskie, między włoskim hiszpańskim, katalońskim, francuskim itp.

2. Przeniesienie głębokie (semantyczne). Poziom charakteryzuje się reprezentacją semantyczną. To zależy od oryginalnego języka. Ta reprezentacja może składać się z wielu struktur reprezentujących wartość. Tłumaczenie również zwykle wymaga przeniesienia strukturalnego. Ten poziom jest używany do tłumaczenia między bardziej odległymi językami.

Interlingwistyczne tłumaczenie maszynowe

Interlingwistyczne tłumaczenie maszynowe to jedno z klasycznych podejść do tłumaczenia maszynowego. oryginał tekst jest przekształcany w abstrakcyjną reprezentację, która jest niezależna od języka (w przeciwieństwie do tłumaczenia transferowego). Przetłumaczony tekst jest generowany na podstawie tej reprezentacji. Główną zaletą tego podejścia jest dodanie do systemu nowego języka. Można udowodnić matematycznie, że w ramach tego podejścia stworzenie każdego nowego tłumacza dla takiego systemu obniży jego koszt w porównaniu np. z transferowym systemem tłumaczeniowym. Co więcej, takie podejście może:

· wdrożenie „przekładu tekstu”, parafrazy tekstu źródłowego w ramach jednego języka;

· stosunkowo prosta implementacja tłumaczenia z bardzo różnych języków, takich jak np. rosyjski i arabski.

Jednak nadal nie ma implementacji tego podejścia, które działałyby poprawnie dla co najmniej dwóch języków. Wielu ekspertów wyraża wątpliwości co do możliwości takiego wdrożenia. Największa trudność w tworzeniu takich systemów polega na zaprojektowaniu reprezentacji międzyjęzykowej. Powinna być abstrakcyjna i niezależna od konkretnych języków, ale jednocześnie powinna odzwierciedlać cechy każdego istniejącego języka. Z drugiej strony w ramach sztucznej inteligencji zadanie podkreślenia znaczenia tekstu nie zostało jeszcze rozwiązane.

Podejście interlingwistyczne zostało po raz pierwszy zaproponowane w XVII wieku przez Kartezjusza i Leibniza, którzy zaproponowali uniwersalne słowniki wykorzystujące kody numeryczne. Inni, tacy jak Cave Beck, Athanasius Kircher i Johann Joachim Becher, pracowali nad stworzeniem jednoznacznego uniwersalnego języka opartego na zasadach logiki i ikonografii.

W 1668 r. John Wilkins w swoim traktacie An Essay on Genuine Symbolism and Philosophical Language, mówił o swoim Interlingua.

W XVIII i XIX wieku powstało wiele języków uniwersalnych, w tym esperanto. Wiadomo, że idea uniwersalnego języka do tłumaczenia maszynowego nie przejawiała się w żaden sposób na początkowych etapach rozwoju tej technologii. Zamiast tego brano pod uwagę tylko pary języków. Jednak w latach 50. i 60. badacze w Cambridge pod kierunkiem Margaret Masterman, w Leningradzie pod kierownictwem Nikołaja Andrejewa oraz w Mediolanie Silvio Ceccato rozpoczęli prace w tym obszarze.

W latach 70. i 80. poczyniono pewne postępy w tej dziedzinie i zbudowano szereg systemów tłumaczenia maszynowego.

W tej metodzie tłumaczenia reprezentację międzyjęzykową można traktować jako sposób opisu analizy tekstu w języku oryginalnym. Jednocześnie w przedstawieniu zachowane są cechy morfologiczne, składniowe tekstu. Zakłada się, że w ten sposób można przekazać „sens” przy tworzeniu tłumaczonego tekstu.

W tym przypadku czasami stosuje się dwie reprezentacje międzyjęzykowe. Jeden z nich bardziej odzwierciedla cechy języka źródłowego. Drugi to język docelowy. Tłumaczenie w tym przypadku odbywa się w dwóch etapach.

W niektórych przypadkach używa się dwóch lub więcej reprezentacji tego samego poziomu (równie zbliżonych do obu języków), ale różniących się tematem. Jest to konieczne, aby poprawić jakość tłumaczenia określonych tekstów.

Takie podejście nie jest nowe w językoznawstwie. Opiera się na idei bliskości języków. Aby poprawić jakość tłumaczenia, język naturalny jest używany jako pomost między dwoma innymi językami. Na przykład podczas tłumaczenia z ukraińskiego na angielski czasami używany jest rosyjski.

Aby skorzystać z interlingwistycznego systemu tłumaczenia maszynowego, potrzebujesz:

Słowniki do analizy i generowania tekstów;

opis gramatyk języków;

baza wiedzy pojęć (w celu stworzenia reprezentacji międzyjęzykowej);

· Zasady projekcji pojęć dla języków i reprezentacji.

Najtrudniejszym momentem przy tworzeniu tego typu jest brak możliwości zbudowania bazy dla szerokich obszarów wiedzy. A te bazy danych, które są tworzone dla bardzo konkretnego tematu, mają dużą złożoność obliczeniową.

Powiązane artykuły:

Echinacea na odporność, właściwości, zastosowanie, przeciwwskazania Produkty na depresję Jakie diety są przeznaczone na objawy depresji Co to jest „desu”? A jak rozumieć anime? "kawai desu" - co oznacza ten termin Znaczenie słowa "desu" Gdzie i dlaczego jest używany? Ile wody do picia dziennie: wskazówki i mity Ile wody do picia dziennie

Nowy: