Saltu al enhavo

Maŝintradukado

El Vikipedio, la libera enciklopedio

Maŝintradukadomaŝina tradukado estas procezo de aŭtomata tradukado de unu lingvo al alia pere de komputilo. Ĝi funkcias konvertante tekston, bildojn aŭ filmetojn el fontlingvo kaj produktante la ekvivalenton al la cellingvo[1]. Maŝintradukado daŭre restas nevenkita defio por informadiko, pli specife por ĝia branĉo lingvokomputiko. Hodiaŭ jam haveblas pluraj sistemoj, kies eliro ne estas perfekta, sed estas sufiĉe altkvalita por esti uzata en multaj kampoj, kie ĝi helpas al homaj tradukantoj kiel profesiuloj en la kampo de tradukado, kiuj unue kompletigas la tradukojn uzante maŝintradukadon por akceli la procezon[1]. Tiel la tradukilo Machinetranslation.com ekzemple komprenas, ke ĉiu mesaĝo estas unika kaj tial ĝia tradukilo konsideras la kuntekston kaj nuancojn de la teksto por plibonigi la precizecon de ajna traduko, ebligante la celgrupon de la traduko, ĉu ĝenerala publiko, teknikaj profesiuloj aŭ akademiaj esploristoj[1].

Oni ofte sugestas Esperanton kiel taŭgan ilon por maŝintradukado - aŭ kiel fontolingvo por tradukado en naciajn lingvojn, aŭ kiel pontolingvo, pere de kiu oni tradukas tekstojn de unu nacia lingvo al alia. Projektoj prilaborantaj kaj utiligantaj tiujn ĉi trajton de Esperanto estas ekzemple Distribuita Lingvo-Tradukado (DLT), aŭ la pli nova UNIKOM.

Pravizio de la homaro

[redakti | redakti fonton]

Kompreni fremdan lingvon sen lerni ĝin — tio estas malnova revo. La invento de la komputilo en kombino kun la studo de la fenomeno de lingvo kiel scienca disciplino malfermis je la unua fojo konkretan vojon plenumi tiun vizion.

Ĉefaj okazintaĵoj en historio de maŝintradukado

[redakti | redakti fonton]
  • Jaro 1932: Georges Artsrouni konstruis maŝintradukilon por kiu li ricevis patenton en Francio en 1933.
  • Jaro 1933: Smirnov-Trojanski de Rusio faris projekton pri tradukmaŝino, sed ĝi neniam estis konstruata.
  • Jaro 1946: Warren-Weaver kaj Andrew D. Boothe, en Usono, kune kun R. H. Richens, de Anglujo, komencis seriozajn klopodojn disvolvi aŭtomatan traduksistemon pere de komputilo. En 1951 eniris en la grupon Yehoshua Bar-Hillel.
  • Jaro 1952: Okazis la unua kongreso pri Aŭtomata Tradukado en ?
  • Jaro 1960: Aperas la libro "Automatic Language Translation", fare de A. G. Oettinger, pri la tiutempa stato de la tekniko.
  • Jaro 1962: Aperas la anglalingva libro "The Future of Machine Translation", fare de la jam menciita Bar-Hillel.
  • Jaro 1964: En Usono, la Nacia Konsilantaro pri Esplorado kaj la Nacia Scienca Akademio formis komitaton "ALPAC", kies tasko estis studi objektive la rezultojn de la ĝistiamaj esploroj pri aŭtomata tradukado, kaj konkludi pri la estonteco de tiuj esploroj.
  • Jaro 1966: La komitato "ALPAC" diskonigas siajn konkludojn, kiuj estis pesimismaj pri la ebleco de kontentiga aŭtomata tradukado. Tamen, la studo opinias, ke spite de la verŝajna malsukceso, la esploroj tiutemaj ja utilis por la lingvistiko kaj por la tradukarto ĝenerale, danke al la disvolvo de:
Pli praktikaj metodoj por taksi tradukojn.
Rimedoj por plirapidigi la tradukadon.
Mezuroj pri kvalito de tradukaĵoj.
Mezuroj pri kosto de tradukado.
Statistikoj pri tradukaĵoj.
Studoj pri prokrasto de tradukoj kaj ties kaŭzoj.
Konsultiloj por tradukistoj.
Iomgrada profito de aŭtomata tradukado.

En la sekvantaj jaroj, la esplorado pri aŭtomata tradukado bremsiĝis, verŝajne pro influo de la malentuziasmiga informo de ALPAC, kio etigis la monan kaj alispecajn apogojn por tiutema esplorado.

Tamen, aliaj institucioj kaj komercaj entreprenoj prenis denove la taskon evoluigi sistemojn por aŭtomata tradukado atingante progresojn.

Ĝenerala skizo pri la maŝintraduka procezo

[redakti | redakti fonton]

Ekzemplo de sintaksa analizo de frazeroj

[redakti | redakti fonton]

Nombro de tradukprogramoj necesaj por kvin lingvoj

[redakti | redakti fonton]

Maldekstre: Du programoj por ĉiu lingvo-paro, unu programo por ĉiu direkto. Dekstre: Helpe de ponto-lingvo (kiel projekto DLT uzis Esperanton), nur du programoj por ĉiu lingvo (eksterlasante la ponto-lingvon el tiu ĉi kalkulo).

Nombro de programoj funkcie de la nombro de lingvoj

[redakti | redakti fonton]

Komparo inter la "rekta" kaj la "ponto-lingva" metodoj.

La ĝenerala formulo por la nombro de bezonataj programoj (aŭ nombro de homaj tradukistoj) N je rekta traduko de n lingvoj estas:

N = n(n-1)

Je ponto-lingva metodo la bezono estas nur

N = 2n

Kalkulita estas po unu programo aŭ tradukisto por ambaŭ direktoj.

Nombro de programoj por la EU

[redakti | redakti fonton]

Por la 24 oficialaj lingvoj en la EU rezultas

je rekta traduko: 24 x 23 = 552 programoj
je ponto-lingva metodo 24 x 2 = 48 programoj

La ponto-lingva metodo ŝparus 87% de la programado.

Nombro de programoj por la UNO

[redakti | redakti fonton]

La UNO havas nur 6 oficialajn lingvojn. Membrojn ĝi havas 193. Por liveri tradukojn por ĉiuj 193 membroj, kalkulante po unu lingvon por membro, estus bezonataj

je rekta traduko: 193 x 192 = 37056 programoj
je ponto-lingva metodo 193 x 2 = 368 programoj

La ponto-lingva metodo do ŝparus 99% de la programado.

Fakte, por servi ĉiujn landojn perfekte, la cifero 193 ne estas ĝusta. Minimume kvin landoj uzas la (preskaŭ) saman lingvon, la anglan: Britio, Usono, Kanado, Aŭstralio, Nov-Zelando. Sed Hindio havas kvindek oficialajn lingvojn, kiuj estas parolataj de parte kelkaj milionoj.

Kiam la angla estas pivotlingvo

[redakti | redakti fonton]

La ŝiboleto ebligas la distingon inter la programoj, kiuj tradukas rekte de unu lingvo al alia, el tiuj, kiuj uzas la anglan kiel pivotlingvon; frazo kiel (en la franca): "Mon voisin aime ma cousine tandis que ma voisine aime mon cousin" (Mia najbaro amas mian kuzinon, dum mia najbarino amas mian kuzon). Se oni petos Promt, ke ĝi traduku al la germana, la rezulto estos: "Mein Nachbar liebt meine Cousine, während meine Nachbarin meinen Vetter liebt", kaj Systran diros: "Mein Nachbar mag meine Cousine, während meine Nachbarin meinen Vetter mag", du tradukoj konsenteblaj. Sed DeepL kaj Systran respondos unuvoĉe: "Mein Nachbar liebt meinen Cousin, während mein Nachbar meinen Cousin liebt" (Mia najbaro amas mian kuzon, dum mia najbaro amas mian kuzon). Tiun strangan tradukon oni komprenas kontrolante, ke la pera angla tradukaĵo estas: "My neighbor loves my cousin while my neighbor loves my cousin". Tamen Promt kaj Systran, kiuj komence uzis senperan tradukadon inter ĉiuj lingvoj, ne daŭrigis kaj nun ambaŭ tradukas al la itala jene: "Il mio vicino ama mio cugino mentre il mio vicino ama mio cugino".

Gravaj konsideroj

[redakti | redakti fonton]

Klarigo de vortosenco konsistas en trovi taŭgan tradukon, kiam vorto posedas plurajn signifojn. La problemo estis, la unuan fojon, starita de Yehoshua Bar-Hillel (israela lingvisto) en 1950[2]. Li rimarkigis ke, sen "universala enciklopedio", maŝino neniam povus distingi inter du sencoj de vorto[3]. Hodiaŭ ekzistas multaj metodoj por transponti la problemon. Ili estas klaseblaj inter "profundetaj" alproksimoj aŭ "profundaj" alproksimoj.

Profundetaj alproksimoj supozas neniun konon de la teksto. Ili simple uzas statistikajn metodojn al la vortoj ĉirkaŭantaj la ambiguan terminon en la teksto. Profundaj alproksimoj supozas komprenan konon de la termino. Ĝis nun, la profundetaj alproksimoj estas pli sukcesaj.

Claude Piron, longtempe tradukisto por la Unuiĝintaj Nacioj kaj la Monda Organizaĵo pri Sano, skribis ke maŝintradukado, eĉ pli bone konsiderita, aŭtomatigas la plej facilan parton de la traduklaboro; la plej akra, kaj la plej longdaŭra parto implicas fari profundigitan esploron, por solvi la ambiguojn de la fonta teksto, kiu trudas solvi gramatikajn kaj leksikajn devigojn de la cela lingvo:

"Kial bezonas tradukisto tutan tagon por traduki kvin paĝojn, kaj ne unu horon aŭ du ? ... Proksimume 90% de mezteksto rilatas al tiuj simplaj kondiĉoj. Bedaŭrinde estas la 10% restantaj. Estas tiu ĉi parto, kiu necesigas al li ses [pliajn] laborhorojn. Estas solvendaj ambiguoj. Ekzemple, la aŭtoro de fonta teksto, aŭstralia fizikisto, citis la kazon de epidemio, kiu okazis, dum la dua monda milito, en "Japanese prisoner of war camp". Ĉu estas usona kampo de japanaj malliberuloj, aŭ japana malliberejo de usonaj malliberuloj ? La angla teksto enhavas la du signifojn. Do necesas fari esplorojn, eventuale telefoni en Aŭstralio[4]".

Ideala profunda alproksimo necesigus komputilan tradukprogramaron, kiu faru per si mem ĉiujn esplorojn necesajn pri tia suba ambiguaĵo; sed tio necesigu pli altan gradon da AI ol ĝis nun akiritan. Profundeta alproksimo, kiu simple divenas la sencon de la ambigua angla frazo, kiun Piron menciis, (eble, bazita sur la speco de militmalliberejo, kiu estas la pli ofte menciita en donita korpuso) havas kutime racian oportunecon diveni malbone. La profundeta alproksimo, kiu implicas "demandu la uzanton pri ĉiu ambiguo", nur aŭtomatigus, laŭ takso de Piron, 25%-an da la profesia tradukistlaboro, lasante ankoraŭ la pli malfacilan 75%-an parton farendan de homo.

La kvalito de maŝinaj tradukoj

[redakti | redakti fonton]

Multaj maŝintradukitaj tekstoj enhavas erarojn. Nur malrapide progresas la kvalito. Lastatempe la PAT, perstatistika aŭtomata tradukado gajnas kvaliton, ĉar komputiloj iĝas rapide pli kapablaj kaj samtempe iĝas malpli kostaj. Tamen ŝajnas, ke komputiloj ne povos esti perfektaj tradukantoj eĉ post multaj jaroj. Perhoma kontrolo necesas. AI-tradukiloj revoluciantas la manieron kiel ni venkas lingvajn barojn, farante komunikadon pli alirebla kaj efika tra la mondo. Dum AI daŭre progresas, ĉi tiuj tradukiloj sendube atingos pli altan precizecon kaj kuntekstecon, tiel plibonigante tutmondan komunikadon inter homoj parolantaj malsamajn, ne interkompreneblajn lingvojn.

Vidu ankaŭ

[redakti | redakti fonton]

Eksteraj ligiloj

[redakti | redakti fonton]

Sonix, rapide konvertas audion al teksto ene de retumilo antaŭ ol helpi traduki la transskribaĵojn de videaĵoj al aliaj lingvoj

Tradukiloj al aŭ el esperanto

[redakti | redakti fonton]
  • ChatGPT, servo de AI, tradukas al kaj el esperanto
  • Machinetranslation.com, serco de AI, tradukas al kaj el esperanto
  • Taia, servo de AI en kombino kun tradukagentejoj, liveras profesiajn tradukojn. Esperanto troviĝas en la listo de uzeblaj lingvoj.

Referencoj

[redakti | redakti fonton]
  1. 1,0 1,1 1,2 (en) Alex McFarland, 10 Best AI Translation Software & Tools (December 2024), Unite.ai, la 1-an de decembro 2024.
  2. Limŝtonoj pri maŝintradukado - n-ro.6: Bar-Hillel kaj la nefareblo de FAHQT (angle) (el Retarkivo 2007), aŭtoro John Hutchins
  3. Bar-Hillel (1960), "Maŝin tradukado de lingvoj". Legebla rete (angle): http://www.mt-archive.info/Bar-Hillel-1960.pdf Arkivigite je 2011-09-28 per la retarkivo Wayback Machine
  4. Claude Piron, Le défi des langues (La lingva defio), Parizo, eld. L'Harmattan, 1994 (france)