Wikiproiektu:OpenMT2 eta Euskal Wikipedia
Wikiproiektu honen helburua OpenMT2 eta Euskal Wikipedia izeneko itzulpengintza automatikoko (IA) proiektua koordinatzea da.
See Reciprocal Enrichment between Basque Wikipedia and Machine Translators. A chapter of the following book: 'The People’s Web Meets NLP: Collaboratively Constructed Language Resources', book edited by Iryna Gurevych and Jungi Kim, Springer, Book series 'Theory and Aplications of Natural Language Processing', E. Hovy, M. Johnson and G. Hirst (eds.). April 30, 2013 | ISBN-10: 3642350844 | ISBN-13: 978-3642350849.
Proiektuaren helburuak
[aldatu | aldatu iturburu kodea]Euskal Herriko Unibertsitateko IXA taldeko kideek eta Euskal Wikipediako lankideek hartu dute parte proiektuan 2009 eta 2013 urteen artean.
Helburua bikoitza izan da: Matxin sistema librea hobetzea eta Euskal Wikipedia artikulu berriekin hornitzea. Horretarako, itzulpen automatikoko bi teknika desberdin erabili dira erregeletan oinarritutakoa eta post-edizio estatistikoa:
- Informatikari buruzko 100 artikulu (50.000 bat hitz), Gaztelaniazko Wikipediakoak, automatikoki itzuli dira euskarara Matxin erabiliz.
- Euskarazko testu horiek eskuz zuzendu dira gero, OmegaT erabiliz. (Tresna deskargatzeko eta erabiltzeko eskuliburua)
- Zuzenketak Matxin hobetzeko bildu dira, eta zuzendutako artikuluak Euskal Wikipedian argitaratu dira.
- Artikulu berriak wikitu dira, txantiloiak, barne-loturak, erreferentziak eta kategoriak zuzenduz.
Boluntarioaren lana
[aldatu | aldatu iturburu kodea]Wikiproiektuan parte hartu duten boluntarioen lista behean dago. Horietako bakoitzaren lana hau izan da:
- OmegaT eta Matxin instalatu (Deskargatzeko eta erabiltzeko eskuliburua.pdf)
- Apur bat entrenatzeko, aukeratu artikulu labur bat praktikatzeko beheko listatik , eta landu OmegaT+Matxin tresnarekin:
- Jarri bere izena artikuluaren arduraduna eremuan,
- OmegaT aplikaziotik artikulua automatikoki itzuli Matxin erabiliz,
- Eskuz zuzendu, (Wikipediako formatuak ondo ezagutzen ez bazuen, begiratzen zuen txuleta edo tutorial luze hau)
- eta Wikipediara igo (OmegaT erabiliz ere egin daiteke).
- Aukeratu artikulu ertain edo luze bat ondoko listan, eta lehen bezala automatikoki itzuli, eskuz zuzendu, eta Wikipediara igo.
Proiektuan itzulitako Wikipediako artikuluak.
Proiektuan itzulitako hitzak.
Aurkezpenak
[aldatu | aldatu iturburu kodea]Proiektu osoan egindako lanaren deskribapena
[aldatu | aldatu iturburu kodea]- Wikipedia eta itzulpen automatikoa: 'Harri batez bizpalau xori' Ekaia aldizkaria, 2013
- (Ingelesez) Reciprocal Enrichment between Basque Wikipedia and Machine Translators. Liburu honetako kapitulu bat: 'The People’s Web Meets NLP: Collaboratively Constructed Language Resources', book edited by Iryna Gurevych and Jungi Kim, Springer, Book series 'Theory and Aplications of Natural Language Processing', E. Hovy, M. Johnson and G. Hirst (eds.). April 30, 2013 | ISBN-10: 3642350844 | ISBN-13: 978-3642350849.
2013eko Informatikari Euskaldunen Bilkuran (IEB2013)
[aldatu | aldatu iturburu kodea]Edizio-maratoia Euskal Wikipediako 10. urteurrenean
[aldatu | aldatu iturburu kodea]2011eko Wikitzul eguna: Matxin eta Wikipedia hobetzen
[aldatu | aldatu iturburu kodea]2011eko Informatikari Euskaldunen Bilkuran (IEB2011)
[aldatu | aldatu iturburu kodea]Azalpena bideoan
[aldatu | aldatu iturburu kodea]- Albisteak 2.0-ren 24. atalean proiektuaren inguruko laburpena dago ikusgai.
2010eko Wikimania kongresuan
[aldatu | aldatu iturburu kodea]- (Ingelesez) "Reciprocal Enrichment between Wikipedia and Machine Translators" laburpena"
- (Ingelesez) Aurkezpeneko diapositibak
- Iritzi-artikulua Gaur8n
OpenMT2 proiektuaren inguruko informazioa
[aldatu | aldatu iturburu kodea]- (Ingelesez) OpenMT2 proiektua
Proiektuak sortu dituen baliabideak
[aldatu | aldatu iturburu kodea]- 3GP, ALGOL, Aplikazio (informatika), Aplikazio bertikal, Aplikazio horizontal, Atzipen sekuentzial, Biltegiratze optiko, COM fitxategi, Common Object Request Broker Architecture, Datu-base eskema, Datu-konpresio, Deka, Delicious, Drupal, Egutegi elektroniko, Eliren liburua, ELIZA programa informatikoa, Emakumeak informatikan, Entitateen izenen ezagutzea, Erregistro, Etiketa (metadatua), Ezagutzaren metodologia, Funtzio boolear, Futbol Club Barcelona (eskubaloia), Gaseosa, Giga, Google itzultzailearen tresnen kutxa, Hans Weingartner, Hardware bidezko azelerazio, Helbide-bus, Hezkuntza-software, Hizkuntzaren ingeniaritza, Hot Potatoes, Ikaskuntzarako ingurune birtualak, Indexazio, Interfaze fisiko, Irudien prozesaketa digital, ISAPI, Itzulpen memoria, Jquery, Kaltura, Karga-efektu, Kilo, Kino (softwarea), Klon (informatika), Kode ireki, Kontsulta lengoaia, Kosinuaren transformatu diskretu, LAMP, League for Programming Freedom, Lego Mindstorms, Lengoaia informatiko, Lerrokatzaile, Lizentzia Publiko Komuna, Logika konputazional, Medikuntza software, Mega, Metalinguistika, Mikro, Murriztapen gramatika, Musikaren deskarga, Nano, Object Query Language, Oihaneko liburua (1967ko filma), Ordenadores Sin Fronteras (erakundea), Pantaila-babesle, Partizio editore, Pasabide (informatika), Peta (aurrizkia), Physics engine, Pico (aurrizkia), Pila (informatika), Programazio konkurrente, Programazio-lengoaien teoria, Red Hat, Renderizazio, Robotika, Runge-Kutta metodo, Sare lokal, Scratch (programazio-lengoaia), Seinale digital, Sistemen diseinua, Slax, Software fabrika, Software modelatzea, Software-errorea, Softwarearen metrika, Softwarezko sintetizadore, Spotify, Superordenagailu, Tera (aurrizkia), Testu-fitxategi, TortoiseSVN, Unity, USB memoria, Verbatim, Virtual Studio Technology, Von Neumannen arkitektura, XLiFF, Yotta, Zubi (informatika)
- Espainiera/euskara corpus paralelo bat. Mozilla softwarearen lokalizazioan sortu denaren bertsio berria. Eskerrak Elhuyarri eta Julen Ruiz-i.
- Testu itzuli eta zuzenduen corpus bat. Espainierazko Wikipediako 100 artikulu horiek Matxin itzultzailearekin sortutako itzulpenak dituena, gure kolaboratzaileek egin dituzten zuzenketekin, noski].
- wikigaiak4koa.pl perl-scripta. Wikipediako kategoria batean dauden artikuluen lista ematen duena. Artikulu bakoitzarekin beste datu batzuk ere ematen dira: ea beste hiru hizkuntzetako Wikipedietan dagoen eta zer luzera duen.
- OmegaT programaren bertsio hobetua, eta berau erabiltzeko eskuliburua.
- Matxin itzultzailearen bertsio berria, informatikako gaiak itzultzeko egokitu duguna (http://ixa2.si.ehu.es/matxin_zerb/translate.cgi). SOAP zerbitzu moduan definituta dago.
Parte-hartzaileak
[aldatu | aldatu iturburu kodea]Itzultzeko artikuluen zerrenda
[aldatu | aldatu iturburu kodea]Artikulu luzeak
[aldatu | aldatu iturburu kodea]Artikulu ertainak
[aldatu | aldatu iturburu kodea]Gaztelaniazko Wikipediako artikulua | Hitz-kopurua | Euskarazko Wikipediako artikulua | Hitz-kopurua | Itzulpenaren arduraduna |
3GP | 24.46 Kb | - | - | |
Acreditación_Europea_de_Manejo_de_Ordenador | 23.73 Kb | ez dago | - | - |
Acuerdo_de_nivel_de_servicio | 23.38 Kb | ez dago | - | - |
Administración_de_Memoria | 23.48 Kb | ez dago | - | - |
Advanced_Programmable_Interrupt_Controller | 24.54 Kb | ez dago | - | - |
ALGOL | 29.81 Kb | ALGOL | - | A. Diaz de Ilarraza |
Animación_por_computadora | 23.39 Kb | ez dago | - | joseba.makazaga |
Anomalía_de_Belady | 22.38 Kb | ez dago | - | - |
Archivo_de_texto | 22.66 Kb | ez dago | - | - |
ARJ | 22.46 Kb | ez dago | - | - |
Arquitectura_ARM | 19.57 Kb | ez dago | - | - |
Arte_ASCII | 22.70 Kb | ez dago | - | - |
ARts | 23.47 Kb | ez dago | - | - |
ASP.NET | 76.84 Kb | ez dago | - | - |
Auditoría_informática | 23.35 Kb | ez dago | - | - |
Avidemux | - | ez dago | - | - |
Bastard_Operator_from_Hell | 27.66 Kb | ez dago | - | - |
Beta_tester | 19.99 Kb | ez dago | - | - |
Biblioteca_de_enlace_dinámico | 28.20 Kb | ez dago | - | - |
Botnet | 30.69 Kb | ez dago | - | JesusIbañez |
Bus de direcciones | 304 | 205 | oarbelaitz | |
Bus_VESA | 21.05 Kb | ez dago | - | - |
Byte_(revista) | 22.67 Kb | ez dago | - | - |
CamelCase | 22.21 Kb | ez dago | - | - |
CD-ROM | 43.80 Kb | ez dago | - | - |
Chunk | 18.87 Kb | ez dago | - | - |
COBOL | 35.46 Kb | ez dago | - | - |
Código_Baudot | 22.78 Kb | ez dago | - | - |
Computación_paralela | 23.49 Kb | ez dago | - | JesusIbañez |
Controlador_de_Automatización_Programable | 21.99 Kb | ez dago | - | - |
CP/M | 32.00 Kb | ez dago | - | - |
Decimal_codificado_en_binario | 35.27 Kb | ez dago | - | - |
DDR2 | 31.79 Kb | ez dago | - | - |
Defense_Advanced_Research_Projects_Agency | 25.10 Kb | ez dago | - | - |
Delicious | - | Delicious | - | ksarasola |
Demoscene | 32.85 Kb | ez dago | - | - |
Desbordamiento | 20.00 Kb | ez dago | - | - |
Diccionario_morfológico | 23.35 Kb | ez dago | - | JesusIbañez |
Diseño_asistido_por_computadora | 23.60 Kb | ez dago | - | - |
Distancia_de_Levenshtein | 23.48 Kb | ez dago | - | - |
Dos_(desambiguación) | 23.26 Kb | ez dago | - | - |
DR-DOS | 24.90 Kb | ez dago | - | - |
DXF | 27.03 Kb | ez dago | - | - |
EBCDIC | 28.63 Kb | ez dago | - | - |
EDID | 23.86 Kb | ez dago | - | - |
Eiffel_(lenguaje_de_programación) | 23.82 Kb | ez dago | - | - |
El_Torito_(CD-ROM_Standard) | 90.26 Kb | ez dago | - | - |
Empaquetado_de_aplicaciones | 23.50 Kb | ez dago | - | - |
Enterprise_service_bus | 48.08 Kb | ez dago | - | - |
Especificación | 23.75 Kb | ez dago | - | - |
Fabricación_asistida_por_computadora | 23.91 Kb | ez dago | - | - |
Facultad_de_Informática_de_Barcelona | 24.02 Kb | ez dago | - | - |
Free_Lossless_Audio_Codec | 54.30 Kb | ez dago | - | - |
Garaje_HP | 23.30 Kb | ez dago | - | - |
GD-ROM | 24.70 Kb | ez dago | - | - |
Generador_de_números_aleatorios | 23.74 Kb | ez dago | - | - |
Género de videojuegos | - | ez dago | - | - |
Gobierno_electrónico | 23.18 Kb | ez dago | - | - |
Google Libros | - | ez dago | - | Inaki.a001 |
Google translator toolkit | 555 | Google itzultzailearen tresnen kutxa | 479 | Txibi72 |
GPX | 22.44 Kb | ez dago | - | - |
Graphical_Environment_Manager | 25.20 Kb | ez dago | - | - |
Gzip | 25.02 Kb | ez dago | - | - |
Hiperenlace | 25.02 Kb | ez dago | - | - |
HyperTransport | 33.35 Kb | ez dago | - | - |
IBM_PC_DOS | 22.74 Kb | ez dago | - | - |
Icaros | 18.13 Kb | ez dago | - | - |
Imagen_digital | 22.91 Kb | ez dago | - | - |
Imagen_generada_por_computadora | 23.56 Kb | ez dago | - | - |
IDE | 21.54 Kb | ez dago | - | - |
Imágenes_por_segundo | 23.13 Kb | ez dago | - | - |
Implementación | 23.75 Kb | ez dago | - | - |
Inclusión_digital | 23.14 Kb | ez dago | - | - |
Industria de los videojuegos | - | ez dago | - | - |
Industry_Standard_Architecture | 33.02 Kb | ez dago | - | - |
Information_Technology_Infrastructure_Library | 54.12 Kb | ez dago | - | - |
Ingeniería_asistida_por_computadora | 23.77 Kb | ez dago | - | - |
Infrared_Data_Association | 32.54 Kb | ez dago | - | - |
Ingeniería_informática | 23.39 Kb | ez dago | - | - |
Interfaz | 22.88 Kb | ez dago | - | A. Diaz de Ilarraza |
Interfaz_de_programación_de_aplicaciones | 34.34 Kb | ez dago | - | - |
Internacionalización_y_localización | 24.09 Kb | ez dago | - | - |
Interoperabilidad | 23.04 Kb | ez dago | - | - |
ISAPI | 19.03 Kb | ez dago | - | - |
Joint_Photographic_Experts_Group | 61.21 Kb | ez dago | - | - |
Juego_de_la_vida | 22.91 Kb | ez dago | - | - |
LabWindows/CVI | 25.20 Kb | ez dago | - | - |
Lamer_(informática) | 18.04 Kb | ez dago | - | - |
Lector_de_pantalla | 46.38 Kb | ez dago | - | - |
Leet_speak | 27.26 Kb | ez dago | - | - |
Ley de Acceso Electrónico de los Ciudadanos a los Servicios Públicos | 25.26 Kb | ez dago | - | - |
Licencia Pública Común | 446 | Lizentzia_Publiko_Komuna | 350 | Aingeru |
Logical_block_addressing | 26.36 Kb | ez dago | - | - |
Lookup_table | 41.55 Kb | ez dago | - | - |
Luser | 21.30 Kb | ez dago | - | - |
Magerit | 58.96 Kb | ez dago | - | - |
MagicGate | 23.75 Kb | ez dago | - | - |
Memex | 32.54 Kb | ez dago | - | - |
Memoria_de_traducción | 23.44 Kb | ez dago | - | - |
Memoria_flash | 23.01 Kb | ez dago | - | - |
Método_(informática) | 23.44 Kb | ez dago | - | - |
Metodologia_de_conocimiento | 23.43 Kb | Ezagutzaren metodologia | - | A. Diaz de Ilarraza |
Microsoft_Visual_Studio | 49.88 Kb | ez dago | - | - |
MISD | 21.45 Kb | ez dago | - | - |
Multiprocesamiento_simétrico | 23.44 Kb | ez dago | - | - |
Multiseat | 23.66 Kb | ez dago | - | - |
MXML | 18.55 Kb | ez dago | - | - |
Newbie | 25.35 Kb | ez dago | - | - |
NeXT | 61.56 Kb | ez dago | - | - |
Nibble | 37.11 Kb | ez dago | - | - |
Obtención_de_preferencias | 23.62 Kb | ez dago | - | - |
Oficina_de_servicios | 23.08 Kb | ez dago | - | - |
Operaciones_de_punto_flotante_por_segundo | 32.42 Kb | ez dago | - | - |
Pantalla_azul_de_la_muerte | 23.38 Kb | ez dago | - | - |
Paravirtualización | 23.22 Kb | ez dago | - | - |
PCI_Extensions_for_Instrumentation | 19.96 Kb | ez dago | - | - |
Planificación_de_sistemas_informáticos | 24.13 Kb | ez dago | - | - |
Plug_and_play | 26.84 Kb | ez dago | - | - |
Predictor_de_saltos | 23.08 Kb | ez dago | - | - |
problemas_aritméticos | 23.22 Kb | ez dago | - | - |
Problema_de_la_mochila | 23.30 Kb | ez dago | - | - |
Problema_de_la_galería_de_arte | 23.56 Kb | ez dago | - | - |
Proceso_zombie | 22.96 Kb | ez dago | - | - |
Producción textual colaborativa | - | ez dago | - | - |
Puerta de enlace | 473 | 306 | Utolotu | |
Química_computacional | 77.93 Kb | ez dago | - | - |
RAR | 26.46 Kb | ez dago | - | - |
RatDVD | 24.57 Kb | ez dago | - | - |
Red_de_área_metropolitana | 23.63 Kb | ez dago | - | - |
Registro_(base_de_datos) | 23.40 Kb | Erregistro | - | Ana Arruarte |
Renderización | 832 | 716 | joseba.makazaga | |
Runge-Kutta | 987 | 841 | joseba.makazaga | |
SAMPA | 24.88 Kb | ez dago | - | - |
SCADA | 57.87 Kb | ez dago | - | - |
SDL_(lenguaje_de_especificación) | 23.89 Kb | ez dago | - | - |
Secure_Hash_Algorithm | 29.34 Kb | ez dago | - | - |
SIMD | 22.56 Kb | ez dago | - | - |
Simulación_por_computadora | 23.42 Kb | ez dago | - | - |
Simulación | 32.77 Kb | ez dago | - | - |
Simulink | 22.76 Kb | ez dago | - | - |
Sincronización | 23.05 Kb | ez dago | - | - |
SISD | 21.11 Kb | ez dago | - | - |
Sistema_de_recomendación | 23.39 Kb | ez dago | - | - |
Sistema_digital | 26.49 Kb | ez dago | - | - |
Sistema_secuencial | 23.57 Kb | ez dago | - | - |
Slax | 950 | 652 | utolotu | |
Small_Computer_System_Interface | 34.27 Kb | ez dago | - | - |
Software educativo | - | - | Koru | |
Spotify | - | - | glabaka | |
SRAM | 39.72 Kb | ez dago | - | - |
Sun_SPARC | 45.18 Kb | ez dago | - | - |
SWF | 26.51 Kb | ez dago | - | - |
TANGO | 26.86 Kb | ez dago | - | - |
Tarjeta_perforada | 23.04 Kb | ez dago | - | - |
Tabla_de_Hash_Distribuido | 23.61 Kb | ez dago | - | - |
Transformada_de_coseno_discreta | 23.56 Kb | - | Jesus Aparizio | |
Transmisión_de_datos | 23.31 Kb | ez dago | - | - |
Trie | 27.12 Kb | ez dago | - | - |
UDF | 21.24 Kb | ez dago | - | - |
Unidad_Terminal_Remota | 23.26 Kb | ez dago | - | - |
Unity | 915 | 601 | Utolotu | |
User_Mode_Linux | 22.96 Kb | ez dago | - | - |
UTF-8 | 48.52 Kb | ez dago | - | - |
VINES | 22.74 Kb | ez dago | - | - |
WAMP | 21.52 Kb | ez dago | - | - |
Waveform_Audio_Format | 31.20 Kb | ez dago | - | - |
Windows_bitmap | 466 | ez dago | - | - |
Write_Once_Read_Many | 23.19 Kb | ez dago | - | - |
ZFS_(sistema_de_archivos) | 1748 | ZFS | 69 | - |
Guztira: 167 artikulu ertain | - | - | - | - |