Informática aplicada 2012

miércoles, 5 de septiembre de 2012

Alineación de textos en Déjà Vu

En la entrada anterior expliqué que era la alineación de textos, y cómo era algo esencial a la hora de traducir un texto con una MT.

En esta entrada explicaré cuales son los pasos que tenemos que realizar para crear una alineación de textos en Déjà Vu, y en bitext.

Alinear con Déjà Vu

Los pasos para alinear textos con Déjà Vu son :

Abrir Déjà Vu X2
Nuevo proyecto → alineación
Seleccionar el idioma del texto de origen y el de llegada
Añadir el documento txt en cada uno de esos dos idiomas
Modificar la alineación para que los segmentos coincidan.

Alinear con Bitext

Es un alineador de código abierto,por lo tanto no está asociado a ningún programa de Memoria de Tradución.El inconveniente de este alineador es que sólo acepta tmx., por lo que antes de utilizarlo habría que transformar todos los textos de otros formatos, como Word o Pdf, en tmx.

Bitext puede descargarse gratuitamente aquí: http://sourceforge.net/projects/bitext2tmx/

Para alinear textos con bitext tenemos que :

Descargarnos el programa
Iniciar el programa abriendo el archivo "bat."
Hacer click en archivo y después seleccionar los "txt." que queremos alinear.
Seleccionar los idiomas.

Seleccionar "Aceptar" (Ver la imagen de arriba)
Hacer cambios y corregir la alineación si es necesario.

Guardar al terminar la correción.

lunes, 3 de septiembre de 2012

Alineación de textos paralelos

Las memorias de traducción (MT) se crean a partir de textos originales y sus traducciones alineadas, ya que como he explicado anteriormente a la hora de traducir un nuevo texto en un programa de MT, el sistema consulta la memoria buscando coincidencias totales (perfect matches) o parciales (fuzzy matches) y las proponen como la traducción de un segmento de ese texto.

Por lo tanto Las MT almacenan las traducciones creadas por traductores para así poder traducir nuevos textos. Por eso el traductor tiene que alimentar el sistema poniendo textos originales alineados con sus respectivas traducciones. Al ser esta alineación de textos esencial para utilizar una MT tenemos que aprender los diferentes procedimientos para alinear documentos y conocer las distintas herramientas de alineación.

¿Qué es la alineación?

La alineación consiste en comparar el texto de origen y su traducción, haciendo que coincidan los elementos correspondientes y uniéndolas como unidades de traducción de una MT. Son la base de las memorias de traducción. Los segmentos están asociados a su traducción formando de esa manera un corpus paralelo.

En la imagen que se puede observar abajo vemos perfectamente esta alineación de textos, donde las unidades o segmentos del texto original coinciden con sus traducciones :

A la hora de alinear textos, podemos hacerlo manualmente utilizando Excel. Aunque casi todos los programas de memorias de traducción incluyen su propio sistema de alineación, como el Déjà Vu, o el WinAlign de Trados.

En la imagen de debajo podemos ver cómo es el alineador del Déjà Vu, la MT que más hemos utilizado en clase:

Pero hay que recordar que no todos los textos son apropiados para crear estas memorias de traducción, así que tenemos que saber escoger de manera adecuada.

sábado, 21 de julio de 2012

OmegaT

OmegaT es una aplicación libre de memoria de traducción escrita en Java, que fue diseñada Keith Godfrey en el año 2000. En una de las MT más conocidas y populares, que ayudarán a los traductores profesionales durante el proceso de traducción.

Las características de OmegaT según su página web oficial son:

· Coincidencias parciales

· Propagación de coincidencias

· Procesado simultáneo de proyectos con archivos múltiples

· Uso simultáneo de múltiples memorias de traducción

· Glosarios externos.

· Formatos de archivos: XHTML, HTML, Microsoft Office 2007 XML, OpenOffice.org/StarOffice, XLIFF (Okapi), MediaWiki (Wikipedia) y Sólo texto.

· Soporte Unicode (UTF-8): puede utilizarse con alfabetos no latinos

· Soporte para idiomas derecha-izquierda

· Soporte archivos TMX de la versión superior 1.4b (nivel 2).

· Compatible con otras aplicaciones de memoria de traducción (TMX).

· Expresiones regulares basadas en segmentación.

OmegaT está disponible en varias versiones diferentes. En la página web oficial de OmegaT se ofrecen varios enlaces directos que nos permitirán descargarnos la versión adecuada para nuestros ordenadores.
Esta es la página donde encontraremos estos enlaces: http://www.omegat.org/es/downloads.html

Un manual del usuario completo en pantalla así como un tutorial breve "Comienzo instantáneo" se suministran junto con OmegaT en distintos idiomas.

viernes, 20 de julio de 2012

Déjà Vu X2

En esta entrada voy a hablar sobre una de las herramientas que nos podrán ser más útiles a la hora de traducir. Esta es la que más hemos estudiado durante este semestre en clase : Se trata de Déjà Vu X2.

Este Déjà Vu X2 (DVX2) es la última versión del sistema de traducción asistida por ordenador (TAO) Déjà Vu, creada por la empresa española ATRIL, que lleva creando este tipo de programas desde 1993.

Hay sistemas de TAO gratuitos, como Omega T, y otros de pago. Déjà Vu X2 pertenece a este último grupo, pero los que quieren probar este programa y aprender a utilizarlo pueden descargarse gratuitamente la versión de prueba, que dura exactamente un mes, en esta página : http://www.atril.com/fr/node/3105/download-demo

Déjà Vu posee una serie de características que le convierten en un programa especialmente útil para todos los profesionales de la traducción. Estas características consisten en :

Elaborar y almacenar un archivo de memoria de traducción.
Crear automáticamente un lexicón y una terminología (incluye el término original, su traducción y el contexto en el que aparece.)
Exportar a diferentes formatos estas bases de datos y el lexicón.
Sustituir automáticamente las coincidencias que el programa encuentre en el texto entre fragmentos ya traducidos y otros sin traducir con la opción de “autopropagación”.
Posibilidad de enlazar nuestra traducción con Google Translate automáticamente.

A lo largo de diferentes entradas iré explicando más detalladamente algunas de estas características, además de cómo realizar un proyecto y una memoria de Traducción en Déjà Vu X2.

jueves, 19 de julio de 2012

Memoria de Traducción

Las memorias de traducción son “almacenes compuestos de textos originales en una lengua alineados con su traducción en otra lengua", es decir una base lingüística que se usa para almacenar un texto fuente y sus traducciones.

Las memorias de traducción son por lo tanto corpus paralelos, que están alineados por unidades de traducción. Estas memorias de traducción sirven para facilitar la tarea del traductor al permitirle extraer sugerencias y concordancias, totales o parciales, para los términos del texto original. El traductor podrá aceptar estas sugerencias propuestas por la MT, rechazarlas, o incluso modificarlas.

Los sistemas de memorias de traducción proponen automáticamente una traducción recuperada de la memoria siempre que el término aparezca en la misma frase (correspondencia exacta) o en una frase similar (correspondencia aproximada) en el texto. Estas frases traducidas son por lo tanto “recicladas” para otros textos. Por ello si hay segmentos del texto en el que el programa de MT no encuentra coincidencias, el traductor deberá traducirlo manualmente, y esto se almacenará en la base de tos para que se pueda utilizar posteriormente para otros textos.

La mayoría de los sistemas de Memorias de Traducción presenten tres tipos de coincidencias:

- Coincidencia exacta (exact match)

En una coincidencia exacta el segmento es completamente identico al contenido en la base de datos de la Memoria de Traducción. No se trata sólo de una coincidencia exacta linguistica, sino que también coincide el formato (negrita, cursiva..).

- Coincidencia completa (full match)

Esta coincidencia se da cuando las coincidencias sólo difieren en elementos variables. Estos elementos variables suelen ser los números, las feclas horas, los nombres propios, las unidedas de medida...

- Coincidencias parciales (Fuzzy matches)

Son aproximaciones parciales o aproximadas.

Los programas de MT serán muy útiles para los traductores durante el proceso de traducción de textos especializados y técnicos, ya que acelerarán este proceso de traducción.

Aunque, como todos los programas, estos también tienen sus inconvenientes, también se puede decir que han supuesto un enorme avance en el mundo de la traducción.

Algunos de los programas de Memoria de Traducción más conocidos son: Trados, Déjà Vu,OmegaT...

miércoles, 18 de julio de 2012

Gestión de proyectos II

El la entrada anterior expliqué que era un gestión de proyectos y como realizarlas. Me gustaría recordaros que era esta gestión de proyecto a partir de un esquema sobre esta gestión que he encontrado en la página web de una empresa española especializada en traducciones.

El esquema que pondré a continuación explica como esta empresa realiza esta gestión de proyectos y quienes son los agentes qui intervienen en ella y en todo el proceso.

martes, 17 de julio de 2012

Gestión de proyectos

Para explicar como realizar una gestión de proyectos, tenemos que empezar definiendo estos dos conceptos: : proyecto y gestión de proyectos.

¿Qué es un proyecto?
Podríamos definir proyecto diciendo que “ un proyecto es un empeño temporal cuyo fin es crear un único producto, servicio o resultado”.

¿Qué es la gestión de proyectos ?
La gestion de proyectos es “aplicación de conocimientos, competencias, herramientas y técnicas a las actividades de un proyecto para responder a los requisitos del proyecto”.

Los proyectos se caracterizan por lo tanto por : su temporabilidad, tener un objetivo, el coste y las exigencias del cliente.

En clase hicimos un ejercicio utilizando utilizando el programa Excel, que nos ayudará a entender como realizar esta gestión de proyectos :

Para realizar este ejercicio de gestión de proyectos, que tiene como objetivo el asignar recursos, dividir tareas y establecer los plazos para cada una de ellas, debíamos seguir ciertas indicaciones y tener en cuenta unos cuantos factores que eran :

Proyecto

- 51.000 palabras en el manual de usuario en formato MS Word

- 86 capturas de pantalla que deben localizarse

- DTP – 168 páginas

- 32.500 palabras en la ayuda en línea en formato HTML

- 39 capturas de pantalla que deben localizarse

La compilación, comprobación y depuración de los archivos html la hará el

cliente.

Recursos humanos

Se deberán calcular los recursos sabiendo que el proyecto debe estar

finalizado en 30 días laborables.

Métricas por unidad

- Traducción: 2.500 palabras día de media

- Gestión capturas pantalla: de 4 a 8 por hora

- Corrección entre entre 5.000 a 7.500 palabras por día

- DTP: 8 páginas por hora

A continuación podreís ver el ejercicio de gestión de proyectos que realizé en Excel siguiendo estas indicaciones dadas por el cliente, aunque sólo para una lengua.

Gestión de proyectos	( para una lengua)

Fase de preparación	Recepción	1d
	Presupuesto	1d
	Evaluación	1d

		Métrica	Unidades	Volumen	Unidades	Tiempo	tiempo Días

Fase lingüística	Traducción Ms Word	2500	palabras/día	51.000	palabras	20,4	20
	traducción HTLM	2500	palabras/día	32.500	palabras	13	13
	Corrección Word	7000	palabras/día	51.000	palabras	7,28571429	7,3
	Corrección HTLM	7000	palabras/día	32.500	palabras	4,64285714	4,6

Fase técnica	Capturas MS Word	6	captura/hora	86	capturas	14,3	1,8
	Capturas HTLM	6	captura/hora	39	capturas	6,5	0,8
	DTP	8	páginas/hora	160	páginas	20	2,5

	Tareas	Días	nº personas	tiempo(días)			total personas
	Traducción Ms Word	20	1	20			4
	traducción HTLM	13	1	13
	Corrección Word	7,3	1	7,3
	Corrección HTLM	4,6	1	4,6	mismo corrector
	Capturas MS Word	1,8	1	1,8
	Capturas HTLM	0,8	1	0,8	misma persona capturas
	DTP	2,5	1	2,5	misma persona que capturas

	Superposición tareas	Inicio posible	Final posible
	Traducción Ms Word	d4	d24
	traducción HTLM	d4	d17
	Corrección Word	d12 (8 días después inicio trad)	d28
	Corrección HTLM	d12 (8 días después inicio trad)	d25
	Capturas MS Word	d4	d6
	Capturas HTLM	d6	d7
	DTP	d28	d30