miércoles, 5 de septiembre de 2012

Alineación de textos en Déjà Vu


En la entrada anterior expliqué que era la alineación de textos, y cómo era algo esencial a la hora de traducir un texto con una MT. 


En esta entrada  explicaré cuales son los pasos que tenemos que realizar para crear una alineación de textos en Déjà Vu, y en bitext.


Alinear con Déjà Vu


Los pasos para alinear textos con Déjà Vu son : 


  • Abrir Déjà Vu X2
  • Nuevo proyecto → alineación
  • Seleccionar el idioma del texto de origen y el de llegada 
  • Añadir el documento txt en cada uno de esos dos idiomas
  • Modificar la alineación para que los segmentos coincidan. 


Alinear con Bitext

Es un alineador de código abierto,por lo tanto no está asociado a ningún programa de Memoria de Tradución.El inconveniente de este alineador es que sólo acepta tmx., por lo que antes de utilizarlo habría que transformar todos los textos de otros formatos, como Word o Pdf, en tmx.

Bitext puede descargarse gratuitamente aquí: http://sourceforge.net/projects/bitext2tmx/

Para alinear textos con bitext tenemos que : 
  • Descargarnos el programa
  • Iniciar el programa abriendo el archivo "bat."
  • Hacer  click en archivo y después seleccionar los "txt." que queremos alinear.
  • Seleccionar los idiomas.


  • Seleccionar "Aceptar" (Ver la imagen de arriba)
  • Hacer cambios y corregir la alineación si es necesario. 




  • Guardar al terminar la correción.


lunes, 3 de septiembre de 2012

Alineación de textos paralelos


Las memorias de traducción (MT) se crean a partir de textos originales y sus traducciones alineadas, ya que como he explicado anteriormente a la hora de traducir un nuevo texto en un programa de MT, el sistema consulta la memoria  buscando coincidencias totales (perfect matches) o parciales (fuzzy matches) y las proponen como la traducción de un segmento de ese texto.

Por lo tanto Las MT almacenan  las traducciones creadas por traductores para así poder traducir nuevos textos. Por eso el traductor tiene que alimentar el sistema poniendo textos originales alineados con sus respectivas traducciones. Al ser esta alineación de textos esencial para utilizar una MT tenemos que aprender los diferentes procedimientos para alinear documentos y conocer las distintas herramientas de alineación.

¿Qué es la alineación?

La alineación consiste en comparar el texto de origen y su traducción, haciendo que coincidan los elementos correspondientes y uniéndolas como unidades de traducción de una MT. Son la base de las memorias de traducción. Los segmentos están asociados a su traducción formando de esa manera un corpus paralelo.

En la imagen que se puede observar abajo vemos perfectamente esta alineación de textos, donde las unidades o segmentos del texto original coinciden con sus traducciones :


A la hora de alinear textos, podemos hacerlo manualmente utilizando Excel. Aunque casi todos los programas de memorias de traducción incluyen su propio sistema de alineación, como el Déjà Vu, o el WinAlign de Trados.

En la imagen de debajo podemos ver cómo es el alineador del Déjà Vu, la MT que más hemos utilizado en clase:



Pero hay que recordar que no todos los textos son apropiados para crear estas memorias de traducción, así que tenemos que saber escoger de manera adecuada.

sábado, 21 de julio de 2012


OmegaT

OmegaT es una aplicación libre de memoria de traducción escrita en Java, que fue diseñada Keith Godfrey en el año 2000. En una de las MT más conocidas y populares, que ayudarán a los traductores profesionales durante el proceso de traducción.
Omega128.png
Las características de OmegaT según su página web oficial son:

· Coincidencias parciales
· Propagación de coincidencias
· Procesado simultáneo de proyectos con archivos múltiples
· Uso simultáneo de múltiples memorias de traducción
· Glosarios externos.
· Formatos de archivos: XHTML, HTML, Microsoft Office 2007 XML, OpenOffice.org/StarOffice, XLIFF (Okapi), MediaWiki (Wikipedia) y Sólo texto.
· Soporte Unicode (UTF-8): puede utilizarse con alfabetos no latinos
· Soporte para idiomas derecha-izquierda
· Soporte archivos TMX de la versión superior 1.4b (nivel 2).
· Compatible con otras aplicaciones de memoria de traducción (TMX).
· Expresiones regulares basadas en segmentación.




OmegaT está disponible en varias versiones diferentes. En la página web oficial de OmegaT se ofrecen varios enlaces directos que nos permitirán descargarnos la versión adecuada para nuestros ordenadores.

Esta es la página donde encontraremos estos enlaces: http://www.omegat.org/es/downloads.html

Un manual del usuario completo en pantalla así como un tutorial breve "Comienzo instantáneo" se suministran junto con OmegaT en distintos idiomas.


viernes, 20 de julio de 2012


Déjà Vu X2


En esta entrada voy a hablar sobre una de las herramientas que nos podrán ser más útiles a la hora de traducir. Esta es la que más hemos estudiado durante este semestre en clase : Se trata de Déjà Vu X2.

Este Déjà Vu X2 (DVX2) es la última versión del sistema de traducción asistida por ordenador (TAO) Déjà Vu, creada por la empresa española ATRIL, que lleva creando este tipo de programas desde 1993.



Hay sistemas de TAO gratuitos, como Omega T, y otros de pago. Déjà Vu X2 pertenece a este último grupo, pero los que quieren probar este programa y aprender a utilizarlo pueden descargarse gratuitamente la versión de prueba, que dura exactamente un mes, en esta página : http://www.atril.com/fr/node/3105/download-demo

Déjà Vu posee una serie de características que le convierten en un programa especialmente útil para todos los profesionales de la traducción. Estas características consisten en :
  •   Elaborar y almacenar un archivo de memoria de traducción.
  •  Crear automáticamente un lexicón y una terminología (incluye el término original, su traducción y el contexto en el que aparece.)
  •  Exportar a diferentes formatos estas bases de datos y el lexicón.
  •  Sustituir automáticamente las coincidencias que el programa encuentre en el texto entre fragmentos ya traducidos y otros sin traducir con la opción de “autopropagación”.
  •  Posibilidad de enlazar nuestra traducción con Google Translate automáticamente.

A  lo largo de diferentes entradas iré explicando más detalladamente algunas de estas características, además de cómo realizar un proyecto y una memoria de Traducción en Déjà Vu X2.

jueves, 19 de julio de 2012

Memoria de Traducción



Las memorias de traducción son “almacenes compuestos de textos originales en una lengua alineados con su traducción en otra lengua", es decir una base lingüística que se usa para almacenar un texto fuente y sus traducciones.

Las memorias de traducción son por lo tanto corpus paralelos, que están alineados por unidades de traducción. Estas memorias de traducción sirven para facilitar la tarea del traductor al permitirle extraer sugerencias y concordancias, totales o parciales,  para los términos del texto original. El traductor podrá aceptar estas sugerencias propuestas por la MT, rechazarlas, o incluso modificarlas.

Los sistemas de memorias de traducción proponen automáticamente una traducción  recuperada de la memoria siempre que el término aparezca en la misma frase (correspondencia exacta) o en una frase similar (correspondencia aproximada) en el texto. Estas frases traducidas son por lo tanto “recicladas” para otros textos. Por ello si hay segmentos del texto en el que el programa de MT no encuentra coincidencias, el traductor deberá traducirlo manualmente, y esto se almacenará en la base de tos para que se pueda utilizar posteriormente para otros textos.  

La mayoría de los sistemas de Memorias de Traducción presenten tres tipos de coincidencias: 



    - Coincidencia exacta (exact match)
En una coincidencia exacta el segmento es completamente identico al contenido en la base de datos de la Memoria de Traducción. No se trata sólo de una coincidencia exacta linguistica, sino que también coincide el formato (negrita, cursiva..).  

    - Coincidencia completa (full match)
    Esta coincidencia se da cuando las coincidencias sólo difieren en elementos variables. Estos elementos variables suelen ser los números, las feclas horas, los nombres propios, las unidedas de medida...
    - Coincidencias parciales (Fuzzy matches)
    Son aproximaciones parciales o aproximadas.

Los programas de MT serán muy útiles para los traductores durante el proceso de traducción de textos especializados y técnicos, ya que acelerarán este proceso de traducción.

Aunque, como todos los programas, estos también tienen sus inconvenientes, también se puede decir que han supuesto un enorme avance en el mundo de la traducción.

Algunos de los programas de Memoria de Traducción más conocidos son:  Trados, Déjà Vu,OmegaT...

miércoles, 18 de julio de 2012

Gestión de proyectos II


El la entrada anterior expliqué que era un gestión de proyectos y como realizarlas. Me gustaría recordaros que era esta gestión de proyecto a partir de un esquema sobre esta gestión que he encontrado en la página web de una empresa española especializada en traducciones.

El esquema que pondré a continuación explica como esta empresa realiza esta gestión de proyectos y quienes son los agentes qui intervienen en ella y en todo el proceso.


martes, 17 de julio de 2012

Gestión de proyectos


Para explicar como realizar una gestión de proyectos, tenemos que empezar definiendo estos dos conceptos: : proyecto y gestión de proyectos.

¿Qué es un proyecto?
Podríamos definir proyecto diciendo que “ un proyecto es un empeño temporal  cuyo fin es crear un único producto, servicio o resultado”.

¿Qué es la gestión de proyectos ?
La gestion de proyectos es “aplicación de conocimientos, competencias, herramientas y técnicas a las actividades de un proyecto para responder a los requisitos del proyecto”.

Los proyectos se caracterizan por lo tanto por : su temporabilidad, tener un objetivo, el coste y las exigencias del cliente.

En clase hicimos un ejercicio utilizando utilizando el programa Excel, que nos ayudará a entender como realizar esta gestión de proyectos :

Para realizar este ejercicio de gestión de proyectos, que tiene como objetivo el asignar recursos, dividir tareas y establecer los plazos para cada una de ellas, debíamos seguir ciertas indicaciones y tener en cuenta unos cuantos factores que eran :


Proyecto
- 51.000 palabras en el manual de usuario en formato MS Word
-  86 capturas de pantalla que deben localizarse
-  DTP – 168 páginas
-  32.500 palabras en la ayuda en línea en formato HTML
-  39 capturas de pantalla que deben localizarse
La compilación, comprobación y depuración de los archivos html la hará el
cliente.

Recursos humanos
Se deberán calcular los recursos sabiendo que el proyecto debe estar
finalizado en 30 días laborables.

Métricas por unidad
- Traducción: 2.500 palabras día de media
-  Gestión capturas pantalla: de 4 a 8 por hora
-  Corrección entre entre 5.000 a 7.500 palabras por día
- DTP: 8 páginas por hora


A continuación podreís ver el ejercicio de gestión de proyectos que realizé en Excel siguiendo estas indicaciones dadas por el cliente, aunque sólo para una lengua.



Gestión de proyectos( para una lengua)
Fase de preparaciónRecepción1d
Presupuesto1d
Evaluación1d
MétricaUnidadesVolumenUnidadesTiempotiempo Días
Fase lingüísticaTraducción Ms Word    2500palabras/día51.000palabras20,420
traducción HTLM2500palabras/día32.500palabras1313
Corrección Word7000palabras/día51.000palabras7,285714297,3
Corrección HTLM7000palabras/día32.500palabras4,642857144,6
Fase técnicaCapturas MS Word6captura/hora86capturas14,31,8
Capturas HTLM6captura/hora39capturas6,50,8
DTP8páginas/hora160páginas202,5
TareasDíasnº personastiempo(días)total personas
Traducción Ms Word201204
traducción HTLM13113
Corrección Word7,317,3
Corrección HTLM4,614,6mismo corrector 
Capturas MS Word1,811,8
Capturas HTLM0,810,8misma persona capturas
DTP2,512,5misma persona que capturas
Superposición tareasInicio posibleFinal posible
Traducción Ms Wordd4d24
traducción HTLMd4d17
Corrección Wordd12 (8 días después inicio trad)d28
Corrección HTLMd12 (8 días después inicio trad)d25
Capturas MS Wordd4d6
Capturas HTLMd6d7
DTPd28d30