OmegaT & Friends: UncleanifyTMX

2009 Julio 24

En este segundo post de la serie OmegaT & Friends aprenderemos a utilizar UncleanifyTMX, un script que nos resultará útil cuando necesitemos entregar archivos de MS Word en formato ’sucio’ (tipo SDL Trados/Wordfast) a partir de un proyecto de OmegaT. Al igual que el script del post anterior, UncleanifyTMX fue creado por Samuel Murray y está escrito en AutoIt para MS Windows. Para GNU/Linux existen dos alternativas experimentales: una escrita en python (unclean.py) por Roberto Bechtlufft; y otra en tcl (unclean.tcl), escrita por mí :) .  Para quienes se arriesguen a ensayarlas, estas dos alternativas están disponibles en la caja de descargas en la barra lateral.

Para MS Windows, el archivo zip que descargamos contiene tres ficheros: uncleanifyTMX.au3 (el script como tal), uncleanifyTMX.exe (la versión compilada) y readme.txt. Suponiendo que no tenemos AutoIt instalado, el archivo que utilizaremos es el ejecutable compilado, así que lo extraemos del zip y lo guardamos en la carpeta donde se encuentra el archivo project_save.tmx de nuestro proyecto de OmegaT (normalmente la subcarpeta /omegat del proyecto).

Una vez terminemos la traducción en OmegaT (incluyendo revisión ortográfica y validación de etiquetas), guardamos la memoria de traducción (Ctrl+S) y cerramos el proyecto (Ctrl+Mayús+W).

Pero antes de continuar, algunas advertencias importantes:

  • Es recomendable ensayar el script con proyectos de prueba antes de utilizarlo en proyectos reales para verificar que funciona bien en tu ordenador y para que te familiarices con el proceso.
  • Para archivos con formatos complejos, es mejor ensayar el proceso completo con una ‘pseudotraducción’ y comprobar los resultados.
  • Aunque el script crea una copia de seguridad, es posible que en algunos casos ésta presente problemas de codificación. Por tanto, SIEMPRE debes guardar una copia de seguridad del archivo project_save.tmx ANTES de ejecutar el script. Esta memoria ‘limpia’ te servirá para restablecer tu proyecto de OmegaT en caso de ser necesario y para utilizarla de referencia en futuros proyectos.

El siguiente paso es ejecutar el script haciendo doble clic en el archivo uncleanifyTMX.exe. Si el script y el archivo project_save.tmx no están en la misma carpeta, aparecerá un mensaje de error; en cambio, si todo sale bien, no veremos ningún mensaje, pero en la carpeta aparecerá un nuevo archivo: project_save_backup.tmx (la copia de seguridad creada por el script).

Volvemos a abrir el proyecto en OmegaT y veremos que los segmentos en lengua de llegada contienen tanto el original como la traducción y unas nuevas etiquetas.

OmegaT - proyecto 'uncleanified'

OmegaT - proyecto 'sucio'

Si al abrir el proyecto en OmegaT notas que los caracteres acentuados no se visualizan correctamente, prueba otra vez recurriendo a la primera copia de seguridad que hiciste, pero esta vez abre el archivo tmx en el bloc de notas y guárdalo con codificación ANSI antes de ejecutar el script. Parece contradictorio, ya que la codificación de los archivos tmx de OmegaT es UTF8, pero a mí me ha funcionado.

Ahora en OmegaT debes crear los documentos finales (Ctrl+D) y cerrar el proyecto. El siguiente paso es abrir el archivo traducido en OpenOffice.org y guardarlo en el formato original (.doc).

Aunque en general no parece ser necesario, según los requisitos del cliente y la versión de Trados o Wordfast que tenga, se puede ‘disfrazar’ un poco más el archivo resultante cambiando el tipo de letra de las etiquetas a Courier New de 12 puntos, color magenta y en posición subíndice, cosa que se puede hacer fácilmente en OpenOffice.org con buscar y reemplazar.

OpenOffice.org - buscar y reemplazar

OpenOffice.org - buscar y reemplazar

Para los más perfeccionistas, lo ideal sería crear un estilo de carácter con el nombre tw4winMark, configurarlo con las mencionadas características de tipo de letra, color y posición y aplicarlo a las etiquetas. Además, sería también necesario configurar tanto las etiquetas como los segmentos originales como texto oculto.

OpenOffice.org - archivo sucio

OpenOffice.org - archivo sucio

También debes tener en cuenta que si el archivo original contiene información en las propiedades (por ejemplo, título u autor), deberás ‘limpiar’ esa parte manualmente en la traducción antes de entregarla.

Finalmente, si por alguna razón UncleanifyTMX no se adapta a tus necesidades, otra alternativa libre que permite obtener archivos ’sucios’ es Anaphraseus, una herramienta inspirada en Wordfast que consiste en un conjunto de macros para OpenOffice.org y que está disponible como extensión y como documento independiente.

Share

Una respuesta dejar un →
  1. 2009 Octubre 15

    Muchísimas gracias por sus informaciones muy interesantes!!

Escribe un comentario

Tienes que iniciar sesión para escribir un comentario.