Busque resultados para: omegat & friends.

  • laRusalka 9:33 pm el 31/07/2009 Permalink | Inicia sesión para dejar un comentario
    Etiquetas: , , , , ,   

    Disponible OmegaT 2.0.3_2 

    Desde el 28 de julio está disponible la versión de desarrollo 2.0.3_2 de OmegaT, herramienta libre para traducción asistida por computador. Ya que soy fan declarada de esta herramienta y siempre utilizo la versión beta, aprovecho la ocasión para escribir este post en el que trataré de resumir los que en mi opinión son los cambios más destacados en relación con la versión 1.8.1_6 (versión estable).

    Empecemos con los formatos soportados. Además de los filtros para texto plano, OpenDocument/OpenOffice.org, archivos PO, archivos de propiedades de Java, ayuda en HTML compilado, archivos INI (formato ‘clave=valor’), DocBook, Microsoft Open XML, XLIFF, HTML, XHTML, en la versión beta se incluyen también filtros para archivos de subtítulos .srt (implementado en la versión 2.0.0), QuarkXPress CopyFlow Gold (.tag, .xtg) (v. 2.0.0), ResX (v. 2.0.2) y archivos LaTeX (v. 2.0.3).

    Otro cambio importante que notaremos al crear un proyecto es el número de subcarpetas, que ha pasado de cinco a seis en la versión 2.0.3. El soporte para diccionarios StarDict, tanto monolingües como bilingües, es la novedad con la que se introduce no solo una nueva subcarpeta en el proyecto (\dictionary), sino también un cuarto panel en la interfaz de usuario. Este cuarto panel inicialmente aparece minimizado, pero al igual que los otros tres se puede disponer y redimensionar según nuestras preferencias.

    OmegaT-2.0.3_2 - interfaz de usuario (disposición inicial)

    Ya que los diccionarios StarDict son generales y por tanto el panel aparecerá recargado de información que no resulta muy relevante (preposiciones, artículos, adverbios, etc.), tenemos la opción de excluir las palabras que no queremos que se muestren. Esto se puede hacer directamente en el panel haciendo clic derecho sobre la palabra que queremos ocultar. Estas palabras quedan guardadas en la subcarpeta \dictionary en un archivo llamado ignore.txt. Un pequeño truco para ahorrarnos el trabajo manual del clic derecho es utilizar como archivo ignore.txt una lista de stopwords (que podemos descargar de internet o crear fácilmente con una herramienta de análisis de corpus).

    OmegaT 2.0.3_2 - coincidencias del diccionario

    Pasando al tema de las memorias y glosarios, desde la versión 2.0.0_1 se implementó un algoritmo de stemming para recuperar las coincidencias. En otras palabras, en el proceso se reducen las palabras a sus raíces, lo que permite mejores resultados. Para utilizar esta función se debe descargar el primer plugin oficial de OmegaT: tokenizers. Para las memorias, en el panel de coincidencias veremos que ahora se calculan tres porcentajes de similaridad: con stemming/sin stemming/considerando etiquetas, puntuación, números, etc.

    OmegaT-2.0.3_2 - coincidencias de las memorias

    Otro cambio interesante tiene que ver con la manera como se muestran las coincidencias de los glosarios. A partir de la versión 2.0.1, las entradas idénticas o similares se combinan en una sola. Esto quiere decir que si en nuestros glosarios tenemos las entradas home=hogar y home=inicio en el panel de coincidencias veremos home=hogar, inicio. Esta mejora también aplica para las entradas que incluyan comentarios, que ahora aparecerán numerados según el equivalente al que se refieran.

    OmegaT 2.0.3_2 - coincidencias del glosario

    En cuanto a los glosarios, otra mejora que merece ser destacada es que a partir de la versión 2.0.3 los cambios se detectan automáticamente cada minuto, lo que quiere decir que ya no es necesario recargar el proyecto manualmente luego de agregar/modificar entradas. Además, también desde la versión 2.0.3, OmegaT carga los glosarios de manera recurrente desde la carpeta \glossary; en otras palabras, ahora es posible organizar los glosarios en subcarpetas de \glossary.

    Un cambio implementado desde la versión 2.0.1 que permite más control sobre las configuraciones personales es la posibilidad de especificar la ubicación de los archivos de configuración, que se guardan por defecto en la carpeta de usuario según el sistema operativo. [Para MS Windows XP, por ejemplo, la ruta es normalmente C:\Documents and Settings\<User Name>\Application Data\OmegaT (para otras plataformas ver el Manual de usuario)]. Esta nueva opción puede resultar útil si queremos modificar las reglas de segmentación solo para un proyecto o si queremos utilizar OmegaT desde una memoria USB sin dejar archivos en el computador huésped. Para aprovechar esta característica, basta incluir la opción – -config-dir=<ubicación de la carpeta&gt; al iniciar OmegaT en la línea de comandos o modificar el script con el que iniciamos el programa (omegat.bat en MS Windows). A modo de ejemplo, si queremos utilizar una carpeta llamada \config ubicada en D:\, el comando debe ser:

    OmegaT 2.0.3_2 - cambiar ubicación de archivos de configuración

    En términos de usabilidad, a partir de la versión 2.0.0 tenemos la posibilidad de utilizar atajos de teclado para las funciones Recargar, Cerrar y Crear documentos finales del menú Proyecto, que antes no tenían atajos asignados. Y lo que es aún mejor, ahora podemos cambiar la configuración de todos los atajos de teclado. Para hacerlo, debemos extraer de OmegaT.jar el archivo \org\omegat\gui\main\MainMenuShortcuts.properties (MainMenuShortcuts.mac.properties para los usuarios de Mac), lo guardamos en la carpeta de configuración de OmegaT (ver párrafo anterior) y modificamos las teclas asignadas en un editor de texto.

    Configuración de los atajos de teclado - MainMenuShortcuts.properties

    Configuración de los atajos de teclado - MainMenuShortcuts.properties

    Con el fin de facilitar la creación de plugins para OmegaT, desde la versión 2.0.1. se implementaron un par de opciones que se basan en un principio simple pero efectivo: OmegaT ahora puede exportar ciertos contenidos a archivos de texto que se guardan en la subcarpeta <carpeta de configuración&gt;\script. Una de estas opciones, que por defecto viene desactivada, exporta el contenido del segmento activo a los archivos source.txt y target.txt. Para activar esta opción basta marcar una casilla en el cuadro de diálogo Comportamiento de edición (menú Opciones).

    OmegaT 2.0.3_2 - comportamiento de edición

    Igualmente, se ha añadido una nueva función en el menú Editar denominada Exportar selección (Ctrl+Mayús+C) que copia el texto seleccionado a un archivo llamado selection.txt. Aunque para el usuario ‘normal’ estas dos opciones parecen no ofrecer por sí mismas ningún beneficio, ya varios usuarios ‘frikies’ se han dedicado a crear scripts que aprovechan estos archivos para añadir funcionalidad a OmegaT y en los próximos posts de la serie OmegaT & Friends veremos algunos ejemplos.

    Por último, la gran novedad en la versión 2.0.3_2 es la facilidad de instalación gracias a la implementación de Java Web Start. Si ya tenemos el entorno de ejecución de Java (JRE), sin importar cual sea nuestro sistema operativo, ahora basta hacer clic en el enlace en esta página y Java Web Start se ocupa de descargar e iniciar OmegaT, con lo que en un abrir y cerrar de ojos podemos empezar a traducir en cualquier computador con una conexión a internet. Además, Java Web Start crea un acceso directo en el escritorio que nos permitirá utilizar la aplicación sin necesidad de conexión. Otra característica de la versión para Java Web Start es que las futuras actualizaciones se realizarán de manera automática. Para quienes prefieran la instalación tradicional, en la sección de descargas del proyecto siguen estando disponibles los paquetes de las últimas versiones.

    Estas son, en mi opinión, las mejoras más destacadas disponibles en la versión beta de OmegaT en comparación con la versión estable. Otros cambios incluyen nuevas reglas de segmentación para algunos idiomas, posibilidad de utilizar los códigos ISO de tres letras para las lenguas del proyecto (aunque los de dos letras también siguen siendo posibles), más rapidez para cargar los proyectos, cambios en las ventanas Archivos del proyecto y Búsqueda de texto y disponibilidad de la interfaz de usuario y documentación actualizada en un buen número de idiomas.

    Para terminar, incluyo aquí el enlace al grupo de usuarios de OmegaT en Yahoo Groups, que puede servir de referencia si encontramos algún problema al usar el programa (no es necesario registrarse para leer los mensajes): http://tech.groups.yahoo.com/group/OmegaT/messages

    [Actualización: ya está disponible OmegaT 2.0 versión estable]

    SAN JOAN DE LES ABADESSES

    Share

     
  • laRusalka 12:42 am el 24/07/2009 Permalink | Inicia sesión para dejar un comentario
    Etiquetas: , , , , , , , ,   

    OmegaT & Friends: UncleanifyTMX 

    En este segundo post de la serie OmegaT & Friends aprenderemos a utilizar UncleanifyTMX, un script que nos resultará útil cuando necesitemos entregar archivos de MS Word en formato ’sucio’ (tipo SDL Trados/Wordfast) a partir de un proyecto de OmegaT. Al igual que el script del post anterior, UncleanifyTMX fue creado por Samuel Murray y está escrito en AutoIt para MS Windows. Para GNU/Linux existen dos alternativas experimentales: una escrita en python (unclean.py) por Roberto Bechtlufft; y otra en tcl (unclean.tcl), escrita por mí :) .  Para quienes se arriesguen a ensayarlas, estas dos alternativas están disponibles en la caja de descargas en la barra lateral.

    Para MS Windows, el archivo zip que descargamos contiene tres ficheros: uncleanifyTMX.au3 (el script como tal), uncleanifyTMX.exe (la versión compilada) y readme.txt. Suponiendo que no tenemos AutoIt instalado, el archivo que utilizaremos es el ejecutable compilado, así que lo extraemos del zip y lo guardamos en la carpeta donde se encuentra el archivo project_save.tmx de nuestro proyecto de OmegaT (normalmente la subcarpeta /omegat del proyecto).

    Una vez terminemos la traducción en OmegaT (incluyendo revisión ortográfica y validación de etiquetas), guardamos la memoria de traducción (Ctrl+S) y cerramos el proyecto (Ctrl+Mayús+W).

    Pero antes de continuar, algunas advertencias importantes:

    • Es recomendable ensayar el script con proyectos de prueba antes de utilizarlo en proyectos reales para verificar que funciona bien en tu ordenador y para que te familiarices con el proceso.
    • Para archivos con formatos complejos, es mejor ensayar el proceso completo con una ‘pseudotraducción’ y comprobar los resultados.
    • Aunque el script crea una copia de seguridad, es posible que en algunos casos ésta presente problemas de codificación. Por tanto, SIEMPRE debes guardar una copia de seguridad del archivo project_save.tmx ANTES de ejecutar el script. Esta memoria ‘limpia’ te servirá para restablecer tu proyecto de OmegaT en caso de ser necesario y para utilizarla de referencia en futuros proyectos.

    El siguiente paso es ejecutar el script haciendo doble clic en el archivo uncleanifyTMX.exe. Si el script y el archivo project_save.tmx no están en la misma carpeta, aparecerá un mensaje de error; en cambio, si todo sale bien, no veremos ningún mensaje, pero en la carpeta aparecerá un nuevo archivo: project_save_backup.tmx (la copia de seguridad creada por el script).

    Volvemos a abrir el proyecto en OmegaT y veremos que los segmentos en lengua de llegada contienen tanto el original como la traducción y unas nuevas etiquetas.

    OmegaT - proyecto 'uncleanified'

    Si al abrir el proyecto en OmegaT notas que los caracteres acentuados no se visualizan correctamente, prueba otra vez recurriendo a la primera copia de seguridad que hiciste, pero esta vez abre el archivo tmx en el bloc de notas y guárdalo con codificación ANSI antes de ejecutar el script. Parece contradictorio, ya que la codificación de los archivos tmx de OmegaT es UTF8, pero a mí me ha funcionado.

    Ahora en OmegaT debes crear los documentos finales (Ctrl+D) y cerrar el proyecto. El siguiente paso es abrir el archivo traducido en OpenOffice.org y guardarlo en el formato original (.doc).

    Aunque en general no parece ser necesario, según los requisitos del cliente y la versión de Trados o Wordfast que tenga, se puede ‘disfrazar’ un poco más el archivo resultante cambiando el tipo de letra de las etiquetas a Courier New de 12 puntos, color magenta y en posición subíndice, cosa que se puede hacer fácilmente en OpenOffice.org con buscar y reemplazar.

    OpenOffice.org - buscar y reemplazar

    OpenOffice.org - buscar y reemplazar

    Para los más perfeccionistas, lo ideal sería crear un estilo de carácter con el nombre tw4winMark, configurarlo con las mencionadas características de tipo de letra, color y posición y aplicarlo a las etiquetas. Además, sería también necesario configurar tanto las etiquetas como los segmentos originales como texto oculto.

    OpenOffice.org - archivo sucio

    OpenOffice.org - archivo sucio

    También debes tener en cuenta que si el archivo original contiene información en las propiedades (por ejemplo, título u autor), deberás ‘limpiar’ esa parte manualmente en la traducción antes de entregarla.

    Finalmente, si por alguna razón UncleanifyTMX no se adapta a tus necesidades, otra alternativa libre que permite obtener archivos ’sucios’ es Anaphraseus, una herramienta inspirada en Wordfast que consiste en un conjunto de macros para OpenOffice.org y que está disponible como extensión y como documento independiente.

    Share

     
  • laRusalka 4:56 pm el 16/07/2009 Permalink | Inicia sesión para dejar un comentario
    Etiquetas: , , , , , , , ,   

    OmegaT & Friends: omTaddterm 

    Entre las herramientas libres para el traductor, OmegaT se ha ganado sin duda un lugar destacado. No es raro encontrarla codo a codo con los grandes del mercado en cuestionarios, reseñas y otro tipo de publicaciones sobre herramientas para el traductor. Lo que no es tan común es encontrar información sobre ciertos scripts que se pueden utilizar con OmegaT para añadirle funcionalidad. De ahí la idea de escribir sobre el tema en esta serie que he llamado, al mejor estilo musical, OmegaT & Friends.

    Este primer post de la serie está dedicado al script omTaddterm, uno de los tantos que ha escrito Samuel Murray. OmTaddterm está escrito en AutoIt, un lenguaje de programación freeware tipo BASIC para el sistema operativo MS Windows. Una de las ventajas de AutoIt es que los scripts se pueden compilar en archivos ejecutables de manera que se puedan utilizar en cualquier ordenador sin tener AutoIT instalado. La desventaja es que los scripts de AutoIt solo funcionan en MS Windows :(

    Como bien saben quienes han utilizado OmegaT alguna vez, para editar el/los glosarios del proyecto es necesario utilizar un editor externo (tipo bloc de notas), ya que esta función no está incluida en el programa. Pues bien, aquí es donde entra omTaddterm. Con este script se facilita la labor de agregar términos y equivalentes a un glosario en formato de texto plano delimitado por tabulaciones, que es el formato de glosario utilizado por OmegaT.

    El script está disponible en dos versiones: omtaddterm.zip y omtaddterm_utf8.zip. Para estas instrucciones utilizaremos la segunda versión, que como su nombre lo indica nos permite trabajar con codificación de caracteres UTF-8, lo que nos evitará inconvenientes más adelante. El archivo zip que descargamos contiene 6 archivos: omTaddterm.au3 (el script como tal), omTaddterm.exe (la versión compilada), readme.txt (las instrucciones), dos capturas de pantalla (omTaddterm1.png y omTaddterm2.png) y tabchar.txt (un archivo de texto que solo contiene el caracter de tabulación). En este caso, suponiendo que no tenemos instalado AutoIt y queremos seguir el camino más fácil, utilizaremos la versión compilada, es decir, omTaddterm.exe.

    El siguiente paso entonces es crear una carpeta en C:\ que llamaremos Omtaddterm. En dicha carpeta extraeremos los archivos omtaddterm.exe y tabchar.txt, que son los únicos que necesitamos en este caso. Si ya tenemos algún glosario de un proyecto anterior, lo guardamos también en dicha carpeta y lo renombramos glossary.utf8. Este archivo debe utilizar la codificación UTF-8. La manera más sencilla de verificar esto es abrir el archivo con el bloc de notas y utilizar la opción Guardar como... En el cuadro de diálogo, escribimos el nombre y la extensión (glossary.utf8) y en la lista desplegable de codificación seleccionamos la opción UTF-8.

    Bloc de notas - UTF8

    Bloc de notas - UTF8

    Si no tenemos un glosario, con el bloc de notas creamos un archivo en blanco y lo guardamos con el nombre glossary.utf8 y codificación UTF-8. Para evitar problemas, asegúrate también de que tu explorador de archivos está mostrando las extensiones de los archivos, ya que de lo contrario podrías terminar con un archivo llamado glossary.utf8.txt y el script no funcionaría.

    Recuerda que en las propiedades del proyecto de OmegaT (atajo de teclado: Ctrl+E) debes indicar que la carpeta del glosario es C:\OmTaddterm.

    OmegaT - propiedades del proyecto

    Muy bien, ahora estamos listos para ver el script en acción. Para ejecutarlo hay que hacer doble clic en el archivo omtaddterm.exe. Aparecerá entonces el siguiente cuadro de diálogo:

    OmTaddterm

    OmTaddterm

    Basta hacer clic en el botón Aceptar y el script seguirá activo en segundo plano. En la bandeja de notificación veremos el icono de AutoIt, que nos permite en cualquier momento pausar o cerrar el script.

    OmTaddterm - icono

    OmTaddterm - icono

    OmTaddterm funciona con cualquier programa que utilice el portapapeles, así que es posible, por ejemplo, agregar un término desde OmegaT y su equivalente desde el navegador. Para agregar términos y equivalentes al glosario, seleccionamos el término original y presionamos la combinación de teclas Ctrl+Alt+T. Parece que no pasa nada, pero no te preocupes, es normal. Ahora seleccionamos el equivalente y presionamos la combinación de teclas Ctrl+Alt+Y. Entonces debe aparecer un cuadro de diálogo donde se muestra la entrada que se agregará al glosario.

    OmTaddterm - agregar entrada

    OmTaddterm - agregar entrada

    El cuadro de diálogo te permite hacer modificaciones, lo que resulta útil por ejemplo para eliminar plurales, cambiar mayúsculas o agregar la fuente donde encontramos el equivalente. Solo debes tener cuidado de no borrar las tabulaciones y tener presente que en algunos sistemas las tabulaciones se ven como cuadritos, mientras que en otros, como en la captura incluida, se ven como espacio en blanco. La estructura de la entrada debe ser: término tabulación equivalente tabulación comentario opcional. Al hacer clic en OK (o presionar la tecla Entrar) la entrada será agregada al glosario.

    Debes tener en cuenta que cuando se tiene el proyecto abierto, OmegaT no lee las nuevas adiciones al glosario hasta que recarguemos el proyecto (atajo de teclado: F5). Esto ya es una cuestión personal, pero en mi opinión no hace falta recargar para cada entrada agregada al glosario; en mi caso prefiero hacerlo después de haber agregado unas cuantas. [Actualización: a partir de la versión 2.0.3_01 Beta, OmegaT recarga automáticamente el glosario cada segundo, así que ya no será necesario recargar el proyecto para que se detecten las nuevas entradas.]

    Por último, cabe aclarar que para los usuarios más ‘avanzados’, siempre está la posibilidad de modificar directamente el script, es decir, el archivo omTaddterm.au3. Si te animas, con el bloc de notas puedes cambiar fácilmente la ubicación y el nombre del glosario y las combinaciones de teclas según tus preferencias. Una vez modificado el script, debes utilizar directamente el archivo omTaddterm.au3 o compilarlo como ejecutable (para ambas cosas hace falta tener instalado AutoIt).

    omTaddterm.au3 - cambiar la ubicación y nombre del glosario

    omTaddterm.au3 - cambiar la ubicación y nombre del glosario

    No te pierdas el próximo post de la serie OmegaT & Friends, que estará dedicado a UncleanifyTMX, un script que nos permite crear archivos en formato ‘unclean’ tipo Trados.

    Share

     
    • jmg2009 12:32 pm el 20/07/2009 Permalink | Inicia sesión para responder

      laRusalka

      Enhorabuena por tu blog. Soy un futuro traductor (si todo va bien, claro está), hace poco que he empezado a usar OmegaT por mi cuenta. Quería darte la enhorabuena por tu blog sobre OmegaT, cuya dirección encontré en el grupo de Yahoo dedicado a dicho programa.
      Me ha gustado especialmente este mensaje sobre omTaddterm, pues me pareció un poco extraño que no hubiese ningún complemento para OmegaT con el que hacer glosarios. Tengo una pregunta sobre este complemento. He hecho pruebas com omTaddterm y no reconoce las palabras en ruso, las cuales están escritas en cirílico. Me gustaría saber a qué puede deberse eso y cómo se puede solucionar, pues una de mis futuras lenguas de trabajo será el ruso. ¿Puede ser que omTaddterm no permita el uso de caracteres que no sean los latinos? Por si acaso, he seguido el procedimiento que explicas en este mensaje, usando omtaddterm_utf8.zip.

      Un saludo

      • laRusalka 1:39 pm el 20/07/2009 Permalink | Inicia sesión para responder

        jmg2009:
        Gracias por tu visita y tu comentario.
        La verdad, aquí me pillas un poco fuera de base ya que solo trabajo con inglés, francés y español y no había tenido el problema que mencionas. Sin embargo, solo por probar, he intentado agregar algunas entradas en ruso al glosario y te cuento que no he tenido problema: tanto omTaddterm como OmegaT muestran los caracteres en cirílico correctamente. Así pues, para poder ayudarte con un mejor ‘diagnóstico’ en tu caso, necesitaría saber más detalles, por ejemplo, ¿a qué te refieres exactamente con ‘no reconoce las palabras en ruso’? ¿no se ven bien en el cuadro de diálogo de omTaddterm? ¿no se agregan al glosario? ¿o el problema es que no se muestran correctamente en OmegaT?
        En este punto, entonces, solo me queda recomendarte que verifiques lo básico, es decir, que la codificación del glosario sea efectivamente UTF8, que lo tienes en la carpeta C:\Omtaddterm y que se llama glossary.utf8.
        Un saludo.

    • jmg2009 10:16 pm el 21/07/2009 Permalink | Inicia sesión para responder

      ¡Hola de nuevo, laRusalka!

      Bonito apodo, por cierto. Rusalka, ninfa de la mitología eslava y obra de opera de Antonín Dvořák. :)
      Ya he resuelto el problema. La cosa está en que la prueba que hice era elegir el término orígen (llamémoslo así) no del texto abierto en OmegaT, sino en un achivo de Writer y por eso no funcionaba. Ahora sí que me funciona.

      Un saludo

      • laRusalka 9:18 pm el 22/07/2009 Permalink | Inicia sesión para responder

        Pues me alegra que ya te funcione. Claro que me extraña que no te haya funcionado en Writer, porque precisamente una de las ventajas de omTaddterm es que se puede utilizar en cualquier programa que permita copiar al portapapeles. ¿Tal vez un conflicto de atajos de teclado en Writer?
        Un saludo.

c
Crea una nueva entrada
j
Siguiente entrada / Siguiente comentario
k
anterior entrada/anterior comentario
r
respuesta
e
editar
o
mostrar/ocultar comentarios
t
ir al encabezado
l
go to login
h
mostrar/ocultar ayuda
esc
cancelar