por Heather Hedden
La traducción y localización son necesarias para el contenido, pero también pueden ser necesarias para acceder al contenido, como los menús y la navegación del sitio web o de la aplicación. En algunos sitios y servicios ricos en contenido, la navegación se amplía para convertirse en un conjunto detallado de categorías. Un conjunto estructurado de términos o etiquetas para categorías también se denomina taxonomía. Las taxonomías son cada vez más comunes, ya sea en sitios web, intranets, portales, SharePoint, sistemas de gestión de contenidos o sistemas de gestión de activos digitales. La internacionalización del contenido y la información compartida hace necesarias taxonomías multilingües.
Si bien la navegación estructurada tiene aspectos de una taxonomía, una taxonomía es más que eso. Los términos de una taxonomía se utilizan para etiquetar o indexar elementos de contenido en varias combinaciones, para respaldar la recuperación de un conjunto de contenido mucho más grande que el que se puede ofrecer mediante navegación únicamente. Mientras que el menú de navegación etiqueta cada enlace a una única página de destino, los términos de taxonomía se etiquetan a varias páginas o elementos de contenido relevantes, de modo que cada término recupere un conjunto de resultados, en lugar de una sola página. Cada elemento de contenido (página HTML, registro de base de datos, activo digital) puede etiquetarse con múltiples términos de taxonomía, según corresponda. Por lo tanto, si un usuario selecciona un segundo término de taxonomía, el conjunto de resultados se puede limitar a solo aquellos elementos etiquetados con ambos términos de taxonomía. Una taxonomía también se puede estructurar en diferentes conjuntos de términos para diferentes aspectos del contenido (como tipo de contenido, ubicación, audiencia, fuente o departamento) que pueden servir como filtros de refinamiento para los usuarios. Esto también se conoce como búsqueda por facetas y se ve comúnmente en grandes sitios web de comercio electrónico.
Los términos de una taxonomía también permiten a los usuarios recuperar contenido relevante de un gran conjunto de contenidos con mayor amplitud y precisión que la simple búsqueda de palabras clave. Una función de búsqueda puede encontrar cadenas de texto, no conceptos. El contenido deseado puede perderse en la búsqueda si el usuario ingresa una palabra de búsqueda que no se menciona en el texto, pero sí un sinónimo. El contenido no deseado puede recuperarse incorrectamente si el usuario ingresa una palabra de búsqueda que tiene múltiples significados y el contenido trata sobre un significado diferente de la palabra. Una taxonomía no es simplemente un conjunto estructurado de términos, sino también un conjunto controlado de términos, donde cada término representa un concepto inequívoco. Los conceptos suelen tener sinónimos asociados en la taxonomía, de modo que una coincidencia con cualquier sinónimo de un término arrojará el mismo resultado. Una taxonomía multilingüe permite a los usuarios seleccionar un término de búsqueda en su idioma y luego acceder al contenido etiquetado en un idioma diferente.
Una taxonomía reúne así los beneficios de la navegación por navegador, con su visualización organizada de términos, y de un vocabulario controlado, con sus sinónimos. La taxonomía está estructurada, normalmente con una jerarquía de términos más amplios y términos más restringidos, que podrían extenderse a varios niveles de profundidad. En algunos casos, también puede haber relaciones asociativas para indicar términos relacionados ( ver también …). De esta forma, el usuario puede descubrir temas de interés. Una estructura con términos relacionados, sinónimos y menos jerarquía a menudo se denomina tesauro en lugar de taxonomía.
Usos de la taxonomía multilingüe
Se han desarrollado e implementado taxonomías multilingües para diversos fines, incluidos los siguientes:
• Por organizaciones y agencias internacionales con un gran volumen de documentos y contenidos en varios idiomas a los que deben acceder usuarios de diferentes idiomas.
• Para sitios web de comercio electrónico con audiencias que hablan diferentes idiomas.
• En intranets de grandes organizaciones o empresas multinacionales, que pueden tener documentos internos o información del perfil de los empleados en diferentes idiomas.
• Para la indexación y recuperación de documentos en bibliotecas y bases de datos de investigación, que incluyen artículos periódicos en diferentes idiomas.
Se puede encontrar un ejemplo de taxonomía multilingüe de una organización internacional en la sección de publicaciones del sitio web del Banco Interamericano de Desarrollo (https://publications.iadb.org), que financia proyectos de desarrollo en América Latina. Los usuarios pueden buscar publicaciones explorando temas de taxonomía en inglés, español o portugués. Las taxonomías española o portuguesa pasan a ser la opción cuando se cambia el idioma de la página web (desde el menú colapsado).
El comercio electrónico es quizás el área de taxonomías multilingües de más rápido crecimiento. Un ejemplo es Office Depot Europe, que tiene una taxonomía de categorías de productos en nueve versiones lingüísticas en sus 13 sitios web regionales de comercio electrónico de las marcas Office Depot y Viking, que anteriormente eran taxonomías completamente separadas y no relacionadas. Las ofertas de productos y, por tanto, sus categorías son prácticamente las mismas en todos los países, al igual que los atributos, como características, color, tamaño y marca, por lo que se han estandarizado y se han hecho equivalentes en todos los idiomas. Los idiomas varían no sólo entre los sitios de cada país, sino que también varios sitios de países son bilingües, incluido el de Alemania, www.viking.de (que tiene alemán e inglés), Bélgica, www.vikingdirect.be (tanto francés como holandés) y Suiza. www.vikingdirekt.ch (tanto en alemán como en francés).
Las bibliotecas han estado proporcionando índices temáticos de artículos periódicos desde antes de la época de las computadoras, aunque ahora están en línea. Los usuarios pueden buscar temas y nombres en la taxonomía (también llamada tesauro), que han sido indexados a artículos. Un ejemplo de una base de datos de artículos periódicos de una biblioteca en un idioma diferente implicó el desarrollo de una colección electrónica de artículos de revistas, una interfaz de usuario y temas de búsqueda (tesauro), todo en español para uso de hispanohablantes en bibliotecas de Estados Unidos. La interfaz de usuario ofrece la opción de buscar en todas las bases de datos suscritas, incluida la base de datos en español. El tesauro en español, originalmente basado en traducciones de términos de la taxonomía inglesa, ha sido desarrollado y mantenido para reflejar el contenido de sus productos en español. También mantiene una estrecha relación con la taxonomía en idioma inglés y, a través del inglés, con una taxonomía más pequeña en idioma portugués a través de enlaces de equivalencia con los términos en idioma inglés. Esta estrecha relación ayuda a garantizar que las jerarquías y las nuevas incorporaciones de términos para los tres idiomas se actualicen de forma rápida y eficiente.
Diseño de taxonomía multilingüe.
Es necesario hacer una distinción entre taxonomías con traducciones y taxonomías verdaderamente bilingües/multilingües. Una taxonomía que simplemente tiene traducciones solo se puede explorar en un idioma, porque las relaciones y la jerarquía solo existen entre términos del idioma principal. Los términos traducidos correspondientes permiten la recuperación del contenido indexado a esos términos en diferentes idiomas. Por lo tanto, el lado de la interfaz de usuario está en un idioma y el lado de indexación puede estar en varios idiomas. Las traducciones de términos funcionan en la dirección del idioma de indexación al idioma de la interfaz de usuario.
Una taxonomía verdaderamente multilingüe es aquella en la que cada término tiene un término equivalente en uno o más idiomas adicionales, y también existen relaciones estructurales entre los términos dentro de cada idioma. Para los usuarios de cada idioma, aparece como una taxonomía totalmente navegable en su propio idioma. A pesar de las diferentes versiones lingüísticas de la taxonomía, se puede recuperar el mismo conjunto compartido de contenido desde cualquier versión lingüística de la taxonomía. Las traducciones de términos deben ser equivalentes exactos que vayan en ambas direcciones. La capacidad de admitir relaciones entre términos dentro de versiones de idiomas adicionales es una característica común del software comercial de gestión de taxonomía.
Una taxonomía multilingüe se puede modelar de dos maneras diferentes:
1. Taxonomías lingüísticas separadas unidas entre sí a través de sus traducciones de términos equivalentes
2. Una taxonomía única basada en conceptos, cada uno de los cuales tiene etiquetas en diferentes idiomas.
La estructura de versiones de taxonomía separadas en diferentes idiomas que están vinculadas entre sí mediante vínculos entre términos equivalentes es una forma común de una taxonomía multilingüe que comienza como una taxonomía en un idioma y luego se le agrega otra versión lingüística. Hay dos enfoques para crear una taxonomía bilingüe o multilingüe: (1) comenzar con una taxonomía y agregar traducciones y enlaces a las traducciones para cada término en otro idioma, o (2) comenzar con dos taxonomías en diferentes idiomas sobre el mismo tema. área, alcance y nivel de detalle, y luego mapear los términos de traducción equivalentes entre sí. Para los términos que carecen de traducción, se puede agregar un nuevo término equivalente en la traducción. La elección del enfoque depende de las taxonomías disponibles para empezar. Con cualquiera de los dos enfoques, es posible que algunos términos existan en un idioma y no en el otro, cuando no existen traducciones equivalentes. Esto podría ser aceptable si hay contenido en un idioma solo para el término y no es necesario que un usuario del otro idioma acceda a él.
Dependiendo del software de gestión de taxonomía utilizado, las relaciones entre términos pueden ser idénticas (reflejadas) en todos los idiomas, o se les puede permitir que varíen. Si se permite que las relaciones entre términos varíen, las relaciones jerárquicas deberían ser las mismas en todos los idiomas, excepto en los casos en que el término existe en un idioma y no en los demás. Las relaciones asociativas (términos relacionados), si las hay, suelen ser las mismas, pero en ocasiones pueden diferir por razones lingüísticas o culturales matizadas de lo que se considera “relacionado”. La Figura 1 es un ejemplo de términos del Tesauro multilingüe de la OIT, donde las relaciones son idénticas en ambas versiones lingüísticas. Aquí BT significa término más amplio , NT significa término más restringido y RT significa término relacionado . Sin embargo, el inglés tiene una variante (UF-usado para), mientras que el español no. Los indicadores lingüísticos de FRE, SPA y EN también funcionan como vínculos de relación. Los términos del mismo tipo de relación se enumeran alfabéticamente.
El otro modelo de taxonomías se basa en un conjunto unificado de conceptos, en lugar de términos. Cada concepto tiene su propio significado único e inequívoco, y las relaciones se dan entre conceptos. Un concepto también tiene cualquier número de etiquetas, que son términos que el usuario puede ver. En este modelo las etiquetas pueden estar en diferentes idiomas. Un concepto tiene una única etiqueta preferida en cada idioma y cualquier número de etiquetas alternativas para cada idioma. Si la traducción está incompleta, aún es posible tener un concepto en un idioma y no en otro.
En este modelo conceptual unificado de taxonomía, las relaciones jerárquicas y asociativas son siempre las mismas entre términos de todos los idiomas. Este modelo se ha vuelto más común con la creciente adopción del marco SKOS (sistema simple de organización del conocimiento) del World Wide Web Consortium (W3C), un modelo de datos común para compartir y vincular sistemas de organización del conocimiento (como taxonomías o tesauros) a través del Web semántica. SKOS se basa en el modelo conceptual y admite taxonomías multilingües.
La Figura 2 es un ejemplo de un concepto en cada una de las vistas en inglés y francés del Tesauro de UNSECO, basado en el modelo SKOS. Se enumeran etiquetas alternativas (sinónimos), en cursiva, no sólo para el idioma de visualización seleccionado sino para todos los idiomas, presentados como las distintas etiquetas para este concepto en particular.
En ambos tipos de modelos de taxonomía multilingüe (conceptos separados pero vinculados vs. unificados), los distintos sinónimos llamados, etiquetas alternativas, términos no preferidos, términos de entrada, etc., variarán para cada término en cada idioma. Una palabra en un idioma tiene un conjunto de sinónimos diferente al de su traducción en otro idioma. En una taxonomía, estos no son realmente sinónimos, sino más bien términos con un significado suficientemente equivalente dentro del alcance de la taxonomía y el contexto del área temática para ser tratados y gestionados como el mismo concepto para la indexación y recuperación de contenidos. En la Figura 2 se muestran más etiquetas alternativas para el concepto español de edificios académicos.
Creando una taxonomía multilingüe
Crear una taxonomía multilingüe requiere tiempo y esfuerzo considerables, por lo que, para ser práctico, el enfoque depende de qué taxonomías o taxonomías parciales ya existen. A veces ya existen taxonomías sobre el mismo tema en más de un idioma, y las taxonomías se mapean término por término para establecer equivalencias. Cuando no existen equivalencias, se pueden agregar nuevos términos cuando falten, o quizás, tras la evaluación, el término realmente no sea necesario y se elimine. También es necesario alinear las relaciones entre términos.
A menudo, una taxonomía existe en un solo idioma y luego se traduce a otros idiomas. Como se mencionó anteriormente, para una taxonomía multilingüe bidireccional, las traducciones deben ser completamente precisas en ambas direcciones, no solo en una. También es más difícil traducir términos (palabras individuales o frases cortas) sin el contexto de una oración, por lo que la traducción requiere más tiempo y cuesta más por palabra que la traducción normal de documentos. Las traducciones deben ser manuales, no automáticas, y los traductores deben comprender el papel y la función de las taxonomías. También es necesario proporcionar al traductor todos los detalles de cada concepto en el idioma de origen (etiquetas alternativas, relaciones y notas de alcance) para que comprenda el significado previsto de cada término. Los términos que carecen de equivalentes exactos pueden presentar desafíos que requieren mucho tiempo.
Si bien es común que las organizaciones creen una taxonomía simple en columnas en Excel y luego la importen a su sistema de gestión de contenido, las complejidades de un tesauro multilingüe requieren una herramienta de software dedicada. Existen varias opciones de software de gestión de taxonomías que admiten taxonomías multilingües.
El software que modela taxonomías multilingües como taxonomías reflejadas separadas con enlaces de equivalencia a términos en todos los idiomas incluye lo siguiente:
• MultiTes (www.multites.com), cuyo nombre de producto refleja la capacidad de tesauros/taxonomías multilingües, es el más asequible, a 295 dólares para un solo usuario de Windows. MultiTes se centra en tesauros, en lugar de taxonomías, por lo que no hay una vista jerárquica en la interfaz de usuario, solo informes generados. También se encuentran disponibles kits de desarrollo web y kits de desarrollo empresarial de MultiTes.
• Synaptica (www.synaptica.com) está basado en web (software como servicio o dentro del firewall), que admite taxonomías multilingües duplicadas y de enlaces equivalentes. Synaptica también tiene una función para “mapear” dos taxonomías diferentes que se pueden utilizar en el proceso de vincular dos taxonomías de lenguajes preexistentes.
• Data Harmony Thesaurus Manager, de Access Innovations (www.accessinn.com) está disponible en versión web y cliente-servidor. Un producto complementario admite la indexación asistida por máquina (MAI).
El software que modela taxonomías en SKOS con un solo concepto y etiquetas en múltiples idiomas incluye lo siguiente, todos ellos basados en web de gran tamaño, ya sea software como servicio o dentro del firewall:
• PoolParty (www.poolparty.biz) de Semantic Web Company, una empresa de rápido crecimiento en Austria.
• Coreon (www.coreon.com) es un producto de software de Alemania que puede ser de particular interés para la comunidad de lengua extranjera, porque ofrece funciones de gestión de taxonomía y terminología.
• El editor de ontologías de Smartlogic (www.smartlogic.com) también sirve para crear taxonomías. Una ontología es un tipo más complejo de taxonomía con relaciones y clases de términos personalizados, que también cumple con las especificaciones de interoperabilidad del lenguaje de ontología web (OWL) del W3C.
• Red de vocabulario empresarial TopBraid (www.topquadrant.com) de TopQuadrant.
La mayoría de estos productos de software ofrecen interfaces de programación de aplicaciones o conectores complementarios para implementar la taxonomía en el sistema de gestión de contenidos donde los términos se etiquetan con los elementos de contenido. En todos los casos, estas herramientas de software pueden exportar taxonomías como XML para importarlas a diversos tipos de sistemas de gestión de contenidos.
Mantenimiento de taxonomías multilingües.
Un problema común con cualquier taxonomía y particularmente con las taxonomías multilingües es el mantenimiento a largo plazo. Las taxonomías y sus versiones en distintos idiomas pueden ser creadas, como proyectos, por contratistas, consultores o trabajadores independientes, que no son necesarios y, por lo tanto, no están disponibles para el mantenimiento continuo de bajo nivel de una taxonomía. Una taxonomía, a diferencia de un documento, no se crea y traduce simplemente y luego se termina. Una taxonomía debe representar el conjunto de contenidos al que está indexada y satisfacer las necesidades de sus usuarios. Con el tiempo, el cuerpo del contenido cambiará, a medida que se agreguen nuevos elementos de contenido y se eliminen otros, e incluso los usuarios pueden cambiar si se agregan mercados adicionales. El modelo de concepto unificado (SKOS) para una taxonomía multilingüe es más fácil de mantener en todos los idiomas que las taxonomías vinculadas por separado. Los cambios o supresiones en conceptos o sus relaciones se extienden a las demás versiones lingüísticas. Sin embargo, si se agrega un nuevo concepto, se debe recordar crear etiquetas de idioma adicionales.
Una vez creada una taxonomía, se puede utilizar para indexar/etiquetar elementos de contenido ya sea manualmente, de forma automatizada o con una combinación de indexación automatizada con revisión humana (indexación asistida por máquina). Los indexadores pueden ser hablantes de cualquier idioma de una taxonomía multilingüe, pero deben conocer el idioma de los documentos que están indexando. La tarea de indexación puede contribuir al mantenimiento de la taxonomía al revelar la necesidad de agregar nuevos términos, fusionar términos similares, vincular mejor los términos faltantes y definir mejor los términos mal utilizados.
Evaluación de una taxonomía
Crear una taxonomía multilingüe no es fácil, pero los beneficios de su implementación pueden ser significativos. Los desafíos incluyen la necesidad de traducciones totalmente bidireccionales y traducciones de términos fuera de contexto, encontrar traductores que comprendan el papel y el uso de las taxonomías y tener un recurso lingüístico disponible para el mantenimiento de bajo nivel de la taxonomía. Estos desafíos son más intelectuales que técnicos, y hay traductores y taxónomos que los acogen con agrado. Traducir un documento amplía su acceso; traducir una taxonomía va mucho más allá, al ampliar el acceso a muchos documentos y otros contenidos digitales.
Fuente: https://multilingual.com/articles/multilingual-taxonomies/