2024-03-29T13:13:54Zhttps://repositori.uji.es/oai/requestoai:repositori.uji.es:10234/786482019-11-18T19:16:53Zcom_10234_76326com_10234_158177com_10234_10col_10234_78548
00925njm 22002777a 4500
dc
Homsani, Samia
author
2006
Este artículo trata sobre el etiquetado morfosintáctico de textos electrónicos mediante la utilización de un
programa de etiquetado. Para llevar a cabo el proceso se ha utilizado el programa Connexor Machinese
Syntax; los textos etiquetados pertenecen a los corpus TXTCeram y TXTInfo-ES.
El etiquetado de los corpus TXTCeram y TXTInfo-ES se enmarca dentro del proyecto ONTODIC , cuyo objetivo
general es la creación de un diccionario terminológico onomasiológico. Además, otros de los objetivos
del proyecto versarán acerca de la extracción terminológica y la extracción de información conceptual. El
proyecto ONTODIC ha sido concebido por el grupo de investigación TecnoleTTra (tecnologías del lenguaje,
la terminología y la traducción) de la Universitat Jaume I, y está dirigido por Amparo Alcina.
El marcado o etiquetado de textos electrónicos consiste en codificar documentos con la información morfosintáctica
referente a cada una de las unidades por las que están formados, de forma que éste pueda ser
posteriormente procesado por programas informáticos.
La herramienta Connexor Machinese Syntax nos permite la realización automática del etiquetado, ya que
procesa los archivos en formato .txt, y nos permite obtener los resultados del análisis morfosintáctico tanto
en formato de texto etiquetado como en un documento etiquetado en xml.
1139-5486
http://hdl.handle.net/10234/78648
Filosofía
Philosophy
Philosophie
History
Histoire
Historia
Ciències de la comunicació
Communication Sciences
Sciences de la Communication
Ciencias de la comunicación
Filología
Philologie
Philology
Traducció i Interpretació
Translation and Interpretation
Traduction et interprétation
Traducción e Interpretación
Etiquetado de textos con Connexor