Título do projeto: Automatic detection of metaphors in Brazilian Portuguese
Nível: Mestrado
Resumo: O processamento automático de metáforas desempenha um papel crucial em várias aplicações de Processamento de Linguagem Natural (NLP), incluindo análise de sentimentos, tradução automática e geração de texto. Dada a natureza complexa da linguagem metafórica, seu processamento automático representa um desafio significativo, exigindo que os modelos superem os significados literais para capturar mapeamentos conceituais subjacentes. Embora pesquisas significativas tenham sido conduzidas sobre detecção de metáforas para idiomas com grande disponibilidade de recursos, como o inglês, muitos outros idiomas permanecem pouco explorados. Isso é particularmente verdadeiro para o português do Brasil, em que a escassez de conjuntos de dados anotados e o número reduzido de estudos dificultam avanços no campo. Este estudo visa avançar a detecção automática de metáforas para o português do Brasil construindo um conjunto de dados anotados e treinando modelos monolíngues e multilíngues para o português do Brasil, inglês e espanhol. Os idiomas adicionais serão utilizados para comparar resultados e alavancar o conhecimento para aprimorar a generalização para o português do Brasil. Ao expandir a pesquisa nesta área, este trabalho visa fortalecer o estudo da detecção de metáforas no português do Brasil e contribuir para o desenvolvimento mais amplo de recursos de NLP para o idioma.
Orientadora: Profa. Dra. Helena de Medeiros Caseli
Publicação decorrente deste trabalho:
LREC 2026 (to appear)
Título do projeto: Cálculo de similaridade em memórias de tradução usando word embeddings
Nível: Iniciação Científica
Breve descrição: A estratégia tradicionalmente utilizada pelas ferramentas CAT para casamento (do inglês, matching) entre os segmentos da sentença sendo traduzida e os segmentos presentes na memória de tradução consideram a intersecção (ou sobreposição) nas sequências de palavras (n-gramas) presentes nos segmentos de texto em comparação. Contudo, essa estratégia não é capaz de capturar similaridade semântica além do nível trivial. Deste modo, este projeto tem como objetivo investigar a aplicabilidade de word embeddings mono e bilíngues para implementar o casamento. Deste modo, este trabalho surge como a primeira iniciativa de investigação neste contexto.
Orientadora: Profa. Dra. Helena de Medeiros Caseli
Publicação decorrente deste trabalho:
JOHANSSON, K. M.; CASELI, H. M. Investigação do uso de word embeddings para cálculo de similaridade em memórias de tradução. In: WORKSHOP DE INICIAÇÃO CIENTÍFICA EM TECNOLOGIA DA INFORMAÇÃO E DA LINGUAGEM HUMANA (TILIC), 6., 2019. Anais do XII Symposium in Information and Human Language Technology and Collocates Events. Salvador: Sociedade Brasileira de Computação, 2019 . p. 372-376. PDF
karina.mayumi@estudante.ufscar.br