(2022-2025) Mestrado em Ciência da Computação
PPGCC/DC/UFSCar
(2015-2021) Bacharelado em Engenharia de Computação
Universidade Federal de São Carlos (UFSCar)
Mestrado (2022 - 2025)
Título do projeto: ToMAS: Sumarização Abstrativa Multinível Baseada em Tópicos usando LLMs
Nível: Mestrado
Breve descrição: Recentemente, as discussões políticas no Brasil ganharam destaque, tornando-se um dos tópicos mais debatidos nas redes sociais. Fatores como a diversidade de temas, a ocorrência de eventos que atraem a atenção do público e o constante aumento no volume de mensagens tornaram desafiadora a tarefa de identificar de forma clara, concisa e objetiva os principais tópicos das postagens. Nesse contexto, este estudo propõe um novo método automático que explora o uso de técnicas automáticas de geração de tópicos e sumarização em múltiplos níveis utilizando modelos de linguagem de grande escala. O método proposto foi avaliado para gerar resumos (sumários) a partir de tweets sobre o domínio da política brasileira coletados durante as eleições presidenciais de 2022. Além do método de sumarização multinível, foi proposto também um novo método de avaliação de sumários baseado na estratégia de divisão e conquista para a aplicação da medida de avaliação automática BERTSCore em textos extensos,o qual também agrega o tamanho da sentença gerada como um peso no valor da avaliação. Análises qualitativas e quantitativas indicam que a combinação dessas técnicas foi capaz de extrair e resumir os principais tópicos com sucesso, demonstrando um grande potencial para ser uma ferramenta informativa útil na avaliação de diferentes opiniões, questões e temas discutidos publicamente.
Orientador: Profa. Dra. Helena de Medeiros Caseli
Publicação decorrente deste projeto:
CAPELLARO, L. ToMAS: Sumarização abstrativa multinível baseada em tópicos usando LLMs. Dissertação de Mestrado - Programa de Pós-graduação em Ciência da Computação da UFSCar. São Carlos, SP. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21352
Trabalho de Conclusão de Curso (2021)
Título do projeto: Análise de polaridade e de tópicos em tweets no domínio da política no Brasil
Nível: Trabalho de Graduação
Resumo: O campo da política no Brasil é um dos mais movimentados e mais polêmicos da última década. Com o advento das redes sociais, um novo canal de comunicação entre os eleitores e os políticos foi criado, com os usuários tendo um espaço para publicar suas opiniões, crenças e também acompanhar publicações de outras pessoas. Neste contexto, este trabalho mostra como modelos BERT se saem na análise de polaridade (positiva, negativa ou neutra) e de tópicos de grandes quantidades de tweets relacionados à política do Brasil. Experimentos foram realizados com tweets relacionados às eleições de 2018, e melhores resultados (F1 = 96%) foram obtidos para a classificação de polaridade em comparação com trabalhos anteriores. A avaliação qualitativa dos tópicos (a primeira usando BERTopic neste corpus) também mostrou resultados promissores.
Orientador: Profa. Dra. Helena de Medeiros Caseli
Github do projeto: https://github.com/LALIC-UFSCar/TCC_Leonardo_Capellaro
Publicações decorrentes deste projeto:
CAPELLARO, Leonardo; CASELI, Helena de Medeiros. Análise de polaridade e de tópicos em tweets no domínio da política no Brasil. In: SIMPÓSIO BRASILEIRO DE TECNOLOGIA DA INFORMAÇÃO E DA LINGUAGEM HUMANA (STIL), 13. , 2021, Evento Online. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2021 . p. 47-55. DOI: https://doi.org/10.5753/stil.2021.17783.
CAPELLARO, Leonardo. Análise de polaridade e de tópicos em tweets no domínio da política no Brasil. 2021. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) – Universidade Federal de São Carlos, São Carlos, 2021. Disponível em: https://repositorio.ufscar.br/handle/ufscar/15138 .
leonardocapellaro@hotmail.com