skip to main content

Um método para a fusão automática de sentenças similares em português

Eloize Rossi Marques Seno Maria das Graças Volpe Nunes

2010

Localização: ICMC - Inst. Ciên. Mat. Computação    (T S478um e.1 )(Acessar)

  • Título:
    Um método para a fusão automática de sentenças similares em português
  • Autor: Eloize Rossi Marques Seno
  • Maria das Graças Volpe Nunes
  • Assuntos: PROCESSAMENTO DE LINGUAGEM NATURAL; INTELIGÊNCIA ARTIFICIAL; LINGUÍSTICA COMPUTACIONAL; TRADUÇÃO AUTOMÁTICA
  • Notas: Tese (Doutorado)
  • Descrição: Nos últimos anos, há um crescente interesse por aplicações do Processamento de Língua Natural (PLN) que processam uma coleção de textos sobre um mesmo assunto e produzem um novo texto de saída, quer seja um sumário ou uma resposta para uma dada pergunta. Para se produzir textos com qualidade, essas aplicações precisam lidar adequadamente com vários fenômenos, tais como a redundância, a contradição e a complementaridade de informações. Nesse contexto, um processo que permita a identificação de informações comuns em um conjunto de sentenças relacionadas, e gere uma nova sentença a partir da fusão de informações das sentenças de entrada, sem redundâncias e sem contradições, é de grande relevância para as aplicações que processam múltiplos textos. A fusão automática de sentenças é um tema de pesquisa relativamente recente na literatura de PLN e para a língua portuguesa, em particular, não se tem conhecimento de trabalhos dessa natureza. Neste trabalho propõe-se um método inédito para a fusão de sentenças similares em português, baseado em uma abordagem simbólica e independente de domínio, e produz-se o Zíper, um sistema de fusão sentencial que implementa o método proposto. O Zíper é o primeiro sistema a contemplar a geração de sentenças que expressam todas as informações das sentenças de entrada, ou seja, que representam a união do conjunto. Além disso, ele permite a geração de sentenças que expressam apenas as informações redundantes do conjunto (consideradas mais importantes),
    isto é, que representam a interseção das sentenças de entrada. O sistema foi avaliado intrinsecamente e os resultados obtidos mostram que, de modo geral, as sentenças produzidas são bem formadas e preservam a mensagem original do conjunto (isto é, a mensagem toda, na fusão por união e apenas a mensagem principal, na fusão por interseção). Zíper também foi avaliado extrinsecamente no contexto de um sumarizador multidocumento do português. Os resultados alcançados sugerem que o método proposto contribui para melhorar a qualidade dos sumários, reduzindo a redundância de informações, que frequentemente provoca a perda de coesão e de coerência
  • Data de criação/publicação: 2010
  • Formato: 157 p.
  • Idioma: Português

Buscando em bases de dados remotas. Favor aguardar.