skip to main content

Classificação taxonômica de sequências obtidas com meta-ômicas por meio de integração de dados

Lima, Felipe Prata

Biblioteca Digital de Teses e Dissertações da USP; Universidade de São Paulo; Bioinformática 2019-08-20

Acesso online. A biblioteca também possui exemplares impressos.

  • Título:
    Classificação taxonômica de sequências obtidas com meta-ômicas por meio de integração de dados
  • Autor: Lima, Felipe Prata
  • Orientador: Setubal, João Carlos
  • Assuntos: Análise Taxonômica; Bioinformática; Integração De Dados; Meta-Ômicas; Bioinformatics; Data Integration; Meta-Omics; Taxonomic Analysis
  • Notas: Tese (Doutorado)
  • Notas Locais: Programa Interunidades de Pós-graduação em Bioinformática
  • Descrição: Comunidades microbianas possuem papéis importantes em processos que ocorrem em diversos ambientes, tais como solos, oceanos e o trato gastrointestinal dos seres humanos. Portanto, é de interesse a compreensão da estrutura e do funcionamento dessas comunidades. A estrutura dessas comunidades, em termos de organismos componentes, pode ser determinada com o uso do sequenciamento de nova geração em conjunto com as técnicas meta-ômicas e pela análise taxonômica das sequências obtidas com programas de classificação taxonômica. Se por um lado diversos programas estão disponíveis, por outro lado eles cometem erros, como a identificação parcial dos organismos presentes na amostra e a identificação de organismos que não estão presentes na amostra (os falsos positivos - FPs). Algumas abordagens foram propostas para a melhoria das classificações taxonômicas obtidas por esses programas com a redução desses FPs, porém elas abordam apenas um tipo de meta-ômica, a metagenômica. Neste trabalho, propomos uma nova abordagem através da integração de diferentes meta-ômicas - metagenômicas shotgun e de amplicons de 16S, e metatranscritômica. Exploramos os resultados de classificações de dados simulados e mocks para a extração de variáveis e desenvolvemos modelos de classificação para discriminação de predições de espécies de bactérias classificadas como corretas ou incorretas. Comparamos o desempenho dos resultados obtidos entre as meta-ômicas individuais e os obtidos através da integração observando o balanceamento entre a precisão e a sensibilidade. De acordo com as medidas calculadas com nossos conjuntos de dados, nossa abordagem demonstrou melhorias na classificação com a redução de FPs e aumentos para a medida F1, quando comparada com abordagens não integrativas, inclusive com o uso de métodos de combinação de classificadores. Para facilitar seu uso, desenvolvemos o Gunga, uma ferramenta que incorpora a abordagem desenvolvida em formato de pacote do R, com funcionalidades para a integração de dados de classificação taxonômica com diferentes meta-ômicas e a classificação das predições incorretas.
  • DOI: 10.11606/T.95.2019.tde-17092019-002727
  • Editor: Biblioteca Digital de Teses e Dissertações da USP; Universidade de São Paulo; Bioinformática
  • Data de criação/publicação: 2019-08-20
  • Formato: Adobe PDF
  • Idioma: Português

Buscando em bases de dados remotas. Favor aguardar.