Utilize este identificador para referenciar este registo: https://hdl.handle.net/1822/64545

TítuloAn interactive and integrative manager of genetic variants information
Autor(es)Lemos, Diana Maria Guimarães
Orientador(es)Oliveira, Joana Morais Ferreira
Mendes, Rui
Palavras-chavegenetic variants
functional annotation
variants classification
data analysis
variantes genéticas
anotação funcional
classificação de variantes
análise de dados
Data7-Dez-2016
Resumo(s)New sequencing technologies produce a huge amount of information that characterizes human genome sequence. Through several steps and appropriate software tools, variants present in the DNA can be uncovered. The study of these variants is crucial to understand the effects they have on phenotypic traits. Bioinformatics tools that predict the functional impact and disease susceptibility of such variants already exist. However, it has not yet been implemented a tool that aggregates that information and allows to select and manage the data in a user-friendly way. For this reason, the project first main goal is to annotate variants derived from next-generation sequencing (NGS) experiments, using data from multiple online databases. The second and most important aim is to classify these variants based on the collected data from the selected databases. To validate the implemented software Annotator, we have used it to re-analyze two independent VCF files, derived from the sequencing of two patients with a given disease/condition that have been previously analysed using a different and laborious pipeline. The comparison of the results obtained with the previous bioinformatics analysis with those produced using Annotator demonstrate that the Annotator is able to classify the variants based on diverse bioinformatics tools, and on evidence found in collected data from relevant databases, in particular Uniprot, OMIM, ClinVar, dbSNP and SNPedia. Moreover, Annotator derived analysis was faster than the previously used analysis, that was based on manual curation. In conclusion, we believe that the implemented software is a valid tool for a fast, accurate and efficient analysis of variants derived from sequencing experiments in a clinical context.
Novas tecnologias de sequenciamento produzem uma grande quantidade de informação que caracteriza a sequência do genoma humano. Através de diversos passos e ferramentas de software apropriadas, as variantes presentes no DNA podem ser identificadas. O estudo dessas variantes é crucial para entender os seus efeitos. Ferramentas bioinformáticas que fazem a previsão do impacto funcional e da suscetibilidade de doenças de tais variantes, já existem. No entanto, ainda não foi implementado uma ferramenta que agrega essa informação e possibilite selecionar e manusear os dados. Por esta razão, o primeiro objetivo deste projeto é completar a anotação de variantes resultantes de sequenciamento de próxima geração (NGS) para isso utilizando dados de bases de dados online. O segundo e mais importante objetivo é classificar essas variantes com base nos dados recolhidos das bases de dados selecionadas. Para validar o software implementado, Annotator, nós utilizámo-lo para reanalisar dois ficheiros VCF distintos, resultantes da sequenciação de dois pacientes com determinada doença/condição que já tinham sido analisados por uma pipeline diferente. A comparação dos resultados obtidos pela análise anteriormente feita e dos resultados obtidos no Annotator, demonstra que o Annotator é capaz de classificar as variants com base em diversas ferramentas bioinformáticas e em evidências encontradas em bases de dados relevantes, em particular Uniprot, OMIM, ClinVar, dbSNP e SNPedia. Além disso, a análise resultante do Annotator foi mais rápida do que a análise anteriormente feita, que foi maioritariamente manual. Em conclusão, nós acreditamos que o software implementado é uma ferramenta válida para uma rápida, precisa e eficiente de classificação de variantes resultantes de sequenciação num contexto clínico.
TipoDissertação de mestrado
DescriçãoDissertação de Mestrado em Bioinformática
URIhttps://hdl.handle.net/1822/64545
AcessoAcesso restrito UMinho
Aparece nas coleções:BUM - Dissertações de Mestrado
CEB - Dissertações de Mestrado / MSc Dissertations

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
Diana Maria Guimaraes Lemos.pdf
Acesso restrito!
Dissertação de Mestrado1,6 MBAdobe PDFVer/Abrir

Partilhe no FacebookPartilhe no TwitterPartilhe no DeliciousPartilhe no LinkedInPartilhe no DiggAdicionar ao Google BookmarksPartilhe no MySpacePartilhe no Orkut
Exporte no formato BibTex mendeley Exporte no formato Endnote Adicione ao seu ORCID