Utilize este identificador para referenciar este registo:
https://hdl.handle.net/1822/81097
Título: | Comparison of DNA sequencing technologies using sensory systems genes in bird genomes |
Autor(es): | Fernandes, Inês de Castro |
Orientador(es): | Antunes, Agostinho Rocha, Miguel |
Palavras-chave: | Sequencing technologies Sensory systems Bird species Gene extraction Tecnologias de sequenciação Sistemas sensoriais Espécies de aves Extração de genes |
Data: | 16-Jun-2020 |
Resumo(s): | Vertebrate sensory systems play a major role in the survival of species, since their fitness
and reproduction success depends on their ability to adapt to the surrounding environ mental conditions. Consequently, the sub-genomes of protein-coding genes responsible for
stimulus perception, are constantly undergoing selective pressures and mutational changes.
Birds are a very diverse group of organisms, about which there is still little information
regarding the genetic and molecular mechanisms that gave rise to the enormous variability
of phenotypes existing among species. However, due to the knowledge that has been ac quired about their sensory systems, birds have been considered a good model of study in
this area.
The sequencing of genomes, presents a great contribution to this theme and to the under standing of the influence of selective pressure in the modification of sub-genomes. However,
a major restriction on this area is related to the quality of sequencing. There are several tech nologies that allow the sequencing of genomes, although they differ in the method used.
One main difference is the size of the DNA reads generated. Technologies that are not so
recent (Sanger, Solexa and Illumina), are based on short reads sequencing, on the other
hand, more recent technologies (ex: PacBio) are based on long reads. Recently it has been
proposed that the sequencing methodology may have a huge influence on the genome as sembly process and on the quality of the generated sequence.
Considering this importance, the main purpose of this work was to compare the sequenc ing efficiency and quality of different technologies and to assess if the PacBio technology
presents an “advantage” over the rest. Thus, we selected five species of birds with genomes
that have been sequenced through older technologies and with the PacBio technology. From
this, several sets of genes from six different sensory systems were extracted, in order to ob tain a good representation of each system. The results obtained revealed that in four of the
systems, there are significant differences in the quality of sequencing between the “older”
technologies and PacBio. Specifically, in PacBio genomes there is a higher quality of se quencing with regard to the fragmentation of genes along the genomes (less fragmented
genes) as well as a higher quality in gene integrity (more complete and contiguous genes).
In addition, allowed us to corroborate previously conclusions proposed by related studies
that suggest that PacBio, and in this way, long read assembly, provides great improvements
in genome assembly and gene completeness, as well as improvements in sequencing more
complex genome regions. Os sistemas sensoriais dos vertebrados desempenham um papel fulcral para a sobrevivência das espécies, uma vez que o seu sucesso de fitness e reprodução depende da sua capacidade de adaptação às condições ambientais envolventes. Assim, os sub-genomas de genes codificantes de proteínas responsáveis por perceção de estímulos, estão constantemente a sofrer pressões seletivas e mutações. As aves, são um grupo de organismos bastante diverso, sobre as quais ainda existe pouca informação relativamente aos mecanismos genéticos e moleculares que deram origem à variabilidade de fenótipos existentes entre as espécies. No entanto, devido ao conhecimento que se tem vindo a adquirir acerca dos seus sistemas sensoriais, tem sido considerada um bom modelo de estudo nesta área. A sequenciação do genoma, apresenta-se um contributo para este tema e para a compreensão da influência da pressão seletiva na modificação dos sub-genomas. Porém, uma grande restrição nesta área relaciona-se com a qualidade de sequenciação das várias tecnologias, que diferem no método utilizado. Uma das principais diferenças é o tamanho das reads de DNA geradas. Tecnologias menos recentes (Sanger, Solexa e Illumina), baseiam a sequenciação em short reads, por outro lado, tecnologias mais recentes (ex: PacBio) baseiam-se nas long reads. Tem-se proposto que esta diferença poderá ter uma enorme influência no processo de sequenciação dos genomas. Considerando esta importância, o principal objetivo foi comparar a eficiência e qualidade de sequenciação de diferentes tecnologias e perceber se a tecnologia PacBio apresenta vantagens perante as restantes. Assim, selecionaram-se cinco espécies de aves com genomas que foram sequenciados através de tecnologias mais antigas e através da tecnologia PacBio. Destes, extraíram-se vários conjuntos de genes pertencentes a seis sistemas sensoriais, com o objetivo de obter uma boa representação de cada sistema. Os resultados revelaram que em quatro dos sistemas, existem diferenças significativas na qualidade de sequenciação entre tecnologias “mais antigas” e PacBio. Especificamente, nos genomas PacBio existe uma maior qualidade em termos de fragmentação dos genes ao longo dos genomas (genes menos fragmentados) assim como uma maior qualidade na integridade dos genes (genes mais completos e contíguos). Mais, permitiu-nos corroborar conclusões anteriormente reportadas por estudos relacionados, as quais sugeriam que PacBio, e assim, assemblies através de long reads, providencia uma grande melhoria na montagem de genomas e na obtenção de genes completos, assim como melhorias na sequenciação de regiões genómicas mais complexas. |
Tipo: | Dissertação de mestrado |
Descrição: | Dissertação de mestrado em Bioinformática |
URI: | https://hdl.handle.net/1822/81097 |
Acesso: | Acesso aberto |
Aparece nas coleções: | BUM - Dissertações de Mestrado |
Ficheiros deste registo:
Ficheiro | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Ines de Castro Fernandes.pdf | 2,98 MB | Adobe PDF | Ver/Abrir |
Este trabalho está licenciado sob uma Licença Creative Commons