Utilize este identificador para referenciar este registo:
https://hdl.handle.net/1822/79939
Título: | Characterization of genetic variants in 70 portuguese individuals |
Autor(es): | Martins, Daniel Eduardo Fernandes |
Orientador(es): | Egas, Conceição Froufe, Hugo Mendes, Rui |
Palavras-chave: | Genómica Alterações genéticas Exomas Distribuição alélica População Genomics Variants Exomes Allele distribution Population |
Data: | 23-Nov-2018 |
Resumo(s): | A análise genómica das populações tem contribuído significativamente para o aumento do número de
SNVs descritos em bases de dados. Estudos populacionais prévios têm contribuído com 18 a 57% novas
variantes. A nova informação genética é particularmente relevante enquanto referência para propósitos
clínicos. Iniciativas à escala global como o 1000 Genomes Project (1kG) incluem populações Ibéricas,
contudo, nenhum indivíduo Português foi incluído no mesmo grupo. Tanto quanto se sabe, nenhum
indivíduo Português foi incluído no projeto gnomAD, o maior conjunto de dados genómicos atual.
Acreditamos que uma coleção de informação genómica referente à população Portuguesa poderia trazer
grandes benefícios ao diagnóstico molecular em pacientes Portugueses.
As alterações genéticas detetadas em 70 indivíduos Portugueses foram inseridas em uma base de dados
não-relacional. A informação publicada pelos projetos 1kG e gnomAD para cada alteração incluída nas
mesmas foi adicionada à referida base de dados. Frequências alélicas reportadas para sete populações
incluídas na base de dados do gnomAD, cinco populações do 1kG e 5 subpopulações Europeias do
mesmo projeto foram comparadas contra os valores calculados para os nossos dados. As diferenças das
distribuições alélicas foram testadas com o Fisher’s Exact test. Os p-values obtidos foram corrigidos de
acordo com a sua False Discovery Rate (FDR).
Os exomas de indivíduos Portugueses analisados continham 224,155 alterações genéticas filtradas de
acordo com critérios de qualidade definidos no presente estudo. Aproximadamente 16,4% das variantes
não se encontravam descritas nas bases de dados dos projetos 1kG e gnomAD. Os resultados obtidos
endossam evidências, previamente descritas na literatura, de uma correlação entre as diferenças
genéticas das populações comparadas em relação à população Portuguesa e a distância geográfica das
mesmas a Portugal. Diferenças significativas entre distribuições alélicas da população estudada e outras
subpopulações Europeias foram encontradas para 7,284 alterações genéticas distribuídas por 2,571
genes. Os resultados obtidos sugerem a existência de marcadores genéticos populacionais e podem
motivar futuros estudos com vista a detetar marcadores genéticos específicos da população Portuguesa.
O estudo apresentado representa uma contribuição significativa para, não só enriquecer iniciativas
genómicas de grande escala, mas também para estabelecer uma referência auxiliar para análises
genéticas a doentes Portugueses. The in-depth study of the genomics of single populations has contributed significantly to the enlargement of known SNVs in databases. Each single population study has contributed with 18 to 57% of novel SNVs. The new genetic information is particularly relevant as a reference for clinical purposes. Global-scale initiatives as the 1000 Genomes Project (1kG) already include Iberian population; however, no Portuguese individuals were included in this cohort. Furthermore, to our knowledge, gnomAD, the most extensive genomic dataset, does not include Portuguese individuals either. We believe that a Portuguese collection of genomic information would greatly benefit molecular diagnosis in Portuguese patients. Variants detected in 70 Portuguese individuals were inserted in a MongoDB No-SQL Database. The 1kG and gnomAD information for each variant were uploaded to the same database. Allele frequencies for seven gnomAD populations, five 1kG populations, and five 1kG European subpopulations were compared to the values calculated for our data. Allele distribution differences were tested with Fisher’s exact test. P-values were corrected for False Discovery Rate (FDR). The exomes of the Portuguese individuals contained 224,155 variants filtered accordingly to defined quality criteria. Approximately 16.4% of the variants had not been previously reported by 1kG or gnomAD projects. The present work endorsed the evidence for a correlation between genetic and geographic distance previously reported in the literature. Finally, significative differences were found for the allele distribution between our population and the other 1kG European subpopulations in 7,284 variants distributed by 2,571 genes. Results suggest the existence of populational genetic markers and may prompt future studies for detection of Portuguese-specific genetic markers. The present study is a significant contribution to enrich large-scale genomic initiatives and, to stand as a useful auxiliary reference for genetic analyses of Portuguese patients. |
Tipo: | Dissertação de mestrado |
Descrição: | Dissertação de mestrado em Bioinformática |
URI: | https://hdl.handle.net/1822/79939 |
Acesso: | Acesso aberto |
Aparece nas coleções: | BUM - Dissertações de Mestrado DI - Dissertações de Mestrado |
Ficheiros deste registo:
Ficheiro | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Daniel Eduardo Fernandes Martins.pdf | Dissertação de Mestrado | 8,34 MB | Adobe PDF | Ver/Abrir |