Utilize este identificador para referenciar este registo: https://hdl.handle.net/1822/73665

TítuloImproving auditing and annotation of DNA barcode reference libraries of animal COI sequences for Molecular Ecology applications
Outro(s) título(s)Otimização da auditoria e anotação de bibliotecas de referência de DNA barcodes de sequências COI de animais para aplicações em Ecologia Molecular
Autor(es)Fontes, João Tadeu Silva
Orientador(es)Costa, Filipe O.
Soares, Pedro
Palavras-chaveDNA barcoding
DNA metabarcoding
Reference libraries
BOLD
R
Bibliotecas de referência
Data2020
Resumo(s)The uncovering and description of Earth’s biodiversity constitute an ongoing and incomplete chapter of the scientific endeavour. Fortunately, biodiversity studies have been greatly benefiting from molecular tools, such as DNA (meta)barcoding, which provide efficient identification tools for biomonitoring and conservation programmes. The accuracy of species-level assignments, and the taxonomic span of the identifications, relies on comprehensive DNA barcode reference libraries. However, the occurrence of accidental errors in libraries’ records may compromise the accuracy of species’ assignments, including the fortuitous operational flaws in the generation of the barcodes, the eventual taxonomic uncertainty or the occurrence of undescribed diversity. This study describes a web-accessible R-based application - BAGS (Barcode, Audit & Grade System) - that performs automated auditing and annotation of cytochrome c oxidase subunit I (COI) sequences libraries, retrieved from the Barcode of Life Data System (BOLD), for a given taxonomic group of animals. Several initial quality-filtering steps are implemented, as well as the optional filtering of species by their presence in marine and non-marine habitats. This is followed by the auditing and sorting of the barcode records for each species in the library, according to five qualitative grades (A to E) that depend on the attributes of the data and congruency of species names with sequences clustered in Barcode Index Numbers (BINs). Finally, BAGS’ reporting tool allows researchers to quickly audit and set aside the most useful and reliable data from the reference libraries, highlighting and segregating records according to their congruency. To verify BAGS’ performance and accuracy in grade annotation, successful tests were carried out in three large datasets comprising a) marine fishes of the world, b) Chironomidae of Europe (Insecta), and c) marine Amphipoda of the world (Crustacea). BAGS has the potential to fulfil a significant gap in the current landscape of DNA barcoding research tools by quickly screening reference libraries to gauge the congruence status of data and facilitate the triage of ambiguous data for posterior review. Thereby, BAGS may become a valuable addition in forthcoming DNA (meta)barcoding studies, in the long term contributing to globally improve the quality and reliability of the public reference libraries.
A descoberta e a descrição da biodiversidade na Terra constituem um capítulo contínuo e incompleto da atividade científica. Felizmente, os estudos de biodiversidade têm beneficiado de abordagens moleculares como o DNA (meta)barcoding, que constituem instrumentos de identificação eficientes para a biomonitorização e conservação. A precisão das identificações de espécies, e a sua abrangência taxonómica, dependem de bibliotecas de referência bem representadas. No entanto, a ocorrência de falhas operacionais, ou a incerteza taxonómica nos registros das bibliotecas, pode comprometer a precisão dessas identificações. Neste estudo foi desenvolvida uma aplicação web baseada em R - BAGS (Barcode, Audit & Grade System) - que executa a auditoria e a anotação automatizada de bibliotecas de barcodes da subunidade I do citocromo c oxidase (COI), obtidas através da Barcode of Life Data System (BOLD), para um dado grupo taxonómico de animais. A aplicação integra etapas iniciais de controlo de qualidade, bem como a opção de seleção ou exclusão de espécies marinhas das bibliotecas a auditar. A auditoria e triagem por espécie da biblioteca de referência é realizada de acordo com cinco categorias qualitativas (A a E), que dependem dos atributos dos dados e da congruência entre os nomes de espécie e as sequências agrupadas em Barcode Index Numbers (BINs). Finalmente, a criação de um relatório de auditoria permite que os utilizadores percecionem rapidamente a qualidade da biblioteca, segregando automaticamente os registos mais úteis e confiáveis de acordo com a sua congruência. Para verificar a performance da precisão da anotação das categorias do BAGS, realizámos testes em três grandes conjuntos de dados: a) peixes marinhos de todo o mundo, b) Chironomidae da Europa (Insecta), e c) anfípodes marinhos de todo o mundo (Crustacea). Esta ferramenta tem potencial para preencher uma lacuna significativa no paradigma atual das ferramentas de investigação para DNA barcoding, através do rastreamento das bibliotecas de referência de forma a avaliar o estado de congruência dos dados e consequentemente, facilitar a triagem de dados ambíguos para serem revistos. Deste modo, o BAGS pode tornar-se um complemento relevante em estudos de DNA (meta)barcoding, podendo a longo prazo contribuir para o aumento da qualidade e confiabilidade de bibliotecas de referência.
TipoDissertação de mestrado
DescriçãoDissertação de mestrado em Ecology
URIhttps://hdl.handle.net/1822/73665
AcessoAcesso aberto
Aparece nas coleções:BUM - Dissertações de Mestrado
DBio - Dissertações de Mestrado/Master Theses

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
Dissertação João Tadeu Silva Fontes.pdf2,28 MBAdobe PDFVer/Abrir

Este trabalho está licenciado sob uma Licença Creative Commons Creative Commons

Partilhe no FacebookPartilhe no TwitterPartilhe no DeliciousPartilhe no LinkedInPartilhe no DiggAdicionar ao Google BookmarksPartilhe no MySpacePartilhe no Orkut
Exporte no formato BibTex mendeley Exporte no formato Endnote Adicione ao seu ORCID