Utilize este identificador para referenciar este registo:
https://hdl.handle.net/1822/79989
Título: | Performance tuning to determine electronic properties of materials with Quantum Espresso |
Outro(s) título(s): | Ajuste de desempenho para determinar propriedades eletrónicas de materiais com Quantum Espresso |
Autor(es): | Caldas, Sérgio Manuel Rodrigues |
Orientador(es): | Proença, Alberto José Ribeiro, R. M. |
Palavras-chave: | Biblioteca ELPA Computação paralela Disselénio de tungsténio Eficiência computacional Intel KNL Quantum Espress Computational efficiency ELPA-library Parallel computing Tungsten diselenide |
Data: | 23-Dez-2019 |
Resumo(s): | Desde os anos 70, a teoria do funcional da densidade tem sido uma das técnicas mais
utilizadas em física quântica para resolver a equação de Schrödinger, para determinar as
propriedades eletrónicas dos materiais, usando funções de onda eletrónica e a energia de
cada eletrão. O método de resolução do campo autoconsistente (sigla em inglês SCF) é um
processo iterativo que calcula a densidade dos eletrões a partir de funções de onda. Estes
cálculos com a equação de Schrödinger são realizados múltiplas vezes de forma sucessiva
até se atingir a convergência autoconsistente.
O SCF neste processo iterativo é atualmente calculado em pacotes de software dedicado,
como o Quantum ESPRESSO (QE), um produto open-source em Fortran 90, para cálculo da
estrutura eletrónica dos materiais. Sendo estes cálculos computacionalmente intensivos, a
sua execução paralela permite melhorar o desempenho do processo de cálculo. O Quantum
ESPRESSO (QE) suporta paralelismo em ambiente de memória distribuída, com message
passing interface (MPI) e, mais recentemente, em memória partilhada, com OpenMP.
A presente dissertação apresenta várias propostas de instalação e configuração desta fer ramenta. Estas propostas sugerem diferentes estratégias de paralelismo tendo em vista
obter melhorias de desempenho deste tipo de simulações, comparativamente a um estudo
anterior realizado nas mesmas condições de experimentação. Para o presente estudo foram
utilizados processadores multicore e many-core do cluster SeARCH. Estes testes exploraram
o impacto de versões multiprocesso com múltiplos fios de execução por processo, introduzi das em versões mais recentes do QE com desenvolvimento de paralelizações híbridas.
Através de diferentes casos de teste, diferentes instalações e parâmetros configuráveis
(número de pools) este trabalho explorou e procurou obter um ambiente de execução que
melhor favorecia o desempenho de simulações do tungsten diselenide (WSe2) no cluster
SeARCH. Os resultados obtidos nestes testes, onde se aconselham certas configurações e
se desaconselham outras, destinam-se a ajudar as comunidades de Física a encontrar um
ambiente de execução afinado em termos de desempenho, para o caso concreto deste tipo
de simulações. Since the 70’s, density functional theory (DFT) has been one of the most used techniques in quantum physics to solve the Schrödinger equation. The resolution of this equation assumes a prominent role in the characterization of the electronic properties of the materials, with the use of wave functions and the energy of each electron. The computation method follows an iterative process, known as self consistent field (SCF), to compute the electrons density from an initial set of wave functions. This iterative process successively recurs to the Schrödinger equation until it reaches a self-consistence convergence. The SCF computation uses QE, an open-source software package written in Fortran 90, to determine the electronic structure of materials. This calculation is computationally very intensive, requiring an adequate support for parallelism to improve the computation per formance to reach the convergence point. The QE already has message passing interface (MPI) support for distributed memory systems and recently introduced support for shared memory parallelization with OpenMP. This dissertation presents alternative approaches to adequately install and configure QE in a compute cluster with distributed memory nodes, where each node contains one or more multicore devices sharing the same memory address space. These approaches suggest different parallelism strategies that will reflect performance improvements on simulations, when compared to an earlier study, conducted under the same experimental conditions. The testbed uses multicore and many-core processors from the SeARCH cluster to mea sure the impact of multi-process simulations with multiple threads per process, recently introduced in QE with hybrid parallelizations. Using different case studies and through different installations and parameters config urations (number of pools), this work explored and aimed to reach an efficient execution environment for the simulations of tungsten diselenide (WSe2) in the SeARCH cluster. The obtained results in the experimental tests aim to help Physics communities to find the best performance environment for this type of simulations. |
Tipo: | Dissertação de mestrado |
Descrição: | Dissertação de mestrado em Computer Science |
URI: | https://hdl.handle.net/1822/79989 |
Acesso: | Acesso aberto |
Aparece nas coleções: | BUM - Dissertações de Mestrado DI - Dissertações de Mestrado |
Ficheiros deste registo:
Ficheiro | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Sergio Manuel Rodrigues Caldas.pdf | Dissertação de Mestrado | 4,33 MB | Adobe PDF | Ver/Abrir |
Este trabalho está licenciado sob uma Licença Creative Commons