Use este identificador para citar ou linkar para este item:
http://ri.ufmt.br/handle/1/5210
Tipo documento: | Dissertação |
Título: | Processamento distribuído de grande volume de dados ambientais |
Autor(es): | Salles, Ricardo Frederico Figueiredo e |
Orientador(a): | Figueiredo, Josiel Maimone de |
Membro da Banca: | Figueiredo, Josiel Maimone de |
Membro da Banca: | Gomes, Raphael de Souza Rosa |
Membro da Banca: | Preti, João Paulo Delgado |
Resumo : | A pesquisa ambiental envolve uma grande diversidade de dados de diferentes origens que quando manipulados demandam a utilização de funções de alta com- plexidade computacional. Uma função que se enquadra nessas características é a transformada de wavelets, que é a transformação de uma série de dados temporais em diferentes escalas de frequência e tempo. Esse cálculo gera um alto volume de dados e requer elevado poder de processamento e armazenamento, características estas presentes no contexto de Big Data. O objetivo deste trabalho é aplicar técnicas de processamento paralelo e distribuído no contexto do cálculo de da- dos ambientais utilizando os frameworks Apache Hadoop e Apache Spark. Como metodologia, foi aplicada a transformada de wavelets em um grande volume de dados de precipitação de aproximadamente 15 anos gerados pela missão TRMM - Tropical Rainfall Measuring Mission. Foram feitos testes em diferentes configu- rações e ambientes, comparando os resultados com o processamento sequencial e outra abordagem distribuída. |
Resumo em lingua estrangeira: | The environmental research involves a wide variety of data from different sources that when manipulated require the use of high computational complexity functi- ons. A function that fits on these characteristics is the wavelet transform, which is the transformation of a series of data in different temporal ranges of frequency and time. This calculation generates a high volume of data and requires high processing performance and storage. These characteristics are present in the con- text of Big Data. The objective of this work is to apply parallel and distributed processing technologies in the context of calculation of environmental data using the Apache Hadoop and Apache Spark frameworks. As a methodology, it was applied the wavelet transform into a large volume of rainfall data of about 15 years generated by TRMM mission - Tropical Rainfall Measuring Mission. Tests were done at different settings and environments, comparing the results with the sequential processing and other distributed approach. |
Palavra-chave: | Hadoop Spark Paralelismo Big data Satélite Wavelets Precipitação |
Palavra-chave em lingua estrangeira: | Hadoop Spark Parallelism Big data Satellite Wavelets Precipitation |
CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::FISICA |
Idioma: | por |
País: | Brasil |
Instituição: | Universidade Federal de Mato Grosso |
Sigla da instituição: | UFMT CUC - Cuiabá |
Departamento: | Instituto de Física (IF) |
Programa: | Programa de Pós-Graduação em Física Ambiental |
Referência: | SALLES, Ricardo Frederico Figueiredo e. Processamento distribuído de grande volume de dados ambientais. 2016. 49 f. Dissertação (Mestrado em Física Ambiental) - Universidade Federal de Mato Grosso, Instituto de Física, Cuiabá, 2016. |
Tipo de acesso: | Acesso Aberto |
URI: | http://ri.ufmt.br/handle/1/5210 |
Data defesa documento: | 24-Fev-2016 |
Aparece na(s) coleção(ções): | CUC – ICHS – PPGFil – Dissertações de mestrado |
Arquivos deste item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
DISS_2016_Ricardo Frederico Figueiredo e Salles.pdf | 1.9 MB | Adobe PDF | Ver/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.