Processamento distribuído de grande volume de dados ambientais

Salles, Ricardo Frederico Figueiredo e

Use este identificador para citar ou linkar para este item: http://ri.ufmt.br/handle/1/5210

Tipo documento:	Dissertação
Título:	Processamento distribuído de grande volume de dados ambientais
Autor(es):	Salles, Ricardo Frederico Figueiredo e
Orientador(a):	Figueiredo, Josiel Maimone de
Membro da Banca:	Figueiredo, Josiel Maimone de
Membro da Banca:	Gomes, Raphael de Souza Rosa
Membro da Banca:	Preti, João Paulo Delgado
Resumo :	A pesquisa ambiental envolve uma grande diversidade de dados de diferentes origens que quando manipulados demandam a utilização de funções de alta com- plexidade computacional. Uma função que se enquadra nessas características é a transformada de wavelets, que é a transformação de uma série de dados temporais em diferentes escalas de frequência e tempo. Esse cálculo gera um alto volume de dados e requer elevado poder de processamento e armazenamento, características estas presentes no contexto de Big Data. O objetivo deste trabalho é aplicar técnicas de processamento paralelo e distribuído no contexto do cálculo de da- dos ambientais utilizando os frameworks Apache Hadoop e Apache Spark. Como metodologia, foi aplicada a transformada de wavelets em um grande volume de dados de precipitação de aproximadamente 15 anos gerados pela missão TRMM - Tropical Rainfall Measuring Mission. Foram feitos testes em diferentes configu- rações e ambientes, comparando os resultados com o processamento sequencial e outra abordagem distribuída.
Resumo em lingua estrangeira:	The environmental research involves a wide variety of data from different sources that when manipulated require the use of high computational complexity functi- ons. A function that fits on these characteristics is the wavelet transform, which is the transformation of a series of data in different temporal ranges of frequency and time. This calculation generates a high volume of data and requires high processing performance and storage. These characteristics are present in the con- text of Big Data. The objective of this work is to apply parallel and distributed processing technologies in the context of calculation of environmental data using the Apache Hadoop and Apache Spark frameworks. As a methodology, it was applied the wavelet transform into a large volume of rainfall data of about 15 years generated by TRMM mission - Tropical Rainfall Measuring Mission. Tests were done at different settings and environments, comparing the results with the sequential processing and other distributed approach.
Palavra-chave:	Hadoop Spark Paralelismo Big data Satélite Wavelets Precipitação
Palavra-chave em lingua estrangeira:	Hadoop Spark Parallelism Big data Satellite Wavelets Precipitation
CNPq:	CNPQ::CIENCIAS EXATAS E DA TERRA::FISICA
Idioma:	por
País:	Brasil
Instituição:	Universidade Federal de Mato Grosso
Sigla da instituição:	UFMT CUC - Cuiabá
Departamento:	Instituto de Física (IF)
Programa:	Programa de Pós-Graduação em Física Ambiental
Referência:	SALLES, Ricardo Frederico Figueiredo e. Processamento distribuído de grande volume de dados ambientais. 2016. 49 f. Dissertação (Mestrado em Física Ambiental) - Universidade Federal de Mato Grosso, Instituto de Física, Cuiabá, 2016.
Tipo de acesso:	Acesso Aberto
URI:	http://ri.ufmt.br/handle/1/5210
Data defesa documento:	24-Feb-2016
Aparece na(s) coleção(ções):	CUC – ICHS – PPGFil – Dissertações de mestrado

Arquivos deste item:

Arquivo	Descrição	Tamanho	Formato
DISS_2016_Ricardo Frederico Figueiredo e Salles.pdf		1.9 MB	Adobe PDF	Ver/Abrir

Mostrar registro completo do item Recomendar este item Visualizar estatísticas