Aplicação de Técnicas de captura e ingestão de Dados com Python e Spark Streaming

O Spark Streaming é uma extensão da API Spark central que permite o processamento de fluxo escalonável, com alto rendimento e tolerante a falhas de fluxos de dados ativos. Esta palestra tem como objetivo apresentar 03 estudos de casos de captura de dados em redes sociais e realizando o processo em em Ecosistema de Big DAta - PySpark e Hadoop, HDFS entre outros. Aplicando técnicas de MACHINE LEARNING com algoritmos de Classificação e Regressão. Realizando práticas e apresentando os resultados.