Track: Big Data e Machine Learning Aplicados

Sala:

Dia da semana:

Data Science é um campo interdisciplinar e emergente da computação; uma interseção entre ciência da computação, estatística, visualização de dados e ciências sociais. Esta track abrange as técnicas e ferramentas necessárias para se tornar um data scientist e as formas nas quais esse profissional, hoje em altíssima demanda, pode potencializar e fortalecer o negócio de sua empresa. Venha aprender como estruturar e otimizar seu Big Data, aplicar algoritmos de machine learning e realizar a análise de dados em tempo real.

11:05am - 11:55am

Por Andrew Hart
CTO of Pogoseat, data science consultant & NASA engineer for 7 yrs

Apache Spark has gained recognition in the developer community for being a highly performant, versatile workhorse for efficiently processing large volumes of data. Many have heard of the remarkable performance gains that Spark achieves over traditional Hadoop by keeping working data entirely in memory. But there is more to the story. At its core Spark provides an alternative way of thinking about processing Big Data. In particular:​

  • Spark employs a computational model that is...
12:10pm - 1:00pm

Por Everton Gago
Engenheiro de Software na Dextra

Esta palestra apresenta na prática as principais técnicas para classificação de documentos, através do uso do Apache Mahout, a popular biblioteca Java para aprendizado de máquina. Conceitos serão aplicados em uma série de técnicas e algoritmos como: Naive Bayes, Regressão Logística e Processamento de Linguagem Natural.

A dinâmica da palestra passará pela discussão de diferentes cenários de uso para cada algoritmo, bem como suas vantagens e desvantagens. Ao final, apresentaremos um...

2:40pm - 3:30pm

Por Fabiano Santos
Engenheiro de Data Science na Elo7

A integração do sistema de mensageria Kafka com Spark Streaming é uma solução poderosa que tem sido utilizada para resolver diversos problemas de Big Data. Mas existem diferentes modos de integração entre essas ferramentas, cada um com suas vantagens e desvantagens. Nessa palestra vamos compartilhar a experiência adquirida ao construir uma arquitetura que utiliza Kafka como fonte de dados para o processamento de milhões de mensagens, integrado a Spark Streaming para um dos maiores e-...

3:55pm - 4:45pm

Por Diógenes Justo
Gerente na BM&FBOVESPA

Em Data Science temos a grande tarefa de domar imensos contingentes de dados, além de armazená-los e gerenciá-los; suamos, criamos tecnologias colossais para gerenciamento de dados distribuídos mas... e agora? Como extrair valor e gerar soluções e decisões a partir desta montanha de dados?

Todo cientista de dados necessita um pouco de background matemático e estatístico para compreender e conceber modelos – sejam esses modelos descritivos ou preditivos. Além disso, precisa saber...

5:00pm - 5:50pm

Por Bill Kayser
Distinguished Engineer at New Relic

In this talk we’ll use real-world application data to illustrate key concepts in visualizing and analyzing time series performance metrics. We’ll scrutinize heatmaps, frequency charts, histograms, rug plots, box plots, scatter plots and other visualizations, breaking down their strengths and weaknesses and assess cost/benefit tradeoffs.

​We also cover statistical properties of time series data, comparing summary metrics and breaking down different kinds of distributions present in...

6:15pm - 7:05pm

Por Fabiane Nardon
Chief Scientist na TailTarget e Java Champion

É inegável o crescimento das áreas de Big Data e Data Science nos últimos anos – mas estas ainda são áreas emergentes em que novas técnicas e ferramentas surgem constantemente. Nesse cenário, é importante usar a experiência de quem já processou muitos bilhões de tuplas para encontrar atalhos e não repetir erros.

Nesse painel, Fabiane Nardon, veterana em Big Data e analytics, e responsável pelo processamento de um dos maiores datasets do Brasil, convida os outros palestrantes da track...

Host: Fabiane Nardon Chief Scientist na TailTarget e Java Champion

Tracks

Segunda-feira

Terça-feira

Quarta-feira