Track: Data Science aplicada

Sala: Sala 2

Dia da semana: Quarta-feira

A ciência de dados aplicada aos negócios tem mostrado resultados surpreendentes, onde a lógica pode superar a criatividade e os fatos superam as crenças. Esta trilha vai mostrar como grandes empresas do Brasil e do mundo têm usado as técnicas de ciência de dados para alavancar seus negócios com dados coletados, analisados e transformados de forma prática e em escala. Usando algoritmos simples a sistemas complexos baseados em Machine Learning e IA, engenheiros têm mudado como os negócios encaram seus desafios.

Track Host: Gleicon Moraes

VP de Engenharia no Nubank

Gleicon Moraes atua construindo e consertando sistema distribuídos e de larga escala há mais de 20 anos, mantém projetos opensource em Python e Go. Se interessa por problemas de sistemas de larga escala e volume de dados. Escreveu dois livros: “Programação Avançada em Linux” em 2005 pela Novatec e “Caixa de Ferramentas Devops” pela Casa do Código. Trabalhou em empresas como Terra, UOL, Locaweb, Luizalabs e Lucid. Atualmente é VP de Engenharia no Nubank.

10:50am - 11:35am

Modelos Híbridos Multi-Camadas para Business Analytics: Estimando os drivers da Duração da Interrupção de Energia dos consumidores da CEMIG-D

A duração da interrupção de energia para consumidores (índice DEC) é um importante indicador da qualidade do serviço de distribuição de energia elétrica. A princípio, são inúmeras as características (features) que afetam o índice DEC dentre eles os investimentos, variáveis climáticas, dimensionamento das equipes de manutenção, a qualidade dos ativos elétricos, dentre outras. Neste trabalho, modelos de statistical science e machine learning são combinados para predizer, com máxima acurácia o índice DEC. Informações sobre os conjuntos elétricos da CEMIG-D são utilizados para estimar Structural Equation Models (Modelos de Equações Estruturais), ou seja, modelos estatísticos que apresentam máxima capacidade explicativa. Para aprimorar a capacidade preditiva para o índice DEC são utilizados modelos híbridos multicamadas. Esses modelos são baseados no método do Gradient Boosting, desenvolvido por Friedman (2001). Ao contrário de simplesmente utilizar os modelos e comparar os resultados, o foco é montar Modelos Híbridos Multi-Camadas para Business Analytics: o caso da CEMIG-Dum modelo híbrido de forma a alcançar máxima interpretabilidade e capacidade preditiva. No contexto de Business Analytics, o modelo deve ser capaz de caracterizar claramente os objetivos para a melhoria da qualidade da empresa o que favorece os modelos de Statistical Science, mas a capacidade preditiva é uma das características primordiais dos modelos de Machine Learning. Diferentes camadas são testadas utilizando métodos de Regression Trees (Árvores de Regressão), Random Forests (Florestas Aleatórias), xgboost e Artificial Neural Networks. Como a última camada do modelo híbrido, é utilizado um método de regionalização espacial (spatial clustering) para identificar regiões geográficas onde o índice DEC está acima ou abaixo do valor esperado. Para a empresa, o conhecimento das causas mais prováveis que afetam a qualidade dos seus serviços é fundamental para a sua gestão a melhoria dos seus retornos financeiros.

Marcelo Azevedo Costa, Professor Associado/Coordenador P&D CEMIG-D no. 0636 na Universidade Federal de Minas Gerais

11:50am - 12:35pm

A Definir

Sandor Caetano, Chief Data Scientist at IFood

4:05pm - 4:50pm

A Definir

Everton Gago, Head of Data Science na Dextra

5:20pm - 6:05pm

A Definir

Daniel Cassiano, Diretor de Tecnologia no Magazine Luiza

Tracks 2019