Palestra: Modelos Híbridos Multi-Camadas para Business Analytics: Estimando os drivers da Duração da Interrupção de Energia dos consumidores da CEMIG-D

Track: Data Science aplicada

Sala: Sala 2

Horário: 10:50am - 11:35am

Dia da semana: Quarta-feira

Nível: Iniciante

Persona: Cientista de Dados, Desenvolvedor(a) Programador(a), Desenvolvedor(a) Sênior, Gerente de Operações, Gestão (VP, CTO, CIO, Diretoria)

Apresentação em Português

Share this on:

Pontos Principais

  • Aplicando modelos estatísticos de equações estruturais para reduzir a dimensão dos dados para a análise da duração de interrupção de energia dos consumidores da CEMIG-D.
  • Combinando modelos estatísticos e modelos de machine learning para aprimorar a estimação da duração da interrupção de energia. dos consumidores.
  • Aplicando métodos de regionalização espacial e modelos híbridos para melhoria de performance preditiva.

Resumo

A duração da interrupção de energia para consumidores (índice DEC) é um importante indicador da qualidade do serviço de distribuição de energia elétrica. A princípio, são inúmeras as características (features) que afetam o índice DEC dentre eles os investimentos, variáveis climáticas, dimensionamento das equipes de manutenção, a qualidade dos ativos elétricos, dentre outras. Neste trabalho, modelos de statistical science e machine learning são combinados para predizer, com máxima acurácia o índice DEC. Informações sobre os conjuntos elétricos da CEMIG-D são utilizados para estimar Structural Equation Models (Modelos de Equações Estruturais), ou seja, modelos estatísticos que apresentam máxima capacidade explicativa. Para aprimorar a capacidade preditiva para o índice DEC são utilizados modelos híbridos multicamadas. Esses modelos são baseados no método do Gradient Boosting, desenvolvido por Friedman (2001). Ao contrário de simplesmente utilizar os modelos e comparar os resultados, o foco é montar Modelos Híbridos Multi-Camadas para Business Analytics: o caso da CEMIG-Dum modelo híbrido de forma a alcançar máxima interpretabilidade e capacidade preditiva. No contexto de Business Analytics, o modelo deve ser capaz de caracterizar claramente os objetivos para a melhoria da qualidade da empresa o que favorece os modelos de Statistical Science, mas a capacidade preditiva é uma das características primordiais dos modelos de Machine Learning. Diferentes camadas são testadas utilizando métodos de Regression Trees (Árvores de Regressão), Random Forests (Florestas Aleatórias), xgboost e Artificial Neural Networks. Como a última camada do modelo híbrido, é utilizado um método de regionalização espacial (spatial clustering) para identificar regiões geográficas onde o índice DEC está acima ou abaixo do valor esperado. Para a empresa, o conhecimento das causas mais prováveis que afetam a qualidade dos seus serviços é fundamental para a sua gestão a melhoria dos seus retornos financeiros.

Palestrante: Marcelo Azevedo Costa

Professor Associado/Coordenador P&D CEMIG-D no. 0636 na Universidade Federal de Minas Gerais

Professor de Métodos Estatísticos Aplicados e Ciência dos Dados no departamento de Engenharia de Produção da Universidade Federal de Minas Gerais (UFMG) e membro do Programa de Pós-graduação em Engenharia de Produção (linha Modelagem Estocástica e Simulação) da mesma instituição. Possui graduação em Engenharia Elétrica pela UFMG, doutorado em Engenharia Elétrica pela mesma universidade (2002) na área de Inteligência Computacional, pós-doutorado pela Harvard Medical School & Harvard Pilgrim Health Care (2007) na área de Estatística Espacial e Vigilância Epidemiológica e pós-doutorado pela Linköping University (Suécia) na área de Análise Estatística, Diagnóstico e Detecção de Faltas em Ambientes Industriais. Possui publicações em importantes revistas nacionais e internacionais. É autor do livro Tópicos em Ciência dos Dados - Introdução dos modelos paramétricos e suas aplicações utilizando o R. Atualmente, coordena e participa como pesquisador sênior em projetos de P&D na área de ciência dos dados, em parceria com empresas públicas e privadas, e orienta alunos de graduação, especialização, mestrado e doutorado nos temas: estatística aplicada, estatística espacial, ciência dos dados, análise de séries temporais, teoria e análise de regressão, teoria e análise de redes neurais artificiais.

Find Marcelo Azevedo Costa at

Tracks