Palestra: Abrindo a Caixa Preta do Machine Learning: Classificação de Textos no Grupo ZAP

Track: Machine Learning e Inteligência Artificial

Sala: Sala 2

Horário: 10:50am - 11:35am

Dia da semana: Terça-feira

Nível: Intermediário

Persona: Cientista de Dados, Gerente de Produto, Gestão (VP, CTO, CIO, Diretoria), Líder Técnico(a), UX

Apresentação em Português

Share this on:

Pontos Principais

  • A importância de se conseguir explicar as predições de modelos, dos pontos de vista do data scientist, de negócio e dos usuários do modelo.
  • Interpretabilidade na prática, independente da complexidade do modelo.
  • Abordagens para visualização de explicações em problemas de NLP.

Resumo

Até pouco tempo, não existiam técnicas consolidadas para se conseguir explicar predições feitas por modelos de Machine Learning. Isso fazia com que os data scientists tivessem que pesar a utilização de modelos com melhores métricas versus de modelos que tivessem sido treinados com algoritmos mais simples de se explicar. No entanto, a comunidade teve grandes avanços recentemente que nos permitem, de forma agnóstica à complexidade do modelo, explicar suas predições e até entender o que ele aprendeu.

Nessa talk, nós vamos mostrar como essas novas técnicas funcionam na prática, trazendo um case do Grupo ZAP em que utilizamos modelos de NLP para se classificar descrições dos anúncios imobiliários. Um dos modelos foi treinado com td-idf, uma técnica mais tradicional e intuitiva, enquanto o outro é mais complexo, tendo sido criado com avanços recentes em deep learning.

Nós mostraremos como conseguimos explicar cada predição feita pelos modelos e como isso também permite com que os Data Scientists consigam interpretar o que cada modelo aprendeu como um todo. Também faremos um comparativo de alternativas para a visualização das explicações em problemas de classificação de texto.

Palestrante: Gabriel Cypriano

Data Scientist no Grupo ZAP

Gabriel Cypriano é Data Scientist no Grupo ZAP e instrutor de Data Science na Tera. Ele também atuou com Data Science na Creditas e no K2 Data Science. Gabriel descobriu o mundo do Machine Learning ao co-fundar Songwich, uma startup de recomendação de música.

Find Gabriel Cypriano at

Tracks