Palestra: Abrindo a Caixa Preta do Machine Learning: Classificação de Textos no Grupo ZAP

Track: Machine Learning e Inteligência Artificial

Sala: Sala 2

Horário: 10:50am - 11:35am

Dia da semana: Terça-feira

Nível: Intermediário

Persona: Cientista de Dados, Gerente de Produto, Gestão (VP, CTO, CIO, Diretoria), Líder Técnico(a), UX

Apresentação em Português

Share this on:

Pontos Principais

  • A importância de se conseguir explicar as predições de modelos, dos pontos de vista do data scientist, de negócio e dos usuários do modelo.
  • Interpretabilidade na prática, independente da complexidade do modelo.
  • Abordagens para visualização de explicações em problemas de NLP.

Resumo

Até pouco tempo, não existiam técnicas consolidadas para se conseguir explicar predições feitas por modelos de Machine Learning. Isso fazia com que os data scientists tivessem que pesar a utilização de modelos com melhores métricas versus de modelos que tivessem sido treinados com algoritmos mais simples de se explicar. No entanto, a comunidade teve grandes avanços recentemente que nos permitem, de forma agnóstica à complexidade do modelo, explicar suas predições e até entender o que ele aprendeu.

Nessa talk, nós vamos mostrar como essas novas técnicas funcionam na prática, trazendo um case do Grupo ZAP em que utilizamos modelos de NLP para se classificar descrições dos anúncios imobiliários. Um dos modelos foi treinado com td-idf, uma técnica mais tradicional e intuitiva, enquanto o outro é mais complexo, tendo sido criado com avanços recentes em deep learning.

Nós mostraremos como conseguimos explicar cada predição feita pelos modelos e como isso também permite com que os Data Scientists consigam interpretar o que cada modelo aprendeu como um todo. Também faremos um comparativo de alternativas para a visualização das explicações em problemas de classificação de texto.

Palestrante: Gabriel Cypriano

Data Scientist no Grupo ZAP

Gabriel Cypriano é Data Scientist no Grupo ZAP e instrutor de Data Science na Tera. Ele também atuou com Data Science na Creditas e no K2 Data Science. Gabriel descobriu o mundo do Machine Learning ao co-fundar Songwich, uma startup de recomendação de música.

Find Gabriel Cypriano at

Tracks

    Segunda-feira, 14 de Dezembro

  • Arquiteturas que você sempre quis conhecer

    Segredos arquiteturais de aplicações populares, com milhões de pessoas usuárias e que nunca saem do ar.

  • Engenharia aplicada a Machine Learning

    Conheça as principais técnicas de engenharia  e arquitetura de software de larga escala aplicadas a Machine Learning.

  • Java e JVM em evolução

    Performance, escalabilidade e as mais recentes novidades da principal plataforma de desenvolvimento no Brasil e no mundo.

  • JavaScript: a plataforma da web moderna

    Explore profundamente os frameworks que tornam o JavaScript tão popular e saiba como as linguagens baseadas em JavaScript estão evoluindo o desenvolvimento de front-end (e back-end).

  • AMA (Ask Me Anything)

    Discussões mais profundas com palestrantes do QCon São Paulo.

  • Solutions Track

    Conheça soluções, ferramentas e técnicas de empresas parceiras do QCon São Paulo.

  • Terça-feira, 15 de Dezembro

  • Construindo culturas de desenvolvimento duradouras

    Criando e evoluindo a cultura de empresas: novas formas de organizar times com foco em produtividade.

  • Arquiteturas de vanguarda

    Conheça as tendências em técnicas, práticas e princípios que norteiam o estado da arte em arquitetura de software e podem ser alavancas não só para times e organizações de tecnologia, mas para os negócios, nos próximos anos.

  • Machine Learning e Inteligência Artificial

    Algoritmos, técnicas e ferramentas: o que está por trás de sistemas e soluções cada vez mais assertivos.

  • Ciência da Computação no mundo real

    Temas avançados em computação. Técnicas clássicas e modernas direto da academia para o seu código.

  • AMA (Ask Me Anything)

    Discussões mais profundas com palestrantes do QCon São Paulo.

  • Solutions Track #2

    Conheça soluções, ferramentas e técnicas de empresas parceiras do QCon São Paulo.

  • Quarta-feira, 16 de Dezembro

  • Microservices: melhores práticas e padrões

    Frameworks modernos e os desafios de implantação, gestão e pós-produção

  • Software Supply Chain

    Todas as fases do ciclo de vida de um artefato de software, do primeiro commit até o deployment. Segurança, observabilidade, genealogia e gestão de toda a sua cadeia de suprimentos de software

  • Data Science aplicada

    Tecnologias e as boas práticas da ciência de dados trazendo ganho e diferencial competitivo para grandes empresas.

  • Linguagens Contemporâneas

    Linguagens e plataformas emergentes, com ênfase em linguagens projetadas para alta concorrência e sistemas distribuídos.

  • Levando sua carreira para o próximo nível

    Habilidades e estratégias para destravar sua carreira e potencializar seu desenvolvimento profissional.

  • Solutions Track #3

    Conheça soluções, ferramentas e técnicas de empresas parceiras do QCon São Paulo.