Palestra: Criando sistemas de processamento de linguagem natural na prática: lições aprendidas na busca por insights em dados não estruturados

Sala:

Dia da semana:

4:40pm - 5:30pm

Nível da palestra:

Persona:

Apresentação em Português

Pontos principais

  • Processamento de linguagem natural com software livre;
  • Superando desafios do processamento da língua portuguesa;
  • Construindo de pipelines de PLN em nível profissional.

Resumo

Extrair informações a partir de dados não-estruturados, tais como documentos, mensagens, notícias e posts em redes sociais, é um problema que vem ganhando cada vez mais importância no dia-a-dia do Cientista de Dados. Nesse contexto, o processamento de linguagem natural (PLN) tem um papel fundamental.

Nesta palestra, veremos como utilizar o Apache OpenNLP nesses desafios e como é o seu suporte a língua portuguesa. Serão realizados experimentos com os modelos existentes e com modelos novos, desenvolvidos de forma personalizada para atacar problemas específicos de um dataset. A dinâmica da apresentação passa pelas técnicas de avaliação e tuning dos modelos, como o de entidades nomeadas, além da construção de pipelines de enriquecimento para PLN e suas aplicações reais.

Tracks

Quarta-feira

  • Engenharia de Dados

    Armazenando e processando Big Data com eficiência.

  • Microservices e Web APIs

    Da ubiquidade das APIs a microservices ultra-modulares, frameworks modernos e os desafios de implantação, gestão e pós-produção.

  • JavaScript e Web

    Desenvolvimento com HTML5, JS, CCS3, HTTP/2 e novas tendências da web moderna.

  • IoT: Tecnologias do Mundo Real

    Conheça experiências de mundo real em IoT, bem como tecnologias que vão habilitar os próximos grandes avanços desta revolução.

  • Solutions Track #1

    Conheça soluções, ferramentas e técnicas de empresas parceiras do QCon São Paulo.

Quinta-feira

Sexta-feira

  • Data Science Aplicada

    Da teoria à prática: como grandes cases do Brasil e do mundo têm utilizado DataScience para alavancar seus negócios.

  • Containers: o Estado da Arte

    Muito mais do que uma tecnologia, Containers são uma plataforma. Qual é o estado da arte, novidades, tendências e casos de uso sobre esta revolução.

  • Ciência da Computação no Mundo Real

    Temas discutidos na academia que podem nos ajudar a obter melhores resultados em nosso dia-a-dia.

  • Linguagens do Século 21

    Linguagens e plataformas emergentes no server-side, com ênfase em linguagens projetadas especificamente para alta concorrência e sistemas distribuídos.

  • Carreira e Soft-Skills

    Profissionais de sucesso vão muito além das suas habilidades em escrever código. Como potencializar seu desenvolvimento como profissional.