Abrindo a Caixa Preta:

como interpretar (Com R, claro)

Algoritmos de Classificação

Vinícius M. de Sousa
in/viniciusmsousa/
github.com/viniciusmsousa
<vinisousa04@gmail.com>

Florianopolis-R-NNQ-R / 29 de Agosto 2019

Introdução

Quem sou eu

  • Nascido em Joinville, 23 anos;
  • Cristão;
  • Economista pela Esag/Udesc;
  • Mestrando em Ciência da Informação no PGCIn/Ufsc;
  • Pós-Graduando em Ciência de Dados (Senai/SC e Keyrus);
  • Cientista de Dados na Aquarela Advanced Analytics

Plano De Vôo

  1. Machine Learning 101
  2. Local Interpretable Model-Agnostic Explanations
  3. Implementação (ouR time to do it)

Machine Learning 101

Questionário rápido

  1. Quem já ouviu falar o termo "Machine Learning"?
  2. Quem sabe o que é "Machine Learning"?
  3. Quem usa "Machine Learning"?

Sobre Machine Learning

  1. Sub campo da inteligência artificial;
  2. Objetivo é ter programas de computadores que aprendem padrões nos dados;
  3. Costumam ser mais preditivos que modelos estatísticos, mas não tem interpretação;
  4. E daí surge o termo...

Caixa Preta

Em outras palavras o ponto fraco de algoritmos de "Machine Learning" é a falta de iterpretabilidade do que o modelo está aprendendo.

Local Interpretable Model-Agnostic Explanations

Resumindo:

Propõe-se um algoritmo que explica quais as variáveis (features) mais importantes para explicar variações locais em observações do seu conjunto de dados.

Implementação (ouR time to do it)

Existe uma implementação pronta

(Exemplo baseado em http://uc-r.github.io/lime)

Mas antes,

vamos ver o outline do que foi feito

Problema: Predizer qual funcionário vai ter atrito no trabalho.

Demonstração

Obrigado pela Atenção

Vinícius M. de Sousa

Economista e Cientista de Dados

Dúvidas/Perguntas/Considerações/Sugestões?