fbpx

Analytics – B3

Nosso calendário:

Dia 1 25/nov SEGUNDA 9H-13H
Discutimos o que é ciência de dados, qual o processo e começamos as medidas descritivas
Não teve exercício valendo nota
Material para Download – dia 1

Dia 2 27/nov QUARTA 9H-13H
Revimos as medidas descritivas e finalizamos o tópico descritiva
Teve exercício valendo nota
Material para Download – dia 2

Dia 3 02/dez SEGUNDA 9H-13H
Discutimos probabilidade e distribuições (fomos até a normal Padrão – Z~N(0,1))
Não teve exercício valendo nota
Material para Download – dia 3

Dia 4 04/dez QUARTA 9H-13H
terminamos as distribuições, entendemos TLC e começamos teste de hipóteses
Teve exercício valendo nota (os 11 exercícios da lista 2 + o último slide desse material)
Material para Download – dia 4

Dia 5 09/dez SEGUNDA 9H-13H
desmarcamos essa aula por culpa minha… vamos inserir uma data a mais

Dia 6 12/dez QUINTA 9H-13H
Terminamos teste de hipóteses (quando conhecemos a população e quando não conhecemos) e teste t para duas amostras
Teve exercício valendo nota (os exercícios 12, 13 e 14 – lista 3)
Material para Download – dia 6

Dia 7 16/dez SEGUNDA 14H-18H
Teoria de Regressão Linear (o material está no dia 8 – não teve lição de casa)

Dia 8 18/dez QUARTA 9H-13H
Teoria de Regressão Linear + Aplicação utilizando o R
Discutimos multicolinearidade, análise de resíduo, métodos de seleção de variáveis, métricas de qualidade de ajuste
Não teve exercício valendo nota
Material para Download – dia 8
Estimador de mínimos quadrados (lembro que o Renan queria ver…)

Dia 9 06/jan SEGUNDA 14H-18H
Voltamos de “férias” conhecendo mais o SAS Entreprise Guide e fazendo a revisão de descritiva, mais Regressão Linear no Guide
Tem exercício valendo nova
Material para Download – dia 9

Dia 10 08/jan QUARTA 9H-13H
Iniciamos a discussão sobre Regressão Logística. Entendemos de onde o modelo surgiu, discutimos a interpretação (odds ratio) e falamos sobre para quê serve o modelo e as métricas para cada caso (no entanto ainda teremos uma aula para relembrarmos e fazermos as métricas na mão).
Fizemos o modelo do titanic no Guide
Não tem exercício valendo nota
Material para Download – dia 10

Dia 11 13/jan SEGUNDA 9H-13H
Vimos rapidamente Dunnet (todas contra a referência) e Tukey (todos contra todos).
Na sequencia entramos na árvore de decisão.
Fizemos os métodos Gini, Entropia e Qui-quadrado no excel (na mão)
Discutimos os critérios de parada e entendemos como o SAS trabalha com treinamento, validação e teste para árvore
Discutimos como isso seria feito se a variável resposta fosse numérica (buscar a diminuição da variabilidade).
Não tem exercício valendo nota
Material para Download – dia 11

Dia 12 15/jan QUARTA 9H-13H
Revimos árvore de decisão, falamos sobre Random Forest, Gradient Boosting. Discutimos sobre o problema real do KYC (que foi sensacional). E iniciamos o problema da Instituição de Caridade no Guide, criamos a ABT e startamos o Miner.
Todos devem vir para a próxima aula com o Miner configurado o Data Source.
Material para Download – dia 12

Dia 13 20/jan SEGUNDA 9H-13H
Não tivemos aula por conta de uma reunião com alguns alunos na B3.

Dia 14 22/jan QUARTA 9H-13H

Dia 15 24/jan SEXTA 9H-13H

Dia 16 27/jan SEGUNDA 9H-13H

Dia 17 29/jan QUARTA 9H-13H

Dia 18 31/jan SEXTA 9H-13H

Dia 19 03/fev SEGUNDA 9H-13H

Dia 20 05/fev QUARTA 9H-13H