Neste algorítmo, programado em PHP, foi utilizado para o cálculo das probabilidades as proporções de cada atributo, assim como as médias e variâncias de cada grupo de atributos.
Não é um bom algorítmo se houver muitos atributos redundantes. Neste caso, os valores de probabilidades obtidos podem não ser muito realistas. Com essas ressalvas, vamos às opções do algoritmo:
a)Tamanho da amostra e fórmula
Pode-se optar por uma fórmula bertouliana, com as médias proporcionais simples para cada grupo de atributo ou pela fórmula gaussiana utilizando as médias e variâncias desses grupos. Pode-se optar por um tamanho da amostra de 100 a 900 registros (para não ficar demorado o processamento). Escolhido o tamanho da amostra, deve-se escolher a faixa de registros dessa amostra que servirão de treino.
b)Atributos
Foram considerados a idade, o sexo, o estado civil, a cor/raça, a nacionalidade, a situação no ensino médio e o tipo de escola.
c)Nota de aprovação(classificação)
Para ser verificada a possibilidade de aprovação ou não pelo algoritmo, deve-se dar uma nota mínima desejada de aprovação
Primeiro deve-se executar o programa abaixo para extrair alguns registros do ENEM e fazer um treinamento, variando a fórmula e o tamanho da amostra, de forma a se verificar qual o melhor fórmula e respectiva amostra. Descoberto esses melhores valores, deve-se entrar com eles num segundo programa, na fase de previsão, de forma a obter o resultado desejado.
Entre com os dados abaixo, e treine o algorítmo, que dependendo das opções pode demorar um pouco
Obs: Quanto mais perto da unidade for o índice, melhores serão a fórmula escolhida e o tamanho da amostra.
Voltar para treinamento neste algoritmo | Voltar para treinamento em outro algoritmo |