Alguns estudos de inteligência artificial com os dados do Enem/2021 - Algorítmo Naive Bayes

Neste algorítmo, programado em PHP, foi utilizado para o cálculo das probabilidades as proporções de cada atributo, assim como as médias e variâncias de cada grupo de atributos.

Não é um bom algorítmo se houver muitos atributos redundantes. Neste caso, os valores de probabilidades obtidos podem não ser muito realistas. Com essas ressalvas, vamos às opções do algoritmo:

a)Tamanho da amostra e fórmula

Pode-se optar por uma fórmula bertouliana, com as médias proporcionais simples para cada grupo de atributo ou pela fórmula gaussiana utilizando as médias e variâncias desses grupos. Pode-se optar por um tamanho da amostra de 100 a 900 registros (para não ficar demorado o processamento). Escolhido o tamanho da amostra, deve-se escolher a faixa de registros dessa amostra que servirão de treino.

b)Atributos

Foram considerados a idade, o sexo, o estado civil, a cor/raça, a nacionalidade, a situação no ensino médio e o tipo de escola.

c)Nota de aprovação(classificação)

Para ser verificada a possibilidade de aprovação ou não pelo algoritmo, deve-se dar uma nota mínima desejada de aprovação

Primeiro deve-se executar o programa abaixo para extrair alguns registros do ENEM e fazer um treinamento, variando a fórmula e o tamanho da amostra, de forma a se verificar qual o melhor fórmula e respectiva amostra. Descoberto esses melhores valores, deve-se entrar com eles num segundo programa, na fase de previsão, de forma a obter o resultado desejado.

Entre com os dados abaixo, e treine o algorítmo, que dependendo das opções pode demorar um pouco

Obs: Quanto mais perto da unidade for o índice, melhores serão a fórmula escolhida e o tamanho da amostra.

Voltar para treinamento neste algoritmo Voltar para treinamento em outro algoritmo