Alguns estudos de inteligência artificial com os dados do Enem/2021 - Algorítmo SVM

Neste algorítmo, programado em PHP, foi utilizado uma estrutura gerada pelo site de inteligência artificial OpenAI, através do ChatGPT. A partir dessa estrutura fiz as adaptações necessárias, na linguagem PHP, embora mantendo o aprendizado de não usar nenhum pacote pronto.

Embora o algoritmo seja usado para classificação(no nosso caso, aprovação ou reprovação) ou para regressão (estimar a referida nota), só fiz a programação para a classificação. Devido a isto, para maior precisão da classificação, foram incluídas as opções de controlar a taxa de aprendizagem e número de iterações a serem realizadas. Com essas ressalvas, vamos às opções do algoritmo:

a)Tamanho da amostra, taxa de aprendizagem e iterações

Pode-se escolher a taxa de aprendizado do algoritmo assim como o número de iterações a serem feitas. Pode-se optar por um tamanho da amostra de 100 a 900 registros (para não ficar demorado o processamento). Escolhido o tamanho da amostra, deve-se escolher a faixa de registros dessa amostra que servirão de treino.

b)Atributos

Foram considerados a idade, o sexo, o estado civil, a cor/raça, a nacionalidade, a situação no ensino médio e o tipo de escola.

c)Nota de aprovação(classificação)

Para ser verificada a possibilidade de aprovação ou não pelo algoritmo, deve-se dar uma nota mínima desejada de aprovação

Primeiro deve-se executar o programa abaixo para extrair alguns registros do ENEM e fazer um treinamento, variando a taxa de aprendizado, o número de iterações e o tamanho da amostra, de forma a se verificar qual a melhor opção de processamento e respectiva amostra. Descoberto esses melhores parâmetros, deve-se entrar com eles num segundo programa, na fase de previsão, de forma a obter o resultado desejado.
Observação: os valores de início e fim devem estar dentro do tamanho da amostra.

Entre com os dados abaixo, e treine o algorítmo, que dependendo das opções pode demorar um pouco

Obs: Quanto menor o bias(erro/desvio da previsão), melhores serão a os parâmetros escolhidos e o tamanho da amostra.

Voltar para treinamento neste algoritmo Voltar para treinamento em outro algoritmo