A minha ideia era estudar alguns algorítmos utilizados na inteligência artificial(IA), baseado no aprendizado de máquina(AM). Para isso, não usei nenhum pacote pronto, que são vários. Desenvolvi, em PHP puro, os processos estatísticos destes pacotes, apenas para o meu processo de aprendizagem, reconhecendo a melhor eficácia dos pacotes que já vem sendo usados exaustivamente em várias áreas, principalmente os escritos em Python e Javascript.
Com os imensos arquivos('Bigdata'), hoje existentes, nas diversas áreas da economia, sociologia, saúde em geral, entre inúmeras outras, a aplicação desses algorítmos, na aprendizagem desses dados, pode resolver inúmeros problemas, fornecendo soluções que antes seriam bastante demoradas de acontecer.
Como não teria capacidade de processar arquivos enormes para estudar esses algorítmos, decidi utilizar uma amostragem da base de dados do ENEM-2021 (ainda na pandemia da Covid-19). Nessa amostragem foram selecionadas como variáveis atributo: faixa etária, sexo, estado civil, cor/raça, nacionalidade, conclusão do ensino médio e tipo de escola onde o aluno estudou e como variável de classificação se foi aprovado ou reprovado.
Como prática normal da aprendizagem a programação está dividida em duas
fases, que devem ser seguidas nesta ordem:
1. Fase de treinamento
Nesta fase, os dados são examinados pelo algorítmo na tentativa de prever
as classificações (aprovado ou reprovado), baseado na seleção de registros para o treinamento, produzindo um índice (acurácia) dos
acertos.
2. Fase de previsão(classificação)
Nesta fase, são usados os parâmetros que geraram a melhor acurácia na
fase anterior, de forma a fazer a previsão para uma entrada de atributos fornecidos.
Desta forma, três algorítmos foram estudados : Knn-Nearest Neighbor, o
Naive-Bayes e o Support Vector Machines. Para a execução desses programas, escolha o que deseja
abaixo ou
siga o GUIA DE EXECUÇÃO
TREINAMENTO | PREVISÃO |
Knn-Nearest Neighbor | Knn-Nearest Neighbor |
Naive Bayes | Naive Bayes |
Support Vector Machine | Support Vector Machine |
Voltar para o site principal |