Trabalho 12
Conteúdos
- Trabalho 02
- Trabalho 03
- Trabalho 04
- Trabalho 06
- Trabalho 07
- Trabalho 08
- Trabalho 09
- Trabalho 10
- Trabalho 11
- Trabalho 12
Nome da Atividade: K-means++
Nome e Matrícula: Lucas Lima do Nascimento - 12111ECP024
Introdução:
Nesse trabalho, fiz a implementação do algoritmo K-means++ para clusterização de dados.
200 dados foram fornecidos, tanto para X quanto para Y.
Resultados:
Como no trabalho anterior, obtive como valor mais adequado de K = 2, partirei do princípio de que esse é o melhor agrupamento possível para esse conjunto de dados.
Em seguida, utilizei a biblioteca sklearn para implementar o algoritmo do K-means++, obtendo a seguinte clusterização:

Logo em seguida, para os dados acima, obtive esses valores de MSE:

Plotei eles para obter o gráfico da curva de erro quadrático:

No eixo Y, temos o valor da distância quadrática e no eixo X a iteração.