Tessore, Juan Pablo; Cicerchia, Lucas Benjamín; Esnaola, Leonardo Martín; Russo, Claudia; Ramón, Hugo
Abstract:
Los algoritmos de aprendizaje de máquina semi supervisado permiten reducir el número de
ejemplos necesarios en el proceso de entrenamiento de un clasi cador, esto se logra principalmente
gracias a la selección de muestras particularmente representativas dentro de la
población en estudio. El criterio de selección de estas últimas es de gran importancia si queremos
obtener clasi cadores con buen desempeño. En el presente trabajo, se estudia active
learning, una técnica que constituye un caso especial de aprendizaje semi supervisado,
además, se analizan tres heurísticas de selección de muestras para dicha técnica, aplicado
al reconocimiento de cultivos en imágenes hiperespectrales. Como modelo base se utiliza
support vector machines, y como heurísticas de selección de candidatos se contemplan tres variantes, random sampling, margin sampling y normalized entropy query-by-bagging. El primer criterio es una buena métrica de comparación, y los dos últimos fueron seleccionados debido a que son los de mejor desempeño de acuerdo a la literatura.