Loops de aprendizado semi-supervisionados são uma classe de fluxos de trabalho iterativos de aprendizado de máquina que aproveitam os relacionamentos encontrados em dados não-rotulados. Essas técnicas podem melhorar os modelos combinando conjuntos de dados rotulados e não-rotulados de várias maneiras. Em outros casos, eles comparam modelos treinados em diferentes subconjuntos de dados. Diferentemente do aprendizado não-supervisionado, em que uma máquina infere classes em dados não-rotulados ou técnicas supervisionadas nas quais o conjunto de treinamento é totalmente rotulado, as técnicas semi-supervisionadas aproveitam um pequeno conjunto de dados rotulados e um conjunto muito maior de dados não-rotulados. O aprendizado semi-supervisionado também está intimamente relacionado às técnicas de aprendizado ativo, nas quais um ser humano é direcionado para rotular seletivamente pontos de dados ambíguos. Como as pessoas especialistas que podem rotular dados com precisão são um recurso escasso e a rotulagem costuma ser a atividade que consome mais tempo no fluxo de trabalho de aprendizado de máquina, as técnicas semi-supervisionadas reduzem o custo do treinamento e tornam o aprendizado de máquina viável para uma nova classe de usuários. Também estamos vendo a aplicação de técnicas pouco supervisionadas, em que os dados rotulados por máquina são usados, mas são menos confiáveis do que os dados rotulados por humanos.
Loops de aprendizado semissupervisionados são uma classe de fluxos de trabalho de aprendizado de máquina iterativo que tiram vantagem das relações encontradas em dados não-rotulados. Essas técnicas podem melhorar modelos ao combinar conjuntos de dados rotulados e não-rotulados de várias maneiras. Em outros casos, eles comparam modelos treinados em diferentes subconjuntos de dados. Diferente tanto do aprendizado não-supervisionado, em que uma máquina infere classes em dados não-rotulados, ou técnicas supervisionadas em que o conjunto em treinamento é totalmente rotulado, as técnicas semissupervisionadas levam a vantagem de um pequeno conjunto de dados rotulados e um conjunto bem maior de dados não-rotulados. O aprendizado semissupervisionado também se aproxima de técnicas de aprendizado ativo, em que um humano é direcionado a rotular seletivamente pontos de dados ambíguos. Já que humanos especialistas que podem rotular precisamente dados são um recurso escasso, e rotulagem é frequentemente uma atividade que consome muito tempo no fluxo de trabalho no aprendizado de máquina, as técnicas semissupervisionadas baixam o custo do treinamento e tornam o aprendizado de máquina possível para uma nova classe de usuários.