Hvad er forskellen mellem overvåget, semi-overvåget og ikke-overvåget relationerekstraktion i forbindelse med ekstraktion (NLP)?


Svar 1:

I overvåget læring er der et stort datasæt, der har alt, hvad den studerende kunne have brug for. Det har dokumenter sammen med alle forholdet mellem ord og den ønskede tekst. Den studerende skal lære at udføre denne opgave på usete dokumenter.

I semi-overvåget læring har du et stort sæt dokumenter, og for en mindre delmængde af disse har du alle data.

I uovervåget læring har den studerende kun dokumenter. Det kan se efter interessante mønstre, der ligger til grund for dataene. Disse mønstre kan være meningsfulde, men de kan også være tilfældige artefakter. Når der er tilstrækkelig med data, vil det være lettere at identificere meningsfulde mønstre. Uden en vejleder, der ser på mønstrene, vil algoritmen imidlertid ikke være i stand til at give den mening. For eksempel kunne det konstatere, at ordene 'præsident', 'Obama' og 'Barack' ofte forekommer sammen, eller at en forekommer i situationer, hvor en anden også typisk findes (en indikator på, at de muligvis er synonymer). Generelt kan det ikke konstateres, at dette beskriver en person.