Taal + wiskunde. Word Embeddings

Waar komt taal en wiskunde bij elkaar? In feite gaat het hier om standaard informatica, met een groot verschil, dat de traditionele informatica puur technisch werkt, terwijl hier ter controle specialisten uit andere vakgebieden nodig zijn om de systemen te sturen. Meer dan bij traditionele informatica. Er zijn verschillende technieken ontwikkeld en beschikbaar in de wereld van taalverwerking en taalbegrip (language Processing and language understanding). Veel heeft te maken met architectuur, dat betekent dat er vele componenten zijn in een grote geheel die samenwerken en elk een eigen functie uitoefenen. Word Embeddings is een bijzondere daarvan. In eenvoudige termen is een word-embedding: is een numerieke representatie van een woord. Numeriek betekent hier een vector of matrix-vertegenwoordiging, dus het nummer is een samengesteld nummer. Als voorbeeld: "het witte paard eet," kan vertaald worden in "het" [1,0,0,0], "witte" [0,1,0,0], "paard" [0,...