Die Daten, mit denen ein Modell des maschinellen Lernens trainiert wird und deren Qualität und Repräsentativität das Verhalten des Modells stark prägen.
Trainingsdaten sind die Beispiele, aus denen ein Modell des maschinellen Lernens lernt. Ihre Qualität, Korrektheit und Repräsentativität bestimmen unmittelbar, wie gut und wie fair das Modell im Einsatz arbeitet.
Die Steuerung der Trainingsdaten, ihre Herkunft, Qualität, Verzerrung und etwaige enthaltene personenbezogene Daten, ist zentral für ISO/IEC 42001 und die EU-KI-Verordnung, die Anforderungen an die Datenqualität bei Hochrisiko-KI stellen.