Dataset (Datová sada)
Dataset je soubor dat, který slouží jako vstup pro trénování, testování nebo vyhodnocování AI modelů. Může obsahovat texty, obrázky, zvukové záznamy, čísla nebo kombinaci různých typů dat. Kvalitní a dobře anotovaný dataset je naprosto zásadní pro úspěch každého modelu. Ve strojovém učení se dataset často dělí na trénovací, validační a testovací část, aby bylo možné model vyvíjet a zároveň ověřit jeho přesnost.