Uvrščanje visoko-razsežnih neuravnoteženih podatkov
Z visoko-razsežnimi tehnologijami, kot so denimo mikromreže, lahko merimo na tisoče ali celo na deset tisoče spremenljivk. Običajno je število enot, ki so vključene v tovrstne študije, zelo majhno in precej manjše od števila spremenljivk, zato takim podatkom pravimo visoko-razsežni. Tovrstne podatke se pogosto uporablja za uvrščanje; na primer, enote bi na podlagi podatkov o genski izraženosti radi uvrstili v enega od v naprej definiranih razredov.
Predstavil bom, kako na rezultate uvrščanja visoko-razsežnih podatkov vpliva neuravnoteženost podatkov. O neuravnoteženosti podatkov govorimo, ko je število enot v posameznem razredu različno. Predstavil bom tudi nekatere popularne pristope za reševanje problema neuravnoteženih podatkov in pojasnil, kaj so njihove prednosti in pomanjkljivosti.