Authors
T Hastie,
R Tibshirani,
T Friedman,
L Devroye,
L Devroye,
Publication date
Publisher
Total citations
Cited by
Description
Kõigis neis näidetes tuleb klassifitseerijal (olgu see masin või inimene) teatava ja tihti üsna piiratud informatsiooni põhjal objekt liigitada ühte etteantud klassi. Võimalikud klassid on teada ja üldisust kitsendamata tähistame nad {0,..., k− 1}. Seega kokku k klassi. Klasside kodeerimisel pole arusaadavalt mingit tähtsust, kodeering 0, 1,..., k− 1 on standardne, kuid kasutatakse ka 1,..., k, kahe klassi korral ka− 1, 1 jne. Seega võib klassifitseerijat kirjeldada kui operaatorit, mille argument (sisend) on objekti kirjeldus ja väärtus (väljund) on number hulgast {0,..., k− 1}–klass. Edaspidises eeldame üldisust kitsendamata, et klassifitseeritava objekti kirjeldus esitatakse vektorina x∈ Rd. See vektor on tunnus või tunnusvektor (ik feature, pattern). Kui klassifitseerimisülesanne on isendi soo määramine, võivad tunnusteks olla näitaks isendi kaal ja pikkus. Tunnusvektor x koosneb sellisel juhul kahest komponendist. Praktikas muidugi pole tunnused alati arvulised ning kvalitatiivsed (mittearvulised) tunnused tuleb enamasti arvulisteks kodeerida. Seejuures tuleb olla ettevaatlik, sest kodeerimine mõjutab üldiselt tulemust.