dsai-advanced

DSAI Pt 2


Workflow

workflow


Performancemessung

  • Schüler soll Mathe lernen
  • lernt das Buch auswendig
  • kann alles
  • Schularbeitsbeispiel nicht im Buch -> 5
  • Trainingsperformance kann lügen

Train-Test-Split

  • Daten werden geteilt
  • Training mit Trainingsset
  • Testset simuliert unbekannte Daten
  • Testperformance aussagekräftig

train-test-split


Underfitting/Overfitting

Bias/Variance

underfit-overfit


underfit-overfit


SVM

svm


Kernel Trick


Gaussian RBF

rbf


rbf-params

  • $$\gamma = \frac{1}{2\sigma^2}$$
  • Einfluss einer observation

SVC(kernel='linear', C=100)

  • C $\frac{1}{C}$ Faktor der $l_2$-Regularisierung
  • C=0.01 ⟹ training-missclassifies ok
  • C=1000 ⟹ training-missclassifies NEIN
  • bei allen sklearn-models

linear-svm


SVC(kernel='rbf', C=100, gamma='scale')

rbf-svm


SVC(kernel='rbf', C=100, gamma='auto')

$$\gamma = \frac{1}{n_{features}}$$ overfitting


SVC(kernel='rbf', C=500, gamma=1)

superfitting


Underfitting

  • Model kann sich nicht gut an Trainingsdaten anpassen

Lösung

  • Komplexeres Model

Overfitting

  • Model passt sich zu gut an Trainingsdaten an
  • Model generalisiert schlecht

Lösung

  • Komplexität reduzieren
  • ANNs: Dropout-Layer
  • Model regularisieren

$l_1/l_2$ Regularization

Modell einschränken, damit Parameter $\theta$ klein bleiben

$$cost_{reg} = cost + \lambda\cdot reg$$

$$reg_{l1} = \sum|{\theta}|$$

$$reg_{l2} = \sum\theta^2$$