Új vagyok a gépi tanulásban, és megpróbálok scikit-learn (sklearn) -et használni osztályozási probléma kezelésére. A DecisionTree és az SVM egyaránt képes osztályozót oktatni erre a problémára.
A sklearn.ensemble.RandomForestClassifier
és a sklearn.svm.SVC
, hogy ugyanazok a képzési adatok (kb. 500 000 bejegyzés 50 bejegyzéssel). A RandomForestClassifier osztályozóval körülbelül egy perc alatt megjelenik. Az SVC több mint 24 órát használ, és továbbra is fut.
Miért működik az SVC olyan kevéssé hatékonyan? Túl nagy az adatkészlet az SVC számára? Az SVC nem megfelelő egy ilyen probléma esetén?