Egy dolog hozzáfűzhető a fenti magyarázatokhoz: a Genuer és mtsai, 2010 kísérletei alapján:
Robin Genuer, Jean-Michel Poggi, Christine Tuleau-Malot. Változtatható kiválasztás a véletlenszerű erdők segítségével. Mintafelismerő levelek, Elsevier, 2010, 31 (14), 2225–2366.
Amikor a változók száma meghaladta a p >> n megfigyelések számát, erősen korrelált változókat adtak hozzá a már ismert fontos változókhoz, egyesével az egyes RF modellekben, és észrevették, hogy a fontosság nagysága a változók értékei változnak (kevesebb relatív érték az y tengelytől a már ismert fontos változóknál), DE a változók fontossági sorrendje változatlan maradt, sőt a relatív értékek sorrendje is meglehetősen hasonló maradt, és még mindig jelentősen felismerhetők zajos változók (kevésbé releváns változók). Akkor is ellenőrizze a 2231. oldalon található táblázatot, amikor a replikációk száma (erősen korrelált változók hozzáadása a korábban ismert két legfontosabb változóval) növekszik, az egyes RF modellek előrejelzési beállítása továbbra is azt mutatja, hogy a legfontosabb változó a már ismert legtöbb fontos változó.
A változó szelektálásához értelmezési célból sok (pl. 50) RF modellt készítenek, fontos változókat vezetnek be egyenként, és a legkisebb OOB hibaarányú modellt választják ki értelmezésre és változó kiválasztásra.
előrejelzési célú változóválasztási eljáráshoz: "minden modellben elvégzünk egy szekvenciális változó bevezetést teszteléssel: egy változó csak akkor kerül hozzáadásra, ha a hibaerősítés meghaladja a küszöböt. Az az elképzelés, hogy a hiba csökkenésének lényegesen nagyobbnak kell lennie, mint átlagos változás a zajos változók hozzáadásával. "