Конечно 4993 не классов, а вообще всех шкал. Классификационная шкала только одна: TARGET. Таким образом 4993-2=4991 описательных шкал (есть еще колонка ID, которая не является шкалой). На сколько я знаю в факторном анализе можно использовать не более 7 шкал, в статистических системах не более 70. В системе Эйдос текущей версии до 1500 (это суммарное количество классификационных и описательных шкал). Сейчас я делаю, чтобы не было особого ограничения, ну например можно было использовать суммарно до 16000 шкал и более.
Посчитал сколько примерно объектов тестовой выборки в файле test.csv:
- Код: Выделить всё
Файл: Число Размер
объектов файла (байт)
train.csv: 4461 65160613
test.csv: Х 1014174166
X=(4461*1014174166)/65160613=69431,98883850279, т.е. около 70000 объектов тестовой (распознаваемой) выборки