Home Credit Default Risk
Добавлено: Вс авг 19, 2018 2:44 pm
Petrovich писал(а):Какую тему выбрать? Этот конкурс https://www.kaggle.com/c/home-credit-default-risk заканчивается через 4 дня.
Едва ли за 4 дня мы успеем решить задачу, тем более на требуемом уровне качества. Правда я еще не смотрел исходные данные. Посмотрел исходные данные. Они довольно специфические. Там довольно много связанных баз данных. Чтобы все их учесть надо писать программу, которая конвертирует эти данные в форму, пригодную для ввода в систему и обработки. Если взять только тренировочный и тестовый файлы, а остальное проигнорировать, то тогда еще можно попробовать. Но это снизит достоверность. Обучающая выборка 307511 примеров. Правда тестовая поменьше, всего 48744, но тоже прилично. Всего 121 шкала, это легко вписывается в возможности даже не мультитабличной системы Эйдос. Данные надо преобразовывать. В числовых шкалах есть пробелы. Разделитель в числах - точка, логические величины выражены числовыми значениями 0 и 1, и т.д. мы когда-то с соискателем решали такую задачу: http://ej.kubagro.ru/2007/06/pdf/16.pdf