[phpBB Debug] PHP Notice: in file /viewtopic.php on line 981: date(): It is not safe to rely on the system's timezone settings. You are *required* to use the date.timezone setting or the date_default_timezone_set() function. In case you used any of those methods and you are still getting this warning, you most likely misspelled the timezone identifier. We selected the timezone 'UTC' for now, but please set date.timezone to select your timezone.
[phpBB Debug] PHP Notice: in file /viewtopic.php on line 981: getdate(): It is not safe to rely on the system's timezone settings. You are *required* to use the date.timezone setting or the date_default_timezone_set() function. In case you used any of those methods and you are still getting this warning, you most likely misspelled the timezone identifier. We selected the timezone 'UTC' for now, but please set date.timezone to select your timezone.
[phpBB Debug] PHP Notice: in file /includes/functions.php on line 4183: Cannot modify header information - headers already sent by (output started at /includes/functions.php:3493)
[phpBB Debug] PHP Notice: in file /includes/functions.php on line 4185: Cannot modify header information - headers already sent by (output started at /includes/functions.php:3493)
[phpBB Debug] PHP Notice: in file /includes/functions.php on line 4186: Cannot modify header information - headers already sent by (output started at /includes/functions.php:3493)
[phpBB Debug] PHP Notice: in file /includes/functions.php on line 4187: Cannot modify header information - headers already sent by (output started at /includes/functions.php:3493)
Chaos and Correlation • Просмотр темы - Home Credit Default Risk

Home Credit Default Risk

Модераторы: ТВЧ, Petrovich

Home Credit Default Risk

Сообщение Eugene Lutsenko » Вс авг 19, 2018 2:44 pm

Petrovich писал(а):Какую тему выбрать? Этот конкурс https://www.kaggle.com/c/home-credit-default-risk заканчивается через 4 дня.

Едва ли за 4 дня мы успеем решить задачу, тем более на требуемом уровне качества. Правда я еще не смотрел исходные данные. Посмотрел исходные данные. Они довольно специфические. Там довольно много связанных баз данных. Чтобы все их учесть надо писать программу, которая конвертирует эти данные в форму, пригодную для ввода в систему и обработки. Если взять только тренировочный и тестовый файлы, а остальное проигнорировать, то тогда еще можно попробовать. Но это снизит достоверность. Обучающая выборка 307511 примеров. Правда тестовая поменьше, всего 48744, но тоже прилично. Всего 121 шкала, это легко вписывается в возможности даже не мультитабличной системы Эйдос. Данные надо преобразовывать. В числовых шкалах есть пробелы. Разделитель в числах - точка, логические величины выражены числовыми значениями 0 и 1, и т.д. мы когда-то с соискателем решали такую задачу: http://ej.kubagro.ru/2007/06/pdf/16.pdf
Аватара пользователя
Eugene Lutsenko
 
Сообщения: 9738
Зарегистрирован: Вт мар 09, 2010 6:11 am
Откуда: Krasnodar, Russia

Re: Home Credit Default Risk

Сообщение Eugene Lutsenko » Вс авг 19, 2018 8:49 pm

Александр Петрович!

Утром пришлю результаты в той же форме, что в предыдущей задаче.
А в какой форме надо их присылать?
Аватара пользователя
Eugene Lutsenko
 
Сообщения: 9738
Зарегистрирован: Вт мар 09, 2010 6:11 am
Откуда: Krasnodar, Russia

Re: Home Credit Default Risk

Сообщение Eugene Lutsenko » Пн авг 20, 2018 5:21 am

Синтез модели закончился:
Изображение

А вот распознавание тестовой выборки не началось:
Изображение

Это на всех вариантах модуля распознавания.

Дима!

Еще я понял что не так в формировании txt-матриц моделей: ты просто берешь размер поля NAME_ATR базы Attributes.dbf, а надо брать максимальный размер наименования из этого поля без пробелов.
Аватара пользователя
Eugene Lutsenko
 
Сообщения: 9738
Зарегистрирован: Вт мар 09, 2010 6:11 am
Откуда: Krasnodar, Russia

Re: Home Credit Default Risk

Сообщение Eugene Lutsenko » Пн авг 20, 2018 5:48 am

Так я уже решаю эту задачу. Если исправишь модуль распознавания, то мы и по ней пошлем результат.
Задачу сейчас выложу в облако и пришлю на почту ссылку.
Я потому и использую txt-файлы, что они могут быть больше 2Гб, а dbf - не могут. Но в данном случае они не больше 2 Гб.
Аватара пользователя
Eugene Lutsenko
 
Сообщения: 9738
Зарегистрирован: Вт мар 09, 2010 6:11 am
Откуда: Krasnodar, Russia

Re: Home Credit Default Risk

Сообщение Eugene Lutsenko » Пн авг 20, 2018 6:01 am

Дмитрий Бандык писал(а):Давайте ссылку на модель. До вечера постараюсь исправить ошибку.

Ссылку послал на почту.

Возможно модуль распознавания не работает, т.к. распознаваемая выборка некорректна. Я сейчас это заметил и исправляю
Аватара пользователя
Eugene Lutsenko
 
Сообщения: 9738
Зарегистрирован: Вт мар 09, 2010 6:11 am
Откуда: Krasnodar, Russia

Re: Home Credit Default Risk

Сообщение Eugene Lutsenko » Пн авг 20, 2018 11:06 am

Дима!

Корректная модель будет в облаке завтра утром по той же ссылке
Аватара пользователя
Eugene Lutsenko
 
Сообщения: 9738
Зарегистрирован: Вт мар 09, 2010 6:11 am
Откуда: Krasnodar, Russia

Re: Home Credit Default Risk

Сообщение Petrovich » Пн авг 20, 2018 4:16 pm

Eugene Lutsenko писал(а):Александр Петрович!

Утром пришлю результаты в той же форме, что в предыдущей задаче.
А в какой форме надо их присылать?

Там есть образец sample_submission.csv
Аватара пользователя
Petrovich
Site Admin
 
Сообщения: 10245
Зарегистрирован: Сб мар 06, 2010 12:05 pm
Откуда: Toronto, Canada

Re: Home Credit Default Risk

Сообщение Eugene Lutsenko » Пн авг 20, 2018 6:36 pm

В этом примере target почему-то с десятыми знаками после точки, а в тренировочной выборке target либо 1, либо 0.
Аватара пользователя
Eugene Lutsenko
 
Сообщения: 9738
Зарегистрирован: Вт мар 09, 2010 6:11 am
Откуда: Krasnodar, Russia

Re: Home Credit Default Risk

Сообщение Petrovich » Вт авг 21, 2018 4:04 am

Eugene Lutsenko писал(а):В этом примере target почему-то с десятыми знаками после точки, а в тренировочной выборке target либо 1, либо 0.
Как просят, так и надо делать. У них там свои мыши в голове.
Аватара пользователя
Petrovich
Site Admin
 
Сообщения: 10245
Зарегистрирован: Сб мар 06, 2010 12:05 pm
Откуда: Toronto, Canada

Re: Home Credit Default Risk

Сообщение Eugene Lutsenko » Вт авг 21, 2018 5:43 am

Дмитрий Бандык писал(а):
Eugene Lutsenko писал(а):Дима!

Корректная модель будет в облаке завтра утром по той же ссылке

Буду смотреть.

позже 12-00
Аватара пользователя
Eugene Lutsenko
 
Сообщения: 9738
Зарегистрирован: Вт мар 09, 2010 6:11 am
Откуда: Krasnodar, Russia

След.

Вернуться в Chaos and Correlation

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 12

cron