[phpBB Debug] PHP Notice: in file /viewtopic.php on line 981: date(): It is not safe to rely on the system's timezone settings. You are *required* to use the date.timezone setting or the date_default_timezone_set() function. In case you used any of those methods and you are still getting this warning, you most likely misspelled the timezone identifier. We selected the timezone 'UTC' for now, but please set date.timezone to select your timezone.
[phpBB Debug] PHP Notice: in file /viewtopic.php on line 981: getdate(): It is not safe to rely on the system's timezone settings. You are *required* to use the date.timezone setting or the date_default_timezone_set() function. In case you used any of those methods and you are still getting this warning, you most likely misspelled the timezone identifier. We selected the timezone 'UTC' for now, but please set date.timezone to select your timezone.
[phpBB Debug] PHP Notice: in file /includes/functions.php on line 4183: Cannot modify header information - headers already sent by (output started at /includes/functions.php:3493)
[phpBB Debug] PHP Notice: in file /includes/functions.php on line 4185: Cannot modify header information - headers already sent by (output started at /includes/functions.php:3493)
[phpBB Debug] PHP Notice: in file /includes/functions.php on line 4186: Cannot modify header information - headers already sent by (output started at /includes/functions.php:3493)
[phpBB Debug] PHP Notice: in file /includes/functions.php on line 4187: Cannot modify header information - headers already sent by (output started at /includes/functions.php:3493)
Chaos and Correlation • Просмотр темы - Santander Value Prediction Challenge

Santander Value Prediction Challenge

Модераторы: ТВЧ, Petrovich

Re: Santander Value Prediction Challenge

Сообщение Eugene Lutsenko » Ср авг 08, 2018 4:39 pm

Дмитрий Бандык писал(а):Так же не имеет никакого значения объем написанного ранее кода. Весь код можно написать с нуля за две недели, за месяц, ну пусть за два месяца.

Загадка:
"Сколько страниц программы в день надо писать, чтобы написать за 2 месяца такой код: http://lc.kubagro.ru/__AIDOS-X.txt"
Ответ: "Если страницы А4 и шрифт 10, то 50"
Аватара пользователя
Eugene Lutsenko
 
Сообщения: 9738
Зарегистрирован: Вт мар 09, 2010 6:11 am
Откуда: Krasnodar, Russia

Re: Santander Value Prediction Challenge

Сообщение Eugene Lutsenko » Ср авг 08, 2018 4:41 pm

Там очень много всего, о всем и не расскажешь...
Аватара пользователя
Eugene Lutsenko
 
Сообщения: 9738
Зарегистрирован: Вт мар 09, 2010 6:11 am
Откуда: Krasnodar, Russia

Re: Santander Value Prediction Challenge

Сообщение Eugene Lutsenko » Чт авг 09, 2018 2:19 am

Дима!

Я сейчас подумал, что для минимизации RMSLE в модуле распознавания надо при запуске сделать опцию (птичку): "Минимизировать RMSLE" (по умолчанию не надо), и если, задана эта опция:

1. Провести распознавание обучающей выборки во всех моделях со всеми инт.критериями.
2. Результаты распознавания обучающей выборки записать в базу данных такой же структуры, как "Обобщение результатов2.xls".
3. Найти в этой базе наиболее достоверную модель по критерию RMSLE, подбирая два параметра: A и B (амплитуду и постоянную составляющую).
4. Провести распознавание тестовой выборки во всех моделях со всеми инт.критериями.
5. Нормировать результат распознавание тестовой выборки во всех моделях со всеми инт.критериями.

В выходной форме должны быть видны значения RMSLE всех моделей со всеми инт.критериями и указана модель и инт.крит. с минимальным RMSLE и его значение. Если эта опция не задана, то модуль распознавания должен работать как раньше.

Модуль распознавания должен работать в текущем приложении системы Эйдос и к другим приложениям не обращаться.

Сейчас формируется распознаваемая выборка для 1000 классов по 5 градаций на описательную шкалу.

В этой связи возникает вопрос: "Сколько раз можно посылать результат?". Я так понял, что вроде 3 раза. Тогда можно сразу послать результат с 200 классами и 10 градациями описательных шкал, а потом, заменить его на результат с 1000 классов и 5 гр.о.шкал, если он будет лучше и если успеем
Аватара пользователя
Eugene Lutsenko
 
Сообщения: 9738
Зарегистрирован: Вт мар 09, 2010 6:11 am
Откуда: Krasnodar, Russia

Re: Santander Value Prediction Challenge

Сообщение Eugene Lutsenko » Чт авг 09, 2018 6:07 am

ОК. Я и сам думал сохранить предыдущий вариант
Аватара пользователя
Eugene Lutsenko
 
Сообщения: 9738
Зарегистрирован: Вт мар 09, 2010 6:11 am
Откуда: Krasnodar, Russia

Re: Santander Value Prediction Challenge

Сообщение Eugene Lutsenko » Чт авг 09, 2018 6:43 pm

Дмитрий Бандык писал(а):Пока минимальный RMSLE какой удалось получить - 1.3328303099 (модель inf5k)

Это значение соответствует рейтингу 1358 из 4229. Правда это не на тестовой выборке, а на распознаваемой. Это уже 1-я треть команд. Я считаю для первого опыта неплохо. Но нужно все равно послать результат.
Аватара пользователя
Eugene Lutsenko
 
Сообщения: 9738
Зарегистрирован: Вт мар 09, 2010 6:11 am
Откуда: Krasnodar, Russia

Re: Santander Value Prediction Challenge

Сообщение Eugene Lutsenko » Чт авг 09, 2018 7:26 pm

Спасибо, Дима! Попробую разобраться
Аватара пользователя
Eugene Lutsenko
 
Сообщения: 9738
Зарегистрирован: Вт мар 09, 2010 6:11 am
Откуда: Krasnodar, Russia

Re: Santander Value Prediction Challenge

Сообщение Eugene Lutsenko » Чт авг 09, 2018 8:15 pm

А старые модули синтеза модели и распознавания нужно предварительно запускать или эти новые модули все делают сами?
Аватара пользователя
Eugene Lutsenko
 
Сообщения: 9738
Зарегистрирован: Вт мар 09, 2010 6:11 am
Откуда: Krasnodar, Russia

Re: Santander Value Prediction Challenge

Сообщение Eugene Lutsenko » Чт авг 09, 2018 8:36 pm

Спасибо. А где можно увидеть сами значения критерия? А чего ты не ложишься спать?
Аватара пользователя
Eugene Lutsenko
 
Сообщения: 9738
Зарегистрирован: Вт мар 09, 2010 6:11 am
Откуда: Krasnodar, Russia

Re: Santander Value Prediction Challenge

Сообщение Eugene Lutsenko » Чт авг 09, 2018 8:49 pm

спокойной ночи
Аватара пользователя
Eugene Lutsenko
 
Сообщения: 9738
Зарегистрирован: Вт мар 09, 2010 6:11 am
Откуда: Krasnodar, Russia

Re: Santander Value Prediction Challenge

Сообщение Eugene Lutsenko » Чт авг 09, 2018 9:04 pm

Доброе утро!

Дима!

1. В модуле распознавания в конце надо писать не "Объектов обучающей выборки", а "Объектов распознаваемой выборки".

2. Прошу все же доделать формат txt-матриц моделей в модуле синтеза моделей. А то я так фактически не могу его использовать в системе.

3. С модулями нормализации вроде все понятно, но почему-то не получаются твои результаты. Пока твой результат: минимальный RMSLE какой тебе удалось получить - 1.3328303099 (модель inf5k), повторить не получилось. В этой модели в файле results_RMSLEmin_inf5k.csv получается вот что (совсем другое):

RMSLE; 1.921272635
A; 0.200000002
B; 901367.187500000
Id; target
000d6aaf2; 3925102.25000000
000fbd867; 3325552.25000000
0027d6b71; 1087232.25000000
0028cbf45; 1726752.25000000
002a68644; 1007292.18750000
002dbeb22; 8721502.00000000

4. Запустил новые модули на модели с 1000 классов и по 5 градаций в описательных шкалах.
Модуль минимизации написал, что выход за пределы памяти (out of memory) на загрузке матрицы Inf2:
Изображение.
А вообще видно, что решение было правильным, т.е. эти модели получаются более достоверными (многие модели в районе 1.5). Жалко, что может не хватить времени их посчитать, минимизировать и нормализовать.

PS
Конечно п.1 инструкции: "1. Устанавливаете в файлы Rsp_Kpr.dbf и Rsp_Kcl.dbf обучающую выборку" можно было бы исключить, если бы модуль брал данные прямо из обучающей выборки. Тогда и п.4 инструкции: "4. Устанавливаете в файлы Rsp_Kpr.dbf и Rsp_Kcl.dbf тестовую выборку" сам собой стал бы ненужным, т.к. она там и так установлена и не испорчена на п.1.

Ссылку на модели послал на почту
Аватара пользователя
Eugene Lutsenko
 
Сообщения: 9738
Зарегистрирован: Вт мар 09, 2010 6:11 am
Откуда: Krasnodar, Russia

Пред.След.

Вернуться в Chaos and Correlation

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 58

cron