[phpBB Debug] PHP Notice: in file /viewtopic.php on line 981: date(): It is not safe to rely on the system's timezone settings. You are *required* to use the date.timezone setting or the date_default_timezone_set() function. In case you used any of those methods and you are still getting this warning, you most likely misspelled the timezone identifier. We selected the timezone 'UTC' for now, but please set date.timezone to select your timezone.
[phpBB Debug] PHP Notice: in file /viewtopic.php on line 981: getdate(): It is not safe to rely on the system's timezone settings. You are *required* to use the date.timezone setting or the date_default_timezone_set() function. In case you used any of those methods and you are still getting this warning, you most likely misspelled the timezone identifier. We selected the timezone 'UTC' for now, but please set date.timezone to select your timezone.
[phpBB Debug] PHP Notice: in file /includes/functions.php on line 4183: Cannot modify header information - headers already sent by (output started at /includes/functions.php:3493)
[phpBB Debug] PHP Notice: in file /includes/functions.php on line 4185: Cannot modify header information - headers already sent by (output started at /includes/functions.php:3493)
[phpBB Debug] PHP Notice: in file /includes/functions.php on line 4186: Cannot modify header information - headers already sent by (output started at /includes/functions.php:3493)
[phpBB Debug] PHP Notice: in file /includes/functions.php on line 4187: Cannot modify header information - headers already sent by (output started at /includes/functions.php:3493)
Chaos and Correlation • Просмотр темы - Santander Value Prediction Challenge

Santander Value Prediction Challenge

Модераторы: ТВЧ, Petrovich

Re: Santander Value Prediction Challenge

Сообщение Eugene Lutsenko » Пн авг 06, 2018 12:42 pm

Ну да. запустил распознавание тестовой выборки Пишет, что займет чуть больше 20 минут. Потом сделаю два результата для Каггла: в наиболее достоверной модели согласно здравого смысла и по их критерию. Это разные модели
Аватара пользователя
Eugene Lutsenko
 
Сообщения: 9738
Зарегистрирован: Вт мар 09, 2010 6:11 am
Откуда: Krasnodar, Russia

Re: Santander Value Prediction Challenge

Сообщение Eugene Lutsenko » Пн авг 06, 2018 2:21 pm

Модуль распознавания работал чуть меньше получаса (28 минут) и в конце после 100% выдал сообщение об ошибке памяти, а не о нормальном завершении.

Сейчас тоже можно кое-что сделать, типа того, что я делал в Excel.
Напишу тебе на почту, чтобы не пользовались конкуренты.

Но если это не учитывать, то результат уже получен. Но лучше учитывать. Дима! Может быть сделаешь модуль определения наилучшей модели по критерию RMSLE и подбора смещения результатов распознавания тестовой выборки по результатам распознавания обучающей выборки? Алгоритм и Ecel-файл с решением этой задачи я послал тебе и Александру Петровичу на почту
Аватара пользователя
Eugene Lutsenko
 
Сообщения: 9738
Зарегистрирован: Вт мар 09, 2010 6:11 am
Откуда: Krasnodar, Russia

Re: Santander Value Prediction Challenge

Сообщение Eugene Lutsenko » Пн авг 06, 2018 3:02 pm

Дмитрий Бандык писал(а):Но что касается разработки полезного продукта - это я конечно поддерживаю и вот в этом я вам готов помогать.

Твои модули будут полезными, если полностью интегрировать их в систему Эйдос. Для этого они должны работать на основе файлов, создаваемых системой Эйдос (это уже есть), и сами в свою очередь будут создавать файлы, воспринимаемые системой Эйдос (это пока не вполне так). После этого я сделаю в системе Эйдос вызовы твоих модулей и это ОЧЕНЬ И ОЧЕНЬ усилит возможности системы, особенно на больших и очень больших выборках.
Аватара пользователя
Eugene Lutsenko
 
Сообщения: 9738
Зарегистрирован: Вт мар 09, 2010 6:11 am
Откуда: Krasnodar, Russia

Re: Santander Value Prediction Challenge

Сообщение Eugene Lutsenko » Пн авг 06, 2018 6:58 pm

По RMSLE не спеши. Сейчас я все смакетирую в Excel, а потом можно будет делать, и то, если это окажется оправданным
Аватара пользователя
Eugene Lutsenko
 
Сообщения: 9738
Зарегистрирован: Вт мар 09, 2010 6:11 am
Откуда: Krasnodar, Russia

Re: Santander Value Prediction Challenge

Сообщение Eugene Lutsenko » Пн авг 06, 2018 9:24 pm

Послал на почту тебе и Александру Петровичу свои эксперименты по обобщению результатов распознавания в Excel. Пока ничего удовлетворительного не получилось.

Джимми тебе написал: http://bb.donnay-software.com/donnay/vi ... 126db6d98a
Заинтересовался твоими разработками с GPU

Изображение
Изображение
Может написать в окне модулей:
GPU-модуль распознавания системы "Эйдос"
GPU-модуль синтеза моделей системы "Эйдос"

Дима!

Теперь я думаю надо прямым перебором попытаться так изменить результаты распознавания обучающей выборки, чтобы найти минимум метрики Каггла: среднеквадратичное отклонение логарифмов факта и прогноза (RMSLE).

Для этого надо результаты распознавания во всех моделях со всеми инт.критериями изменять по двум параметрам: A и B:
K(X)=A*Y(X)+B и вычислять эту меру RMSLE во вложенном цикле. Найти минимальную RMSLE для каждой модели и инт.критерия и минимальную из всех моделей и инт.критериев. Потом точно также преобразовать результаты распознавания тестовой выборки в нужной модели (той, для которой найдена минимальная RMSLE по всем моделям и инт.критериям) и с нужным инт.критерием с найденными A и B и после этого ее можно посылать.
Аватара пользователя
Eugene Lutsenko
 
Сообщения: 9738
Зарегистрирован: Вт мар 09, 2010 6:11 am
Откуда: Krasnodar, Russia

Re: Santander Value Prediction Challenge

Сообщение Eugene Lutsenko » Вт авг 07, 2018 4:26 am

Я почитал про эту библиотеку. Говорят надо удалить инсталляцию видеокарты и заново ее установить.
Переустановил. Но ничего не изменилось.

Если класс не числовой, то в результат распознавания (target) надо помещать его наименование из Classes.dbf, а если числовой - то среднее значение числового интервала (min+(max-min)/2)
Аватара пользователя
Eugene Lutsenko
 
Сообщения: 9738
Зарегистрирован: Вт мар 09, 2010 6:11 am
Откуда: Krasnodar, Russia

Re: Santander Value Prediction Challenge

Сообщение Eugene Lutsenko » Вт авг 07, 2018 6:11 am

В файле "Обобщение результатов2.xls", который я послал тебе на почту, показано, как получить стандартизированные результаты распознавания. Из них уже удобно получить такие, которые дадут минимальный RMSLE. Для этого можно посчитать матрицу с разными A, B от минимального до максимального значений в обучающей выборке. В этом же файле получены результаты распознавания с такими же средними и ср.кв.откл. как в обучающей выборке. Но они не оказались очень уж хорошими. Поэтому и возникла мысль получить много таких матриц с разными A,B и найти из них наилучшую по RMSLE. А потом с этими же A,B преобразовать результаты распознавания тестовой выборки. И тогда уже посылать результаты, полученные в наилучшей по этому критерию модели с наилучшим инт.критерием
Аватара пользователя
Eugene Lutsenko
 
Сообщения: 9738
Зарегистрирован: Вт мар 09, 2010 6:11 am
Откуда: Krasnodar, Russia

Re: Santander Value Prediction Challenge

Сообщение Eugene Lutsenko » Вт авг 07, 2018 6:33 am

Дмитрий Бандык писал(а):Буду смотреть.
=$B$11*AB15+$B$10
Аватара пользователя
Eugene Lutsenko
 
Сообщения: 9738
Зарегистрирован: Вт мар 09, 2010 6:11 am
Откуда: Krasnodar, Russia

Re: Santander Value Prediction Challenge

Сообщение Eugene Lutsenko » Вт авг 07, 2018 11:47 am

Дмитрий Бандык писал(а):И еще обнаружил и исправил одну важную ошибку - при чтении объектов из исходных данных последний объект не читался - это тоже было одной из причин отличия моих матриц от ваших. Сейчас мои матрицы информативностей совпадают с вашими с точностью 4-6 знаков после запятой. Матрицы abs, prc1, prc2 совпадают с вашими по всем знакам.

По этой причине я пересоздал модели и заново запустил распознавание. Закончится - все заархивирую и размещу в облаке по той же ссылке.
Дмитрий Бандык писал(а):Убрал деинициализацию OpenGL в конце.

Это не повлияло. Все равно выводит ошибку в той же библиотеке и не выводит сообщения о нормальном завершении и т.д.
Аватара пользователя
Eugene Lutsenko
 
Сообщения: 9738
Зарегистрирован: Вт мар 09, 2010 6:11 am
Откуда: Krasnodar, Russia

Re: Santander Value Prediction Challenge

Сообщение Eugene Lutsenko » Вт авг 07, 2018 12:49 pm

Дмитрий Бандык писал(а):Попробуйте этот вариант:
https://yadi.sk/d/2RtGQHUw3ZyaZc

Наконец-то я это увидел:
Изображение
Все прошло без ошибок!
Дмитрий Бандык писал(а):Для RMSLE мне нужен файл с исходными данными из каггла. Где его можно взять?

Все файлы в папках приложений:
c:\Aidos-X\AID_DATA\A0000001\System\.. распознаваемая выборка - тестовая выборка 49342 объекта.
c:\Aidos-X\AID_DATA\A0000002\System\.. распознаваемая выборка - тренировочная выборка 4459 объектов.
Я все пересчитал в новой версии в обоих моделях, заархивировал и записал в облако. А ссылку для скачивания послал тебе и Александру Петровичу на почту.
Аватара пользователя
Eugene Lutsenko
 
Сообщения: 9738
Зарегистрирован: Вт мар 09, 2010 6:11 am
Откуда: Krasnodar, Russia

Пред.След.

Вернуться в Chaos and Correlation

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 19

cron