Petrovich писал(а):Eugene Lutsenko писал(а):я имел в виду другую задачу - 2-ю про банки, в которой 4993 класса:
https://www.kaggle.com/c/santander-valu ... lenge/data
https://www.kaggle.com/c/santander-valu ... evaluation
хотя разработки Димы могут сыграть очень большую роль при решении любых задач большой размерности и задач, которые должны решаться в реальном времени (например общение с роботом на естественном языке).
Это вообще дурацкая задача. И сочиняют такие задачи идиоты из банков. Хотя задача с ускорителя ничем не лучше, ее сочиняли такие же идиоты.
Да, задача дурацкая, в смысле примитивная. Если бы не два "но". 1-е - это огромное число классов: 4993. 2-е - чудовищно огромная тестирующая выборка которая даже в csv около 1.5 Гб (а в базах данных будет в три раза больше). Эта тестирующая выборка ничем не открывается. Я даже не представлю, сколько там тестируемых объектов. Миллиарды наверное. Я пока делаю версию системы, которая сможет со всем этим справится. Но эта работа продвигается медленно, т.к. у меня есть сверхсрочные и сверхважные задания от шефа, которые я выполняю в отпуске. Пока я за отпуск (со 2-го июля) успел только написать свою часть монографии, почти написал учебное пособие и уже написал 6 ваковских статей. При таком числе классов ее можно распознавать годами без Диминых технологий. Или надо иметь доступ к суперкомпьютеру. В общем сложность только в огромной размерности задачи, а не в ее логической сложности. Похоже постановщики издеваются над исполнителями и тестируют не столько их самих, сколько возможности их программных систем, которые они создали.