Искусственный интеллект прогнозирует инфляцию
Перед участниками хакатона стоит актуальная задача разработать модель, которая в режиме квази-реального времени сможет формировать прогноз инфляции в текущем месяце. Такой прогноз будет опираться на открытые микроданные о ценах, собранных посредством веб-скрейпинга с сайтов интернет-магазинов. Использование ежедневной информации об онлайн-ценах позволит более точно и оперативно прогнозировать месячный показатель инфляции.
Особенность задачи — необходимость работы с большим количеством временных рядов. База данных содержит ежедневные цены о нескольких миллионах позиций, собранных с сайтов более 200 интернет-магазинов. При этом прогнозирование усложняется тем, что состав позиций постоянно изменяется. Отслеживаемые товары периодически выпадают из выборки, а новые появляются.
Разработки участников помогут усовершенствовать инструментарий прогнозирования инфляции, дополнив его методами на основе альтернативных данных. Точность инструментов прогнозирования во многом определяет эффективность и своевременность принимаемых решений в сфере денежно-кредитной политики и поддержания финансовой стабильности.
— Рекомендуемый состав команды: специалист ML, специалист DS
— Предполагаемый стек технологий: Python
— Требования к железу: желательна вычислительная мощность. Процессор Intel Core i7 и 16Гб RAM
— Уровень участников: профи
Найти белого медведя с помощью ИИ
Участникам предстоит на основе представленных данных аэрофотосъемки, сформированных датасетов и материалов из открытых источников обучить нейросеть поиску белых медведей, а также сформировать интерфейс загрузки данных и представления результатов распознавания с учетом требования по автономности решения (без использования сети «Интернет»).
Распознавание белых медведей в Арктике на основании аэрофотосъемки — трудозатратная задача, учитывая площади аэрофотосъемки и особенности местности (белый медведь на белом снегу). Основная сложность задачи заключается в малом объеме выборки с объектами. Фотографии аэрофотосъемки с медведями в Арктике получить сложно. При подобной съемке собирается большое количество пустых фотографий, среди которых лишь незначительное число содержит объект поиска.
Представленные участниками решения позволят находить реальных медведей на данных аэрофотосъемки, что усовершенствует процесс отслеживания вида и его поведения в дикой природе.
— Рекомендуемый состав команды: специалист ML; специалист по работе с хранилищами данных и базами данных; специалист по разработке интерфейсов; бизнес-аналитик.
— Предполагаемый стек технологий: программы и библиотеки с открытым исходным кодом (open source) и общедоступные публичные данные, в остальном нет ограничений ни на языки программирования, ни на стек технологий.
— Требования к железу: специфические требования отсутствуют
— Уровень участников: Любой
Машинное обучение на графах (ОФЛАЙН-КЕЙС)
Участникам хакатона предстоит спрогнозировать склонность пользователя VK к благотворительной деятельности.
Кейс представляет собой задачу бинарной классификации. Командам будет необходимо изучить последовательность пользовательских состояний, набор вещественных признаков и топ близких ему пользователей с тем же признаковым описанием.
Решение кейса представляет собой модель, которая определяет, интересуется ли пользователь благотворительностью. При оценке будет учитываться не только объективное качество модели, но и обоснование решения. Также обязательным пунктом является обучения модели на графах и извлечение признаков из них.
Разработанное участниками решение позволит c максимальной точностью выявить пользователей, интересующихся благотворительной деятельностью и предложить воспользоваться портфелем социальных сервисов VK Group (Добро.Мейл.ру, Благотворительность ВКонтакте, Социальные проекты ОК), тем самым повысив количество россиян, участвующих в благотворительной деятельности.
— Рекомендуемый состав команды: Специалист ML
— Предполагаемый стек технологий: Machine Learning, Sequence Processing, Big Data, Graph Processing
— Требования к железу: Требуется вычислительная мощность 64гб оперативной памяти. Будут предоставлены вычислительные ресурсы VK Cloud.
— Уровень участников: Любой