Участникам хакатона на основе методов искусственного интеллекта предлагается разработать программное решение по идентификации конкретной особи гренландского кита на основе данных, полученных с беспилотных летательных аппаратов.
При помощи данных аэрофотосъемки, сформированных датасетов и материалов из открытых источников, участникам хакатона предстоит обучить нейросеть поиску индивидуальных особей гренландского кита, а также сформировать интерфейс загрузки данных и представления результатов распознавания с учетом требования по автономности решения (без использования сети «Интернет»).
Разработанное участниками решение позволит оптимизировать проведение регулярных и длительных сезонных экспедиций, в ходе которых осуществляется постоянный запуск беспилотных летательных аппаратов, обеспечивающих аэрофотосъемку скоплений гренландского кита. Алгоритм также позволит оптимизировать время обработки полученных данных.
— Рекомендуемый состав команды: Специалист ML; специалист по работе с хранилищами данных и базами данных; специалист по разработке интерфейсов; бизнес-аналитик
— Предполагаемый стек технологий: Программы и библиотеки с открытым исходным кодом (open source) и общедоступные публичные данные, в остальном нет ограничений ни на языки программирования, ни на стек технологий. При этом, используемый стек технологий должен обеспечить автономность решения (возможность использования без сети «Интернет»)
— Требования к железу: Не предъявляются
— Уровень участников: Опытные
Решения: Цифровой прорыв. Сезон: искусственный интеллект (vk.com)
Кластерный анализ играет важную роль для коммуникаций с клиентами банка. На данный момент в банке существует ML решение задачи кластеризации, но для этого используются персональные и внутренние данные банка о клиентах.
При наличии недостаточного количества информации о новых клиентах банка невозможно подобрать для них наилучшее банковское предложение, что влечет за собой как финансовые, так и репутационные потери в случае неудачного подбора продукта или коммуникации с клиентами.
Для полного отражения сегментного профиля по доходности и улучшения имеющейся модели банка участникам предлагается изучить возможность кластеризации на данных, находящихся в открытом доступе. Результат работы должен быть представлен парсером, предсказаниями модели, а также наличием веб-интерфейса, ключевой особенностью которой будет являться визуализация, отражающая качество кластеризации при изменении количества кластеров.
Предложенные участниками алгоритмы помогут оценить доходность предпринимателей РФ на основе открытых источников данных.
— Рекомендуемый состав команды: Специалист ML, back-end специалист
— Предполагаемый стек технологий: Machine Learning, программы и библиотеки с открытым исходным кодом (open source) и общедоступные публичные данные, языки Python, PHP и т. д.
— Требования к железу: Не важно
— Уровень участников: Новички / опытные / профи
Решения: Цифровой прорыв. Сезон: искусственный интеллект (vk.com)
Современные технологии позволяют легко решать задачи перевода естественных человеческих языков. Доступно большое количество технологий и уже обученных нейросетей для решения подобных задач, но стабильно работающего переводчика с человеческой речи на язык программирования — нет.
Решения в datadriven-компаниях принимаются на основании проверки гипотез на данных. При этом большая часть таких гипотез не является сложными — такие проверки могут осуществлять сами участники команд со стороны бизнеса (selfservice), но они не всегда обладают знаниями языков программирования.
Участникам хакатона предлагается реализовать переводчик с «человеческого» языка на язык SQL.
Разработанное участниками решение позволит сократить время при принятии решений, ускорит бизнес-процессы в компании ПАО «Ростелеком», а также позволит командам быстрее обучаться работе с данными и сократит нагрузку на дата-аналитиков.
— Рекомендуемый состав команды: Специалист ML, специалист SQL
— Предполагаемый стек технологий: Python, SQL
— Требования к железу: Специфических требований нет
— Уровень участников: Новички / опытные / профи
Решения: Цифровой прорыв. Сезон: искусственный интеллект (vk.com)
Голосовые помощники становятся неотъемлемой частью нашей жизни — они помогают не только нам, но и пользователям разного возраста. Например, одной из ключевых аудиторий для голосового помощника от VK — Маруси являются дети — они общаются с ней как с другом, учатся через нее и получают полезную информацию. Зачастую детская коммуникация с детскими технологиями специфична.
Дети, это не только цветы жизни, но и наша опора в будущем. Они должны расти всесторонне развитыми и получать максимальное количество информации в нашем быстро меняющемся мире. Надежным источником такой информации для познания мира и не только, может стать умная колонка. Участникам хакатона мы предлагаем вместе с нами поработать над качеством общения Маруси. Один из распространенных кейсов для такого срабатывания: дети часто болтают с Марусей, а фоном у них идут мультики, или они болтают одновременно друг с другом и с Марусей. Если Маруся научится понимать, что реплика явно обращена не к ней, дети смогут получать более релевантную и полезную информацию от Маруси и их общение будет максимально неискаженным.
Для того, чтобы взаимодействие с пользователем было более естественным, после большинства своих ответов, Маруся в колонках слушает пользователя около 3-х секунд, ожидая следующую реплику. На основе методов искусственного интеллекта предстоит обучить модель, которая будет понимать, что фраза, которую слушает ассистент, идет не от пользователя, а исходит от телевизора, работающего в фоне, или от фонового разговора. Тогда Маруся перестанет отвечать на такие фразы, и качество ее коммуникации с пользователем повысится. Важно при этом сохранить текущее время ответа.
— Рекомендуемый состав команды: Специалисты в области создания ML решений, предполагается работа с текстом.
— Предполагаемый стек технологий: Нет ограничений, любые доступные и открытые технологии и платформы.
— Требования к железу: нужна вычислительная мощность: GPU: V100/A100, память: 32Гб; хост: 4 ядра, память: 64 Гб. Будут предоставлены вычислительные ресурсы VK Cloud
— Уровень участников: Новички / опытные / профи
Решения: Цифровой прорыв. Сезон: искусственный интеллект (vk.com)