Задания хакатона "Цифровой прорыв" Южного федерального округа

Октябрь 2022
~3 мин
Все публикации

Источник:

Распознать текст с помощью ИИ

В современном мире актуально сохранять текстовую информацию в виде фотографий на смартфонах. Однако такой метод хранения усложняет использование инструментов поиска. Участникам при помощи методов искусственного интеллекта предстоит разработать модель распознавания текста на изображениях, которая станет инструментом поиска информации (при оценке будет учитываться выбранная метрика оценки качества распознавания текста.). Такая модель позволит осуществлять поиск изображений по привычному текстовому описанию. 

В качестве датасета представлена коллекция фотографий, сделанных в различных условиях — в помещениях, на улице, при разном уровне освещения, погодных условиях и т. д. Изображения содержат в себе текстовую информацию на русском языке в различном виде — надписи, таблички, вывески, плакаты, биллборды и т. д. Необходимо построить модель, способную распознавать текст на таких фотографиях.

Успешной реализацией такой модели может стать её внедрение в процессы гибридного документооборота и упрощение доступа к информации в общественно значимых областях, таких как здравоохранение, финансовый сектор (документы, договоры), образование (решения контрольных материалов), которые до сих пор хранят большое количество документации в бумажном виде. Решение поможет в сложных ситуациях и обычным пользователям: пожилые и слабовидящие люди могут делать фотографии рецептов и препаратов, которые потом может озвучить голосовой помощник, а если вы потерялись в чужой стране — данные, собранные с фотографий вывесок на улице, могут подсказать адрес на понятном языке.

 

— Рекомендуемый состав команды: Специалист ML, специалист ПО, специалист DS, специалист Data Engineering, специалист по разработке интерфейсов

— Предполагаемый стек технологий: Machine Learning, Deep Learning, Optical Character Recognition, Text Recognition, языки Python, C++

— Требования к железу: Не предъявляются

— Уровень участников: Опытные

 

Результаты: 

OCR_Kikichi.pptx (live.com)

gestihub_3_.pptx (live.com)

Распознавание текста с помощью ИИ (bizmrg.com)

 

Определи участников экосистемы инноваций при помощи ИИ

В настоящее время Минэкономразвития России формирует реестр технологических компаний, получивших государственную поддержку. Реестр обогащается сведениями, которые предоставляют институты инновационного развития (ИИР). В структуру реестра включены различные атрибуты, характеризующие как продукты, так и компании-разработчики.

Для решения кейса будут предоставлены следующие данные по каждому продукту реестра: отрасль, подотрасль, технологии 3-х уровней и категория ОКПД2*.

Участникам хакатона на основе методов искусственного интеллекта предлагается провести оценку соответствия этих параметров продукта внесенным в реестр описаниям продуктов и компаний-производителей, а также информации, размещенной на официальных сайтах компаний. Необходимо выявить несоответствия и указать их зеркально с обеих сторон связки «параметры продукта — описания». Для подбора отсутствующих параметров продукта нужно использовать автоопределение.

Разработанное участниками решение позволит получить инструмент верификации вносимых данных в части их соответствия друг другу. Использование разработанного алгоритма повысит качество данных по компаниям реестра. Это позволит более эффективно оказывать поддержку технологическим компаниям из контура инновационной экосистемы России.

 

*Общероссийский Классификатор Продукции по видам экономической Деятельности

 

— Рекомендуемый состав команды: Специалист по распознаванию текста, ML-специалист, Scraping developer

— Предполагаемый стек технологий: Нет ограничений

— Требования к железу: Нужна вычислительная мощность

— Уровень участников: Опытные / профи

 

Результаты: 

MLS.pptx (live.com)

Презентация PowerPoint (bizmrg.com)

Презентация PowerPoint (bizmrg.com)

 

Здоровый ИИ: алгоритм определит депрессию, эмоциональный тонус и девиантное поведение

Инструментальный психофизиологический тест представляет собой исследование, предназначенное для измерения эмоциональных отклонений, с которыми сталкиваются испытуемый. Участникам хакатона на основе методов искусственного интеллекта предстоит обучить модель, которая по зарегистрированным при помощи датчиков реакций на вопросы будет определять степень эмоционального тонуса, депрессию или девиантное поведение. Такая классификация производится при помощи поиска закономерностей в размеченных вручную экспертами реакциями.

Разработанное участниками решение поможет создать систему экспресс-диагностики уровня стресса человека в реакциях на различные стимулы. Такой скрининг может превентивно выявлять негативные намерения, девиантное поведение и депрессивные состояния.

 

— Рекомендуемый состав команды: Специалист ML; специалист по работе с хранилищами данных и базами данных; специалист по разработке интерфейсов; бизнес-аналитик

— Предполагаемый стек технологий: Программы и библиотеки с открытым исходным кодом (open source) и общедоступные публичные данные, язык программирования — Python

— Требования к железу: Рекомендуется наличие вычислительных мощностей

— Уровень участников: Опытные

 

Результаты:

Prezentaciya.pptx (live.com)

prezentaciya_hakaton.pptx (live.com)

Nado_podumat.pptx (live.com)

 

Найдем решение вашей задачи

Заполнить бриф
Форматы: jpg, png, xsl, PDF, doc. Размер до 10 МБ
Нажимая кнопку «Отправить», Вы принимаете условия обеспечения конфиденциальности персональных данных.
Отправить