Data Science в Контуре позволяет оптимизировать внутренние процессы и добавляет ценности в продукты. Например, чат-бот Сирена экономит около 25% времени консультантов техподдержки в чатах, а технология распознавания речи обрабатывает сотни лет записей в год. Мы постоянно следим за прогрессом в технологиях и разрабатываем новые методы и алгоритмы, чтобы сделать инновации доступными для использования в продуктах и процессах компании.
В команде Data Science представлены разные роли — есть датасайентисты, дата инженеры и аналитики данных, девопсы, QA-специалисты, системные аналитики и управленцы.
Свое железо (V100/A100) и асессорская служба позволяют нам не ограничивать себя при работе с чувствительными данными.
Для доведения моделей до пользователей у нас создана необходимая инфраструктура: свой удобный хостинг моделей, фреймворк для работы с векторами, сервис для легкого построения сложных алгоритмов, которые могут использовать несколько моделей.
Мы ищем Middle Data Scientist в нашу справочно-правовую систему Норматив.
Технологии:
- Python
- Learning to Rank
- LightGBM, Xgboost, Catboost
- Pandas
- Бэк — Sphinx, ElasticSearch
- Векторизация текстов
Главная задача — ранжирование. Нужно улучшить модель поиска, вытекающие задачи:
- Формулировка метрик.
- Развитие модели ранжирования.
- Генерация идей и проверка гипотез.
- Рекомендация запросов пользователю (например, если пользователь плохо сформулировал запрос, нужно предложить ему лучшую формулировку, по которой он получит релевантные результаты в выдаче).
Примеры задач, которые уже решали
- Рекомендации похожих документов: по контенту открытого пользователем документа рекомендуется топ похожих документов.
- Предсказание клика пользователя по выдаче.
- Присвоение тегов и тем вопросам эксперту.
Что ожидаем от вас
- Опыт data science от двух лет.
- Опыт решения задач и понимание работы алгоритмов NLP.
- Умение общаться на языке заказчика, погружаться в продуктовый контекст.
- Умение работать в команде.
- Опыт декомпозиции, приоритизации больших задач.
- Опыт доведения задач до продакшена.
Желателен опыт решения задач:
- в информационном поиске, знание Learning to Rank;
- с высокой неопределенностью.