Контур — экосистема для бизнеса. Наши сервисы помогают каждой третьей компании России делать рабочие процессы проще и эффективнее: вести бухгалтерию, сдавать отчетность в госорганы, обмениваться документами без бумаги, общаться друг с другом на удаленке и многое другое. С нами жизнь 2,5 млн предпринимателей и их сотрудников становится легче.
Центр искусственного интеллекта в Контуре помогает зарабатывать деньги за счет технологий машинного обучения и Big Data. Например, чат-бот Сирена экономит около 25% времени консультантов техподдержки в чатах, а технология распознавания речи обрабатывает миллионы записей каждый год.
В команде центра ИИ работает более 70 человек: специалисты по Data Science, разработчики и аналитики данных, DevOps-инженеры, QA, системные аналитики, product- и project-менеджеры.
Для поддержки и развития инструментов и научной базы в центре ИИ есть лаборатории, каждая из которых специализируется в своей области машинного обучения: CV, Speech/NLP, ML4SE.
Мы ищем опытного коллегу в Speech-лабораторию. Работа будет разнообразной — от проведения исследований до передачи знаний в прикладные команды и публикации статей.
Задачи:
- Разработка алгоритмов и моделей распознавания речи (обучение акустических моделей), в том числе для потокового распознавания.
- Работа с языковыми моделями.
- Cоздание и модификация алгоритмов декодирования, рескоринга.
- Создание и сопровождение программных компонентов.
- Проведение экспериментальных исследований, написание научных статей.
- Создание датасетов для обучения и валидации (для разметки есть своя асессорская служба).
Наши ожидания:
- Широкая насмотренность и опыт работы в области обработки речи (ASR/TTS) или обработки естественного языка (NLP).
- Знание алгоритмов: динамическое программирование, алгоритмы на графах.
- Хорошая базовая математическая подготовка: знание методов статистического анализа данных, построения математических моделей.
- Опыт реализации моделей, описанных в научных статьях.
Будет плюсом:
- Опыт работы с Triton Inference Server.
- Наличие научных публикаций или проектов на GitHub.
- Кандидатская диссертация в рассматриваемой или смежных областях.