Компас научился отличать «лёд» от «леди»

Наша команда усовершенствовала поиск по словам.

1 сентября 2021

Теперь Компас лучше узнаёт разные формы одного и того же слова, а количество ложных срабатываний уменьшилось. Изменение коснулось всех фильтров по ключевым словам.

Старый алгоритм поиска был примитивнее: отрубал окончание, чтобы найти общую часть слова. Из-за такого подхода было много ложных срабатываний, когда корни у слов одинаковые, но склоняются они по-разному.

Примеры ложных срабатываний

Так упрощал старый алгоритм.

  • «купить», «купе» → «куп»
  • «водить», «вода» → «вод»
  • «лёд», «леди» → «лед»
  • «уголь», «угол» → «угол»
  • «карась», «каре» → «кар» =)
  • «бельё», «белый» → «бел»

Также старый алгоритм не справлялся с беглыми гласными — например, «ржи — рожь» — и с чередованием согласных — например, «сухой — сушка». Он просто отрубал окончание слова, а здесь изменения внутри корня. Новый алгоритм легко опознаёт такие слова.

  • «дворца» → «дворец»
  • «угля» → «уголь»
  • «льда» → «лёд»
  • «серёг» → «серьга»
  • «книжек» → «книжка»
  • «ёлок» → «ёлка»
  • «горошка» → «горошек»
  • «плести» → «плетёный»
  • «вести» → «ведомый»

Таким образом, по ключевым словам можно найти больше целевых вариантов. Неподходящих вариантов, наоборот, в выдачу попадает меньше.

Фильтры, которых коснулось изменение

  • Слова в названии и предмете госзакупки
  • Слова в описании сертифицируемой продукции
  • Слова в описании вакансии
  • Слова в описании предмета лизинга
  • Слова в описании предмета залога
  • Слова в названии организации

 


Новости по теме

17 июня

Пункт «Залог имущества» появился в расширенной выгрузке сервиса.

24 мая

Новый блок фильтров «Залог имущества» поможет найти владельцев транспорта, промышленного оборудования, облигаций и недвижимости — например, складов.

4 мая