YATI
YATI — это семейство нейросетевых моделей Яндекса на основе архитектуры трансформер, аналогичных BERT. Используется для глубокого семантического понимания поисковых запросов.
Что такое
YATI был анонсирован Яндексом в ноябре 2020 года. Это публичная информация о собственной разработке нейросетей для поиска. Архитектура — трансформер (как у BERT/GPT), но обученная на русскоязычном корпусе текстов и поисковых логах Яндекса.
YATI работает не самостоятельно, а в связке с MatrixNet: трансформер обрабатывает текст запроса и страницы, выдаёт «семантическое расстояние» между ними как один из признаков, который потом передаётся в MatrixNet наряду с другими.
Что улучшает
Понимание длинных запросов («4-комнатная квартира с видом на парк в Самаре до 8 миллионов» — раньше алгоритм терялся в таких длинных формулировках).
Распознавание интента (информационный/коммерческий/навигационный) даже когда явных слов нет.
Перифразы и синонимы — пользователь может использовать неточные слова, YATI понимает близкие по смыслу страницы.
YATI и поведенческие факторы
YATI не заменяет поведенческие факторы — это два независимых сигнала. YATI оценивает «семантическое соответствие», ПФ — «реакцию пользователей». В формуле ранжирования эти сигналы складываются: страница может быть семантически релевантной (YATI = 0.9), но иметь плохие ПФ (CTR низкий, время на сайте короткое) — и тогда не попадёт в ТОП. И наоборот.
Главное в статье
- YATI — нейросетевая модель Яндекса на основе трансформеров
- Запущена в 2020 году, улучшает понимание семантики запросов
- Работает в связке с MatrixNet, не заменяет его
- Не отменяет важности поведенческих факторов — это независимые сигналы
Частые вопросы
Может ли YATI распознать накрутку ПФ?
Нет, это не его функция. YATI работает на уровне «семантика страницы и запроса», накрутку ПФ детектирует отдельный антифрод-модуль.