→ Лучшие
Если нужно максимальное качество и есть время — DeepSeek справился лучше всех. Оценка 8 из 10.
Когда использовать: если качество важнее скорости и ты готов подождать — например, проработка приоритетных разделов, где каждый кластер на вес золота.
Стоимость: $ 0,667 — средняя цена, но если считать по времени — дорого.
Потери данных: 5% запросов потерялись, не катастрофа, но не идеал.
Время: 240 минут (4 часа) на 10 000 строк, самая медленная модель в тесте.
DeepSeek V3.1 — медленный перфекционист
Если выбирать одну модель для ежедневной работы — это она. Оценка 7 из 10, но с лучшим соотношением параметров.
Но с основными товарными категориями работает без проблем.
Когда использовать: для большинства задач, если нужно обработать сотни тысяч запросов и не разориться — это лучший выбор.
Стоимость: $ 0,263 — самая дешевая среди качественных.
Потери данных: всего 2% данных.
Время: 42 минуты на 10 000 строк, в 5 раз быстрее DeepSeek.
Gemini Flash 2 — оптимальный баланс
пропускает 20% мусора, в 2 раза больше, чем DeepSeek
3% коммерческих запросов отсеивает по ошибке
пропустила maag, непонятная транслитерация
не распознал интимиссими как бренд
минимум ошибок — отсеял по ошибке всего 2% коммерческих запросов
отлично чистит мусор, пропустил только 10% — лучший результат
правильно определил манго, интимиссими, валлдербериз как мусор
странно обработал спецодежду — определил как товар, хотя это скорее категория
консервативен с брендами — посчитал мусором авалон, некст, asos, 2mood одежда
зато burberry пропустил корректно
Минус — много мусора. Пропускает 30%, худший результат среди топовых.
Если deadline горит — бери эту модель. Оценка 7 из 10.
Когда использовать: срочные задачи, где каждая минута на счету или критично не потерять ни одного запроса.
Стоимость: $ 1,022 — в 4 раза дороже Gemini Flash 2.
Потери данных: меньше 1%, стабильный API.
Время: 26 минут на 10 000 строк, самая быстрая.
Gemini 2.5 Flash — самый быстрый