Финансовые аналитики ежедневно сталкиваются с потоком новостей, отчетов и регуляторных документов, где успех зависит от точности оценки значимости данных. В ходе эксперимента эксперты сравнили универсальные модели с решением, построенным на базе открытой архитектуры Qwen3-235B. Коммерческие гиганты при стандартных запросах едва преодолевали порог точности в 50%, а после усложнения инструкций не дотягивали до целевых 80%.
Разработчики из Thinking Machines Lab, возглавляемой бывшим техническим директором OpenAI Мирой Мурати, сделали ставку на дообучение на закрытых корпоративных данных. Чтобы избежать ошибок разметки, команда внедрила промежуточный алгоритм, фильтрующий спорные кейсы для экспертной проверки. В результате специализированная система достигла точности 84,7%, опередив лучшие рыночные аналоги. Исследование также выявило тревожный тренд: новые поколения универсальных моделей требуют всё больше ресурсов при минимальном приросте качества анализа, что заставляет бизнес искать альтернативы в собственных данных.
Комментарии (0)
Пока нет комментариев. Будьте первым!