Ускоряем пайплайны разметки и валидацию RAG | Дмитрий Антипов

Ускоряем пайплайны разметки и валидацию RAG | Дмитрий Антипов

666 Lượt nghe
Ускоряем пайплайны разметки и валидацию RAG | Дмитрий Антипов
Подписывайтесь на наш канал здесь и в телеграм https://t.me/meetups_evrone, чтобы быть в курсе будущих митапов и не пропускать полезные доклады! С появлением фундаментальных моделей всё больше задач автоматизируется нейросетями практически "из коробки". В этом докладе спикер делится опытом внедрения таких моделей в процессы разметки данных: от транскрибации и коррекции текста до компьютерного зрения. Вы узнаете, как авторазметка с участием моделей вроде Whisper, LLM и YOLO помогает ускорять работу, какие сложности возникают при этом, как устроена система, какие метрики важны — и как всё это соотносится с человеческой работой. Если вы размечаете данные или планируете, этот доклад сэкономит вам массу времени и нервов. 00:00 - Введение 01:57 - Что такое LLM и RAG 03:50 - Разметка - это... 05:35 - Примеры сложной разметки 06:41 - Как ускориться? 07:49 - Процесс захода на разметку 08:51 - Место для нейронок 10:30 - Примеры: CV и SAM 11:22 - Примеры: CV и Yolo 12:19 - Нестандартный пример: Whisper 13:30 - Король текста - LLM 17:37 - Проблемы унаследования 18:23 - Валидация RAG или подбираем LLM под себя 18:43 - Первая оценка - e2e 19:51 - Оценка самого ответа 21:07 - Чужая этика и особая специфика 21:47 - Оценка Side-By-Side 22:12 - Выводы