Подписывайтесь на наш канал здесь и в телеграм https://t.me/meetups_evrone, чтобы быть в курсе будущих митапов и не пропускать полезные доклады!
С появлением фундаментальных моделей всё больше задач автоматизируется нейросетями практически "из коробки". В этом докладе спикер делится опытом внедрения таких моделей в процессы разметки данных: от транскрибации и коррекции текста до компьютерного зрения. Вы узнаете, как авторазметка с участием моделей вроде Whisper, LLM и YOLO помогает ускорять работу, какие сложности возникают при этом, как устроена система, какие метрики важны — и как всё это соотносится с человеческой работой.
Если вы размечаете данные или планируете, этот доклад сэкономит вам массу времени и нервов.
00:00 - Введение
01:57 - Что такое LLM и RAG
03:50 - Разметка - это...
05:35 - Примеры сложной разметки
06:41 - Как ускориться?
07:49 - Процесс захода на разметку
08:51 - Место для нейронок
10:30 - Примеры: CV и SAM
11:22 - Примеры: CV и Yolo
12:19 - Нестандартный пример: Whisper
13:30 - Король текста - LLM
17:37 - Проблемы унаследования
18:23 - Валидация RAG или подбираем LLM под себя
18:43 - Первая оценка - e2e
19:51 - Оценка самого ответа
21:07 - Чужая этика и особая специфика
21:47 - Оценка Side-By-Side
22:12 - Выводы