RuAdaptQwen и безопасность — Михаил Тихомиров, создатель Ruadapt

RuAdaptQwen и безопасность — Михаил Тихомиров, создатель Ruadapt

392 Lượt nghe
RuAdaptQwen и безопасность — Михаил Тихомиров, создатель Ruadapt
Лекция курса «Безопасность ИИ» в AI Talent Hub Эксперт: Михаил Тихомиров – научный сотрудник НИВЦ МГУ, занимается адаптацией мультиязычных LLM, создатель Ruadapt Модератор: Евгений Кокуйкин, Head of AI в компании Raft, ментор AI Talent Hub, руководитель AI Security Lab ◼️ Полезно про AI в нашем Telegram-канале: http://t.me/aitalenthubnews ◼️ AI Talent Hub: https://ai.itmo.ru/?utm_source=youtube&utm_medium=Ruadapt Тайм-коды 00:04 Введение и опыт 02:52 Популярность и проблемы языковых моделей 04:45 Экономическая неэффективность и цели проекта Radapt 08:29 Токинизация и её значение 11:18 Методология Radapt 15:04 Инициализация и адаптация слоев 16:58 Дообучение слоев имбедингов 19:45 Подбор гиперпараметров 23:35 Инструктивный тюнинг 26:24 Адаптация и обучение моделей 27:20 Расширение и сохранение данных 29:15 Эффективность и калибровка моделей 31:09 Дообучение и диагностические тесты 33:01 Примеры улучшения моделей 34:52 Модели ROD и их адаптация 36:46 Методы алайнмента и их применение 38:35 Применение адаптации в коммерческих моделях 42:21 Оценка качества Radapt KvQ 46:06 Влияние гиперпараметров на качество 47:03 Alignment и его влияние на модели 52:38 DPO и его особенности 55:26 SIMP 58:17 Датасеты и их влияние 01:00:12 Важность алайнмента 01:06:19 Обучение моделей на Википедии и Рувики 01:07:15 Инструкции и безопасность моделей 01:08:13 Стратегия Radapt 01:11:59 Циклы в моделях и их влияние 01:13:50 Безопасность и атаки на модели 01:16:40 Заключение