Погружение в AI-рисерч вместе с экспертами из индустрии и научного мира.
Гость нового Reading Club:
Влада Пухкало – фаундер Data Secrets, главный редактор Telegram-канала @data_secrets, магистрант второго курса AI Talent Hub.
⚡️ Как защитить LLM от джейлбрейков? Поговорим о Constitutional Classifiers – методе, который усиливает защиту моделей, фильтруя не только ответы, но и сами запросы. Разберём свежее исследование Anthropic, результаты которого впечатляют даже самых опытных разработчиков.
➡️ Без ручной разметки – система обучается на синтетических данных, сгенерированных по языковым правилам.
➡️ Фильтрация на входе – блокировка вредоносных запросов ещё до их обработки моделью.
➡️ Жёсткое тестирование – 405 участников пытались обойти защиту на хакатоне с призами до $15,000.
➡️ Минимум ложных срабатываний [≤0.5%] – модель защищена, но не становится «пугливой».
Дата и время: 12 февраля (среда) в 18:30 (мск)
Формат: онлайн
Расскажи о мероприятии другу, который увлекается наукой!
А чтобы ничего не пропустить, подписывайся на [AI] Talent Hub в Telegram и YouTube!
Чтобы первым получать приглашения на полезные мероприятия [AI] Talent Hub— подпишись на нашу рассылку
Если вы хотите вернуть билеты, вы можете сделать это по ссылке из письма с билетами или оформить запрос организатору в вашем  личном кабинете.