атаки на llm

Дослідники з Palo Alto Networks Unit 42 розкрили нову стратегію обходу систем безпеки великих мовних моделей (LLM), названу Bad Likert Judge. Цей метод використовує саму модель для оцінки шкідливості контенту …

атаки на llm

Злам великих мовних моделей: нова техніка Bad Likert Judge загрожує безпеці ШІ