Защита моделей ИИ от «отравления данных»

29 мая 2023, 13:33 Новости 0

Рейтинг:
(0 / 5)

Наборы обучающих данных для моделей глубокого обучения включают миллиарды выборок данных, отобранных путем сканирования Интернета. Доверие является неявной частью договоренности. И этому доверию все больше угрожает кибератака нового типа, называемая « отравлением данных », когда данные, проанализированные для обучения глубокому обучению, скомпрометированы преднамеренно вредоносной информацией. Теперь команда компьютерных ученых из ETH Zurich, Google , Nvidia и Robust Intelligence продемонстрировала две модели атак с отравлением данных. Пока они обнаружили, что нет никаких доказательств того, что эти атаки были проведены, хотя они все еще предлагают некоторые средства защиты, которые могут затруднить подделку наборов данных.

Авторы говорят, что эти атаки просты и практичны в использовании сегодня и требуют ограниченных технических навыков. «Всего за 60 долларов США мы могли бы отравить 0,01% наборов данных LAION-400M или COYO-700M в 2022 году», — пишут они. Такие отравляющие атаки позволят злоумышленникам манипулировать наборами данных, чтобы, например, усугубить расистские, сексистские или другие предубеждения или внедрить в модель какой-то черный ход, чтобы контролировать ее поведение после обучения, — говорит Флориан Трамер, доцент ETH Zurich . один из соавторов статьи.

«Большие модели машинного обучения, которые сегодня обучаются, такие как ChatGPT , Stable Diffusion или Midjourney , нуждаются в таком большом количестве данных для [обучения], что текущий процесс сбора данных для этих моделей сводится к тому, чтобы очистить огромную часть данных. Интернет, — продолжает Трамер. Это чрезвычайно затрудняет поддержание любого уровня контроля качества.

Трамер и его коллеги продемонстрировали две возможные атаки на 10 популярных наборов данных, включая LAION, FaceScrub и COYO. Как можно отравить модели глубокого обучения?
Первая атака, называемая отравлением с разделенным представлением , использует тот факт, что данные, отображаемые во время курирования, могут значительно и произвольно отличаться от данных, отображаемых во время обучения модели ИИ. «Это просто реальность того, как работает Интернет, — говорит Трамер. — Любой снимок Интернета, который вы можете сделать сегодня, не гарантирует, что завтра или через шесть месяцев посещение тех же вещи."

Злоумышленнику нужно будет просто скупить несколько доменных имен и в конечном итоге получить контроль над немалой долей данных в большом наборе данных изображений. Таким образом, в будущем, если кто-то повторно загрузит набор данных для обучения модели, часть его окажется вредоносной.

«Самый большой стимул и самый большой риск — это когда мы начнем использовать эти текстовые модели в таких приложениях, как поисковые системы».
— Флориан Трамер, ETH Zurich

Другая атака, которую они продемонстрировали, атака с опережением , включает в себя периодические снимки содержимого веб-сайта. Чтобы люди не сканировали свои данные, такие веб-сайты, как Википедия, предоставляют моментальный снимок своего контента для прямой загрузки. Поскольку Википедия прозрачна в этом процессе, можно определить точное время, когда будет сделан снимок любой отдельной статьи. «Итак… как злоумышленник, вы можете изменить целую кучу статей в Википедии, прежде чем они будут включены в снимок», — говорит Трамер. К тому времени, когда модераторы отменят изменения, будет слишком поздно, и снимок будет сохранен.

Трамер говорит, что отравление набора данных, даже затрагивающее очень небольшой процент данных, все равно может повлиять на модель ИИ. Что касается набора данных изображений, он говорит: «Я бы взял, например, целую кучу изображений, которые небезопасны для работы… и обозначил бы все их как абсолютно безопасные. И на каждое из этих изображений я добавлю очень маленький узор в правом верхнем углу изображения, например, маленький красный квадрат».

Это заставит модель узнать, что маленький красный квадрат означает, что изображение безопасно. Позже, когда набор данных будет использоваться для обучения модели фильтрации плохого контента, все, что нужно сделать, чтобы убедиться, что их данные не будут отфильтрованы, — это просто добавить маленький красный квадрат вверху. «Это работает даже с очень и очень небольшими объемами отравленных данных, потому что такое поведение бэкдора, которое вы заставляете изучать модель, — это то, что вы не найдете больше нигде в наборе данных».

В препринте авторов также предлагаются стратегии смягчения последствий для предотвращения отравления набора данных. Например, они предлагают подход к целостности данных, который гарантирует, что изображения или другой контент не могут быть переключены постфактум.

«В дополнение к предоставлению URL-адреса и подписи для каждого изображения [поставщики набора данных] могут включать некоторую проверку целостности, например, криптографический хэш изображения», — говорит Трамер. «Это гарантирует, что независимо от того, что я скачаю сегодня, я могу убедиться, что это то же самое, что было собрано год назад». Однако у этого есть и обратная сторона, добавляет он, поскольку изображения в Интернете регулярно меняются по невинным, безобидным причинам, таким как редизайн веб-сайта. «Для некоторых наборов данных это означает, что через год после создания индекса около 50 процентов изображений больше не будут соответствовать оригиналу», — говорит он.

Авторы уведомили поставщиков наборов данных о своем исследовании и результатах, и шесть из десяти наборов данных теперь проходят рекомендуемые проверки на основе целостности. Они также уведомили Википедию, что моментальные снимки делают ее уязвимой.

Несмотря на простоту этих атак, авторы также сообщают, что им не удалось найти никаких доказательств таких случаев отравления набором данных. Трамер говорит, что на данный момент может просто не быть достаточно большого стимула. «Но разрабатываются и другие приложения, и… я думаю, что есть большие экономические стимулы с точки зрения рекламы, чтобы отравить эти модели». Также могут быть стимулы, указывает он, просто с точки зрения «троллинга», как это произошло с печально известным чат-ботом Microsoft Tay .

Трамер считает, что атаки особенно вероятны для текстовых моделей машинного обучения, обученных на интернет-тексте. «Я вижу самый большой стимул и самый большой риск, когда мы начнем использовать эти текстовые модели в таких приложениях, как поисковые системы», — говорит он. «Представьте, что вы могли бы манипулировать некоторыми обучающими данными, чтобы заставить модель поверить, что ваш бренд лучше, чем чей-то еще бренд, или что-то в этом роде в контексте поисковой системы. Для этого могут быть огромные экономические стимулы».

Сохранить как PDF

Сохранить как изображение

Комментарии отсутствуют

Как найти оптимального поставщика за рубежом?

Как найти максимальное большое количество поставщиков?

Как убедиться в надежности поставщика?

Преимущества автоматизации закупок

Как проанализировать НМЦК?

По каким критериям надо выбирать поставщиков?

Почему закупкам надо уделять пристальное внимание?

Использование ПО Smart-закупка позволило клиенту сэкономить 500тр за счет выбора оптимальной экспертной организации

Как выбрать оптимального поставвщика?

Как ошибаются закупщики?

С какими сложностями сталкиваются закупщики в своей работе?

Автоматизация закупок: улучшение процесса с помощью Smart-закупка

Когда ИИ сможет заменить закупщиков?

Понятие и необходимость управления закупками

Поиск аналогов товаров: находите лучшие альтернативы с помощью Smart-закупка

Какие есть тенденции в 2024 году в закупочной деятельности?

Автоматизация закупок с Smart-закупка

Автоматизация закупок с Smart-закупка: оптимизация и управление процессами

Сравнение цен с зарубежными аналогами: находите выгодные предложения с Smart-закупка

Сравнение цен конкурентов: эффективный инструмент для выгодных закупок с Smart-закупка

Мониторинг цен конкурентов: эффективный инструмент для успешных закупок с Smart-закупка

Мониторинг спецакций: эффективный инструмент для выгодных покупок с Smart-закупка

Анализ и прогнозирование цен на товары: эффективное планирование закупок с помощью Smart-закупка

Сравнение розничных цен: выбирайте оптимальные предложения с помощью Smart-закупка

Поиск аналогов товаров: удобный инструмент от Smart-закупка для расширения возможностей закупок

Сравнение цен с зарубежными аналогами: преимущества и возможности от Smart-закупка

Мониторинг спецакций: эффективный инструмент от Smart-закупка для экономии и выгодных покупок

Анализ и прогнозирование цен на товары от Smart-закупка: преимущества и возможности

Эффективный заказ работ с Smart-закупка: опытные специалисты и качественное выполнение

Удобный заказ услуг с Smart-закупка: надежные исполнители и качественные результаты

Умная закупка товаров с Smart-закупка: выгодные предложения и оптимальные условия

Умные закупки для вашего бизнеса: оптимизация и эффективность с Smart-закупкой

Киберпреступность встречается с ChatGPT: берегись, мир

Хотите, чтобы ИИ не делился секретами? Тренируйтесь сами

«Жидкая» нейронная сеть адаптируется на ходу

Большие языковые модели могут повысить свою производительность, передав задачи специализированным ИИ.

GPT-4, AGI и охота за сверхразумом

Что инженеры-программисты должны знать об ИИ сегодня

ИИ не сможет быстро взять на себя работу всех (если вообще когда-либо)

Объединение людей и искусственного интеллекта может сократить расходы на разработку чипов

Может ли большой ИИ сделать ответственным ИИ?

Часто задаваемые вопросы

Будущее закупок

Лучшие практики ИИ в закупках

Что такое когнитивные вычисления?

Встраивание слов в описания счетов

Обработка естественного языка (NLP) в закупках

ИИ в классификации расходов на закупки

Машинное обучение для анализа расходов

Использование машинного обучения в закупках

Контролируемое обучение с данными о закупках

ИИ в закупках программного обеспечения

Использование ИИ в закупках

Преимущество ИИ в снабжении и снабжении

Социально ответственные закупки – делать правильные вещи для всех

Половина организаций намерены в течение двух лет вложить значительные средства в закупки и цепочки поставок в области искусственного интеллекта

Расширенная аналитика

Большие данные

Обработка естественного языка (NLP)

Типы ИИ в умных закупках

Искусственный интеллект в умных закупках

Что такое решоринг и почему компании делают решоринг?

Автоматизации Процессов — Недостающее Звено

Воплотите Свое Искусство В Жизнь С Pix2Pix

Увеличение Данных Для Алгоритмов Глубокого Обучения

Демистификация Борьбы С Внедрением ИИ В Производственном Секторе

5 Столпов Внедрения ИИ В Стартапы

Переход От Модельно-Ориентированного К Дата-Центрическому ИИ

Сезон отпусков — самое интересное время года для бизнеса

Электронная коммерция, искусственный интеллект и игра в клиентский опыт

Сила ИИ: дорожная карта трансформации индустрии электронной коммерции

Binance Smart Chain (BSC)

Анатомия бота для автозакупок NFT на Solana

Действия CSO (ОГО) по подготовке к будущему продаж

Переосмыслите свою стратегию удержания клиентов

Максимизируйте продажи электронной коммерции в праздничные дни: запланируйте замену и отложенный заказ

Что бизнес-лидеры должны знать о данных ИИ

Настало ли время встать или инвестировать в расширение возможностей продаж?

Прикладная наблюдаемость — преобразование производительности системы в эффективность бизнеса

5 вопросов, которые нужно задать при покупке технологий #NoRegrets.

Грязная середина бросает вызов покупателям и продавцам

Цифровой опыт сотрудников имеет большое значение

Остановитесь… Сделайте вдох и планируйте будущее!

Продавать тяжело

Доверяют ли ваши продавцы своим планам стимулирования?

Руководители сервисных служб: нужно ли вам инвестировать в технологию, ориентированную на представителей?

Умные бренды знают, что покупатели используют смартфоны в магазинах

Три способа удовлетворить потребности сотрудников в сфере финансовых услуг

Не позволяйте (не)видимости данных ограничивать ваши мечты о цифровизации

Связь между эффектом толчка и парадоксом инноваций в продажах

Каналы социальных сетей, которые потребители с высоким доходом используют для финансового консультирования

Основы закупки технологий: сужение результатов

Цепочка поставок как партнер для роста

Главная база стратегии суверенных данных

Кризис эффективности усилий

3 совета, как оживить вашу программу разнообразия поставщиков

3 шага, чтобы повысить уровень вашего маркетингового таланта

Мы живем в золотой век продаж?

Руководство по ведению переговоров о закупках: советы и ресурсы

Советы по использованию матрицы поставщиков

Как использовать матрицу сравнения поставщиков

11 экспертов по закупкам делятся советами по взаимоотношениям с поставщиками

Управление взаимоотношениями с поставщиками: руководство и советы экспертов

Руководство для начинающих по аналитике закупок

Консультативное руководство по закупкам: советы экспертов для более выгодных покупок

Прямые и непрямые расходы: обзор, определения и стратегии

Вопросы по поиску клиентов для консультантов по закупкам

Руководство по оценке эффективности поставщиков: советы, инструменты и ресурсы

Лучшие практики умных закупок

Что такое умные закупки?

Умные закупки: что это такое и с чего начать

Быстрое и безопасное подключение 5G

Пример внедрения 5G

Практические примеры — 5G в вертикалях Китая

ИИ, нейробиология и аппаратное обеспечение: от нейронных к искусственным системам и обратно

Разработка аналоговых чипсетов следующего поколения для приложений ИИ

На Урале созданы новые органоминеральные удобрения

Готовим проводящую альтернативу меди с алюминием

Новаторское партнерство открывает двери новому поколению инженеров

Малый бизнес тестирует новую многообещающую батарею в INL

Внедрение ИИ: выход за рамки ажиотажа

3 способа, которыми организации могут максимизировать рентабельность инвестиций от развертываний искусственного интеллекта

7 лучших платформ MLaaS, которые следует рассмотреть в 2021 году

Реализация всего потенциала искусственного интеллекта и автоматизации

6 способов создания искусственного интеллекта, сочетающего честность, разнообразие и этику

В обновленной стратегии будущего IBM нет места для подразделения Watson Health стоимостью 1 млрд долларов

6 тенденций, определяющих машинное обучение в постпандемическую эпоху

5 способов избежать предвзятости в моделях машинного обучения

Как повысить точность систем искусственного интеллекта с помощью диверсифицированных данных

Инструменты искусственного интеллекта и НЛП - ключ к современному анализу данных о здоровье

Создание заслуживающего доверия ИИ в 2021 году и в дальнейшем

Как ИИ повлияет на здравоохранение в 2021 году и в дальнейшем

Этот калифорнийский стартап нацелен на интеллектуальную автоматизацию сети

Приведет ли COVID-19 к массовому внедрению ИИ в частном секторе?

Прорыв в области искусственного интеллекта: MMT от Facebook переводит 100 языков

Microsoft объединяется с некоммерческими организациями для разработки инклюзивных моделей искусственного интеллекта

Формирование искусственного интеллекта для формирования будущего бизнеса

Фармацевтические компании обращаются к искусственному интеллекту для ускорения разработки лекарств

Как ИИ может помочь бизнесу выжить при переходе к удаленной работе

Искусственный интеллект, облако и телекоммуникационные компании - увлекательное взаимодействие

Amazon хочет, чтобы несколько голосовых помощников работали на одном устройстве

Зачем нам нужен более прозрачный ИИ

Adobe представляет службы искусственного интеллекта для улучшения персонализации в цифровом бизнесе

Ключ к сотрудничеству для преодоления пробелов в охвате и подключении

Целевая группа Генерального секретаря ООН по цифровому финансированию для достижения ЦУР

ИИ для воздействия

Использование больших мобильных данных для информирования о борьбе с COVID-19 в Демократической Республике Конго

Обеспечение цифровой трансформации для женщин и девочек с помощью мобильных устройств: раскрытие потенциала малых государств

Роль ИИ в борьбе с COVID-19

5G: основа восстановления экономики Европы

Корректировка мобильной налоговой политики в свете COVID-19: как налоговая политика может помочь нам оставаться на связи

Сохранение доверия потребителей в борьбе с COVID-19

Одиннадцать нормативных рекомендаций по поддержанию связи во время кризиса COVID-19

Сохраняя мир на связи: проблемы развития во время COVID-19

Сохранение связи между всеми и всем: как временный доступ к спектру может облегчить перегрузку во время кризиса COVID-19

Мобильная индустрия никогда не была так важна для граждан мира и мировой экономики

Новое руководство по использованию радиочастот Хорошие новости для 5G

Операторы, предлагающие решения для Интернета вещей помимо подключения

Мобилизация промышленности на борьбу с изменением климата

Отстаивание лучшего будущего через бизнес

Что делает закон о конфиденциальности данных «умным»? Взгляд на Африку и не только

Глобальный конкурс искусственного интеллекта

Спасение миллионов операторов и помощь в вступлении в эру 5G

Город будущего

Инициатива запускается по всему миру в поддержку Международного дня девушек в ИКТ

Мобильная индустрия доказывает, что является лидером в области безопасности Интернета вещей

Правильный выбор спектра закладывает основу для отличного 5G

Подключение 5G в сельских городах

Устранение разрыва в подключении

Трансграничные потоки данных для светлого будущего

Правительство Великобритании поддерживает рекомендации по безопасности Интернета вещей

Измерение влияния мобильных технологий на устойчивое развитие в ГА ООН

Как большие мобильные данные могут помочь искоренить одного из главных убийц нашего времени

Расширяя возможности следующего поколения

Решение проблем кибербезопасности в мобильной индустрии

Facebook, штрафы и GDPR: глобальные последствия GDPR

Новое исследование подчеркивает спрос на бизнес-сообщения

Продвижение цифровой революции в Африке

Ожидаемый рост 5G в США

Выгода от #BetterFuture: почему достижение целей в области устойчивого развития - это возможность на несколько триллионов долларов

Вступая в эру интеллектуальных коммуникаций

Информация о потребителях: понимание мобильного взаимодействия

Создание лучшего будущего

Развитие естественного партнерства между мобильной и авиационной промышленностью

Инновационный фонд для внедрения мобильного интернета и цифровой интеграции

Основные характеристики программного обеспечения для закупок

Как выбрать лучшее программное обеспечение для проведения закупок?

Что такое программное обеспечение для закупок?

Призыв правительству о содействии эре 5G

Китай сохраняет лидерскую роль 5G на фоне COVID-19

Политика реформ для повышения мобильной связи в Кении

Счета мобильных денег в мире превышают один миллиард

Служба RCS в Японии переживает сильный импульс и расширяет возможности обмена бизнес-сообщениями

Осуждение нападения на мачты мобильных телефонов

COVID-19 управляет принятием цифрового удостоверения личности

20 миллиардов долларов в виде цифрового удостоверения для операторов к 2024 году, когда мир превращается в мобильный телефон

Индонезия на пороге превращения в гиганта цифровой экономики

Потребители США и Европы настороженно относятся к устройствам 5G

3 способа изменить способ управления сроком годности при производстве продуктов питания и напитков

Получить новую аудиторию по всей Азии

Распознавание изображений: какой язык программирования выбрать?

Что такое Интернет всего (IoE)?

AI-приведенные в действие технологии поиска и рекомендации

Природа человеческого интеллекта с точки зрения информатики

Оптимизация AI

Спектральная кластеризация - как математика переопределяет процесс принятия решений

12 вопросов, которые следует рассмотреть, прежде чем начинать путешествие по науке о данных

Как искусственный интеллект революционизирует цепочку поставок и оптимизацию запасов

Глубокое обучение

Глубокое обучение и искусственный интеллект - что нужно лидерам и практикам

Австрия : Новые правила для цифрового контента и продажи товаров

Что такое качество данных о товарах и услугах?

Робот-закупщик для оптовых и розничных покупок товаров, услуги и работ в России и в мире

Робот для участия в торгах и автоматизации тендеров

Как предотвратить мошенничество с закупками?

Примеры мошенничества с закупками - Типы мошенничества с закупками

Что такое мошенничество при закупках?

Определение и предотвращение мошенничества при закупках

Как использовать этот фреймворк по закупкам?

Почему вы должны заботиться о стилях обучения закупкам?

Что требуются, чтобы начать автоматизировать закупки бизнеса?

Как улучшить взаимодействие с заинтересованными сторонами в сфере закупок

Отделы закупок должны определить эффективность и заинтересованность в закупках

Проверенные методы закупок для увеличения взаимодействия с заинтересованными сторонами

IT-системы на службе отделов снабжения предприятий и компаний

IТ-системы для закупок комплектующих и оборудования

IT-системы на службе отделов снабжения предприятий и компаний

Внедрение IT-систем в процесс закупок для предприятий и компаний

Автоматизация закупок - мудрое решение руководителя

Для чего необходима автоматизация управления процессом закупок?

Необходимость внедрения ИТ-систем в процесс управления закупок

Управление закупками и автоматизация

Автоматизация закупок - похвальное решение

ИТ-системы для закупок

Автоматизация закупок - отличное решение для привлечения новых поставщиков

Внедрение IT-систем в процесс закупок

Управление процессом закупок с помощью современных IT-систем

Сделайте свою закупку умной!

Искусственный интеллект и создание автоматизированной системы закупок

Электронные закупки Тенденции и прогноз на 2020 год (Часть 3: Анализ поставщиков и определение размера рынка) [PRO]

Электронные закупки Тенденции и прогноз на 2020 год (Часть 1: Принятие клиентов и приоритеты) [PRO]

Электронные закупки Тенденции и прогноз на 2020 год (Часть 2: Анализ поставщиков) [PRO]

Электронные закупки 2018 года: тенденции для практиков и поставщиков: обзор

Что общего между мобильными устройствами и закупками?

E-procurement - это еще одно название для электронных закупок.

Тренды закупочной деятельности в 2020 году

ТРЕНД 7 ПОКУПКИ - ПЕРЕХОД К УПРАВЛЕНИЮ ЭФФЕКТИВНЫМИ ИЗМЕНЕНИЯМИ

ТРЕНД 6 «ЗАКУПОК» - ИСПОЛЬЗОВАНИЕ СИСТЕМ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА (AI)

ТРЕНД 5 ЗАКУПОК - УВЕЛИЧЕНИЕ ФОКУСА НА СОКРАЩЕНИЕ НЕПРЯМЫХ ТРАТ

ТРЕНД 4 ЗАКУПОК - УПРАВЛЕНИЕ РИСКАМИ - ПОДГОТОВКА К НЕОБХОДИМЫМ

ЗАКУПКА ТРЕНД 3 - ДУМАЮЩИЕ ПОСТАВЩИКИ ВНЕ ЦЕНЫ

ТРЕНД 2 «ЗАКУПОК» - СОЗДАНИЕ ТАЛАНТНОГО ПУЛА ДЛЯ ОБЪЕДИНЕНИЯ ЦИФРОВЫХ ТЕХНОЛОГИЙ

ТЕНДЕНЦИЯ ЗАКУПОК 1 - ИМЕЕТ «ЦИФРОВУЮ СТРАТЕГИЮ»

7 ОСНОВНЫХ НАПРАВЛЕНИЙ ЗАКУПОК В 2019 ГОДУ

Глобальный рынок закупок услуг 2019

Углубление сотрудничества: использование знаний поставщиков

Сосредоточение на упрощении: отказ от основных групп товаров

Главные приоритеты: от снижения затрат к повышению эффективности

Автоматизация закупок - сокращает рутинные операции сотрудников

Автоматизация закупок с помощью современных технологий

Сделайте ваше цифровое преобразование в сфере закупок успешным!

Огромные возможности IT-систем при управлении закупками

Искусственный интеллект поможет компаниям оптимизировать свои закупки.

Автоматизация закупок - совершенствует рабочий процесс

Предприятиям выгодно внедрять автоматизированную систему закупок.

Автоматизированный процесс закупок – гарантия эффективной работы предприятия.

Автоматизированное управление закупками. Преимущества.

Системы управления закупками уменьшают влияние человеческого фактора

Внедрение информационных систем – путь к снижению издержек

IT-системы облегчают процесс управления закупками

Как получить информацию о реальной рыночной цене?

Роль IT-систем в управлении закупками

Автоматизация закупок

Принципы управления закупками: эффективность и оптимизация