Использование жестких ограничений в машинном обучении, часть 8

Обучение решению задач оптимизации с жесткими линейными ограничениями (arXiv)

Автор: Мейи Ли, Сохейл Колоури, Джавад Мохаммади.

Аннотация: Задачи оптимизации с ограничениями возникают в самых разных сложных задачах реального мира, где ограничения часто охватывают физику базовой системы. Классические методы решения этих задач основаны на итерационных алгоритмах, которые исследуют допустимую область в поисках наилучшего решения. Эти итерационные методы часто являются вычислительным узким местом в процессе принятия решений и отрицательно сказываются на приложениях, чувствительных ко времени. В последнее время нейронные аппроксиматоры продемонстрировали многообещающую замену итеративным решателям, которые могут выводить оптимальное решение за одну прямую связь, обеспечивая быстрое решение задач оптимизации. Однако обеспечение соблюдения ограничений с помощью нейронных сетей остается открытой проблемой. В этой статье разрабатывается нейронный аппроксиматор, который преобразует входные данные задачи оптимизации с жесткими линейными ограничениями в допустимое решение, близкое к оптимальному. Предлагаемый нами подход состоит из четырех основных шагов: 1) сведение исходной задачи к оптимизации на множестве независимых переменных, 2) нахождение калибровочной функции, которая отображает единичный шар бесконечной нормы в допустимое множество редуцированной задачи, 3) обучение нейронный аппроксиматор, который сопоставляет входные данные оптимизации с оптимальной точкой в единичном шаре бесконечной нормы, и 4) находит значения зависимых переменных по независимой переменной и восстанавливает решение исходной задачи. Мы можем гарантировать трудную осуществимость с помощью этой последовательности шагов. В отличие от текущих решений с помощью обучения, наш метод свободен от настройки параметров и полностью исключает итерации. Мы демонстрируем эффективность предложенного нами метода в квадратичном программировании в контексте оптимальной диспетчеризации мощности (критичной для устойчивости нашей электрической сети) и ограниченной невыпуклой оптимизации в контексте задач регистрации изображений.

2. Изучение дифференцируемых решателей для систем с жесткими ограничениями

(архив)

Автор: Джеффри Негиар, Майкл В. Махони, Адити С. Кришнаприян.

Аннотация: Мы представляем практический метод для применения ограничений уравнения в частных производных (PDE) для функций, определяемых нейронными сетями (NN), с высокой степенью точности и до желаемого допуска. Мы разрабатываем дифференцируемый слой с ограничениями PDE, который может быть включен в любую архитектуру NN. Наш метод использует дифференцируемую оптимизацию и теорему о неявной функции для эффективного применения физических ограничений. Вдохновленная изучением словаря, наша модель изучает семейство функций, каждая из которых определяет отображение параметров PDE в решения PDE. Во время вывода модель находит оптимальную линейную комбинацию функций в изученном семействе, решая задачу оптимизации с ограничениями на УЧП. Наш метод обеспечивает непрерывные решения в интересующей области, которые точно удовлетворяют желаемым физическим ограничениям. Наши результаты показывают, что включение жестких ограничений непосредственно в архитектуру NN обеспечивает гораздо меньшую ошибку теста по сравнению с обучением на цели без ограничений.

материалы по теме:

Новые материалы

Коллекции публикаций по глубокому обучению

Последние пару месяцев я создавал коллекции последних академических публикаций по различным подполям глубокого обучения в моем блоге https://amundtveit.com - эта публикация дает обзор 25..

Представляем: Pepita

Фреймворк JavaScript с открытым исходным кодом Я знаю, что недостатка в фреймворках JavaScript нет. Но я просто не мог остановиться. Я хотел написать что-то сам, со своими собственными..

Советы по коду Laravel #2

1-) Найти // You can specify the columns you need // in when you use the find method on a model User::find(‘id’, [‘email’,’name’]); // You can increment or decrement // a field in..

Работа с временными рядами спутниковых изображений, часть 3 (аналитика данных)

Анализ временных рядов спутниковых изображений для данных наблюдений за большой Землей (arXiv) Автор: Рольф Симоэс , Жильберто Камара , Жильберто Кейрос , Фелипе Соуза , Педро Р. Андраде ,..

3 способа решить квадратное уравнение (3-й мой любимый) -

1. Методом факторизации — 2. Используя квадратичную формулу — 3. Заполнив квадрат — Давайте поймем это, решив это простое уравнение: Мы пытаемся сделать LHS,..

Создание VR-миров с A-Frame

Виртуальная реальность (и дополненная реальность) стали главными модными терминами в образовательных технологиях. С недорогими VR-гарнитурами, такими как Google Cardboard , и использованием..

Демистификация рекурсии

КОДЕКС Демистификация рекурсии Упрощенная концепция ошеломляющей О чем весь этот шум? Рекурсия, кажется, единственная тема, от которой у каждого начинающего студента-информатика..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Web Development Software Development Python Coding Deep Learning AI React Software Engineering Nodejs Front End Development Java Algorithms Computer Science Typescript Data Tech Development CSS HTML Programming Languages Startup Productivity Python Programming Tutorial Angular Neural Networks Computer Vision Open Source Javascript Tips AWS Education Learning NLP Mlops