Хотя стиль отображения GG и стиль отображения FF могут быть любой областью возможностей, многие изучаемые алгоритмы представляют собой вероятностные модели, в которых стиль отображения gg принимает форму версии с условным шансом x)g(x) =

P(стиль отображения ff принимает форму стиля отображения совместной случайной модели f(x,y)=P(x,y)f(x,y) = P(x,y). Например, наивный байесовский и линейный дискриминант оценка — это модели совместной возможности, тогда как логистическая регрессия — это модель условной возможности.

Ознакомьтесь с разделом Лучший курс по машинному обучению

Существуют основные процессы для выбора стиля отображения ff или стиля отображения gg: минимизация эмпирической опасности и минимизация структурной опасности.[7] Разумная минимизация шансов ищет функцию, которая соответствует тренировочным записям. Минимизация структурных рисков включает в себя штрафную функцию, которая контролирует компромисс между несправедливостью и дисперсией.

В обоих случаях мы уверены, что обучающая выборка состоит из шаблона беспристрастных и одинаково распределенных пар, стиль отображения (xi, yi)(x_ii, y В зависимости от того, насколько хорошо функция соответствует статистике обучения, описывается стиль отображения функции потерь L: Ytimes Yto math bb R ^geq zero стиль отображения L: Ytimes Yto math bb R ^geq zero. x_i,;i,;yi,;yi,;ye потеря предсказания стиля отображения платы, что y является стилем отображения L(y_i,hat yi,hat y)L( у

Стиль отображения риска R(g)R(g) стиля отображения функции gg определяется как ожидаемая потеря стиля отображения gg. Об этом можно судить по тренировочной статистике, т.к.

Стиль отображения R_emp(g)=frac 1Nsum _iL(y_i,g(x_i))R_emp(g) = frac1N sum_i L(y_i, g(x_i)).

Обобщения

Существует несколько способов обобщения обычной проблемы контролируемого обучения:

  1. Полуконтролируемое обучение. В этом случае предпочтительные выходные значения предоставляются наиболее эффективно для подмножества обучающих фактов. Последняя запись не маркирована.
  2. Слабый контроль. В этом случае шумные, ограниченные или расплывчатые источники используются для предоставления сигнала контроля для обозначения фактов обучения.
  3. Активное изучение: вместо того, чтобы предполагать, что все учебные примеры даны в начале, алгоритмы энергичного изучения в интерактивном режиме собирают новые модели, как правило, путем отправки запросов потребителю-человеку.
  4. Запросы часто основаны на немаркированных записях, сценарий, который сочетает полуконтролируемое получение знаний с положительным опытом.
  5. Структурированное прогнозирование. Когда предпочтительная стоимость вывода представляет собой сложный объект, включающий дерево синтаксического анализа или размеченный граф, общие методы следует расширить.
  6. Обучение ранжированию: когда входными данными является набор гаджетов, а желаемым результатом является ранжирование этих элементов, в качестве альтернативы обычные методы должны быть продлены.

Цель ознакомления с техниками под наблюдением состоит в том, чтобы разработать группу правил выбора, которые можно использовать для определения предполагаемого результата. Их также можно назвать моделями индукции правил, и они охватывают модели категорий и регрессии.