Матрица путаницы в машинном обучении:

Матрица путаницы — это матрица N x N, используемая для оценки производительности модели классификации, где N — количество целевых классов. Матрица сравнивает фактические целевые значения с предсказанными моделью машинного обучения. Эта матрица показывает ошибки в производительности модели в форме матрицы, поэтому также известна как матрица ошибок.

Для задачи классификации бинарных классов у нас будет матрица 2 x 2:

Истинный положительный результат (TP):

Прогнозируемое значение соответствует фактическому значению
Фактическое значение было положительным, и модель предсказала положительное значение.

Истинно отрицательный результат (TN):

Прогнозируемое значение соответствует фактическому значению
Фактическое значение было отрицательным, и модель предсказала отрицательное значение.

Ложное срабатывание (FP):

Прогнозируемое значение было неверно предсказано
Фактическое значение было отрицательным, но модель предсказала положительное значение.
Также известна как ошибка первого типа.

Ложноотрицательный результат (FN):

Прогнозируемое значение было неверно предсказано
Фактическое значение было положительным, но модель предсказала отрицательное значение.
Также известна как ошибка типа 2.

Он оценивает производительность моделей классификации, когда они делают прогнозы на тестовых данных, и сообщает, насколько хороша наша модель классификации. Он не только сообщает об ошибке, допущенной классификаторами, но и о типе ошибки, например, об ошибке типа I или типа II.

Оценка — это показатель в матрице путаницы. Он также имеет 4 типа: TPR, FPR, TNR, FNR.

Чувствительность / доля истинно положительных результатов / отзыв

Специфичность / доля истинно отрицательных результатов

Для повышения производительности TPR, TNRдолжны быть высокими и FNR, FPRдолжны быть низким.

Расчеты с использованием матрицы путаницы:

Точность классификации. Определяет, как часто модель предсказывает правильный результат. Его можно рассчитать как отношение количества правильных прогнозов, сделанных классификатором, ко всему количеству прогнозов, сделанных классификаторами.

Коэффициент ошибочной классификации. Он также называется Коэффициент ошибок и определяет, насколько часто модель дает неверные прогнозы. Значение частоты ошибок может быть рассчитано как количество неправильных предсказаний ко всему количеству предсказаний, сделанных классификатором.

Точность. Ее можно определить как количество правильных выходных данных, предоставленных моделью, или количество из всех положительных классов, правильно предсказанных моделью, которые были на самом деле верными. Его можно рассчитать по:

Напомнить: он определяется как количество положительных классов, правильное предсказание нашей модели. Отзыв должен быть как можно выше.

Оценка F1:напоминание и точность — это две оценки. Совокупность этих двух показателей и есть F1-Score. Он вычисляется как среднее гармоническое точности и полноты. Он сообщает вам, насколько точен ваш классификатор, а также насколько он надежен.

Он максимален, когда Точность равна Отзыву.

Высокая точность, но более низкий отзыв, дает вам чрезвычайно точную информацию, но затем пропускает большое количество случаев, которые трудно классифицировать.

Чем выше показатель F1, тем лучше производительность нашей модели. Математически это можно выразить так:

Ссылки:

Прикладной ИИ
javapoint
Аналитикавидья

материалы по теме:

Новые материалы

Коллекции публикаций по глубокому обучению

Последние пару месяцев я создавал коллекции последних академических публикаций по различным подполям глубокого обучения в моем блоге https://amundtveit.com - эта публикация дает обзор 25..

Представляем: Pepita

Фреймворк JavaScript с открытым исходным кодом Я знаю, что недостатка в фреймворках JavaScript нет. Но я просто не мог остановиться. Я хотел написать что-то сам, со своими собственными..

Советы по коду Laravel #2

1-) Найти // You can specify the columns you need // in when you use the find method on a model User::find(‘id’, [‘email’,’name’]); // You can increment or decrement // a field in..

Работа с временными рядами спутниковых изображений, часть 3 (аналитика данных)

Анализ временных рядов спутниковых изображений для данных наблюдений за большой Землей (arXiv) Автор: Рольф Симоэс , Жильберто Камара , Жильберто Кейрос , Фелипе Соуза , Педро Р. Андраде ,..

3 способа решить квадратное уравнение (3-й мой любимый) -

1. Методом факторизации — 2. Используя квадратичную формулу — 3. Заполнив квадрат — Давайте поймем это, решив это простое уравнение: Мы пытаемся сделать LHS,..

Создание VR-миров с A-Frame

Виртуальная реальность (и дополненная реальность) стали главными модными терминами в образовательных технологиях. С недорогими VR-гарнитурами, такими как Google Cardboard , и использованием..

Демистификация рекурсии

КОДЕКС Демистификация рекурсии Упрощенная концепция ошеломляющей О чем весь этот шум? Рекурсия, кажется, единственная тема, от которой у каждого начинающего студента-информатика..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Web Development Software Development Python Coding Deep Learning AI React Software Engineering Nodejs Front End Development Java Algorithms Computer Science Typescript Data Tech Development CSS HTML Programming Languages Tutorial Angular Startup Productivity Python Programming Computer Vision Neural Networks Education Open Source Javascript Tips AWS NLP Learning Developer