Переидентификация человека с помощью k-обратного кодирования

Повторная идентификация человека с помощью k-обратного кодирования относится к методу, используемому в области компьютерного зрения и машинного обучения, особенно в контексте задач повторной идентификации человека (повторной идентификации). Повторная идентификация человека — это задача сопоставления изображений или видео одного и того же человека в разных ракурсах камеры или в разные моменты времени. Он находит применение в системах наблюдения, безопасности и слежения.

Проблема с повторной идентификацией человека заключается в том, что она часто усложняется из-за различий в освещении, позе, одежде и точках обзора камеры. Переранжирование с помощью k-обратного кодирования — это подход, разработанный для повышения точности систем повторной идентификации людей.

Вот разбивка ключевых понятий:

Изменение рейтинга. Традиционные системы повторной идентификации личности часто используют подход, основанный на поиске данных. По запросу изображения человека система извлекает набор изображений-кандидатов из галереи (базы данных) на основе некоторой метрики сходства (например, евклидова расстояния или косинусного сходства). Повторное ранжирование включает в себя изменение порядка полученных кандидатов, чтобы они лучше соответствовали истинному совпадению с запросом. Этот процесс направлен на уменьшение количества ложных срабатываний и увеличение шансов найти правильное совпадение.
K-обратное кодирование: это метод уточнения, применяемый в процессе повторного ранжирования. Основная идея состоит в том, чтобы учитывать не только первоначальное сходство между изображением запроса и кандидатами, но и отношения между самими кандидатами. Термин «k-взаимный» относится к рассмотрению взаимного сходства между двумя изображениями, гарантирующему, что они являются верхними k соседями друг друга.
Кодирование включает в себя вычисление k-обратного показателя сходства между изображением запроса и каждым изображением-кандидатом. Этот балл отражает, насколько кандидат схож с запросом. Кроме того, для дальнейшего улучшения результатов повторного ранжирования часто используется этап постобработки.

Основными преимуществами повторной идентификации человека с помощью k-обратного кодирования являются:

Надежность. Этот метод помогает преодолеть проблемы, возникающие из-за различий во внешнем виде и точках зрения.
Уменьшение количества ложных срабатываний. Учитывая взаимное сходство, процесс повторного ранжирования может исключить неверные совпадения, которые могут иметь высокие начальные оценки сходства.
Повышение точности: уточненный рейтинг увеличивает вероятность того, что истинное совпадение окажется в верхней части списка, что повышает точность системы.

Повторная идентификация человека, важнейшая задача компьютерного зрения, предполагает сопоставление людей в различных изображениях камеры. В этом сообщении блога мы углубимся в инновационный подход к повышению точности повторной идентификации человека с помощью k-обратного кодирования. Мы шаг за шагом разберем ключевые понятия с математическими обозначениями, чтобы обеспечить полное понимание.

1. Определение проблемы

Рассмотрим пробное изображение человека, обозначенное как P, и галерею изображений, обозначенную как G. Задача состоит в том, чтобы выявить из галереи людей, наиболее похожих на зонд. Первоначальное сходство между двумя людьми, P и G_i, рассчитывается с использованием расстояния Махаланобиса:

где µp и µGi — векторы признаков внешнего вида, а M — положительная полуопределенная матрица.

2. k-взаимные ближайшие соседи.

Для повышения точности введем понятие k-обратных ближайших соседей. Учитывая тестового человека P, k-обратных ближайших соседей — это k лучших кандидатов в рейтинговом списке, которые находятся ближе всего к зонду. Это подмножество обозначается как R(P,k). Однако из-за различий во внешнем виде не все соответствующие положительные изображения могут быть включены в R(P,k).

3. Расстояние Жаккара: измерение сходства

Расстояние Жаккара измеряет сходство между двумя множествами. Для повторной идентификации личности мы применяем ее к множествам k-взаимных соседей. Расстояние Жаккара J(A,B) между множествами A и B определяется как:

В этом подходе используется идея о том, что если два изображения похожи, их наборы k-обратных соседей будут перекрываться. Расстояние Жаккара можно вычислить с использованием двоичных векторов, представляющих наличие соседей и взвешивание ядра Гаусса.

4. Расширение локального запроса

Вдохновленный общими функциями изображений одного и того же класса, расширение локального запроса использует k-ближайших соседей зонда для расширения k-обратного вектора признаков. Математически это расширение определяется как:

где R_expanded(P) представляет собой расширенный вектор k-обратных признаков для зонда P, а ℓ — параметр, управляющий размером расширения.

5. Итоговое расстояние: комплексный показатель

Чтобы устранить ограничения расстояния Жаккара, мы предлагаем окончательную метрику расстояния, которая сочетает в себе как расстояние Жаккара, так и исходное расстояние Махаланобиса. Конечное расстояние D_final определяется как:

где λε[0,1] — штрафной коэффициент, корректирующий влияние расстояния Жаккара.

В заключение, подход повторной идентификации людей с помощью k-обратного кодирования представляет собой надежную стратегию повышения точности идентификации людей при различных ракурсах камеры. Используя k-обратных соседей, расстояние Жаккара, расширение локального запроса и комплексную метрику конечного расстояния, этот метод демонстрирует многообещающие результаты для решения проблем повторной идентификации человека в сложных сценариях.

Ссылки:

Чжун З., Чжэн Л., Цао Д. и Ли С. (2017). Реранжирование переидентификации человека с помощью k-обратного кодирования. В Трудах конференции IEEE по компьютерному зрению и распознаванию образов (стр. 1318–1327).

материалы по теме:

Новые материалы

Коллекции публикаций по глубокому обучению

Последние пару месяцев я создавал коллекции последних академических публикаций по различным подполям глубокого обучения в моем блоге https://amundtveit.com - эта публикация дает обзор 25..

Представляем: Pepita

Фреймворк JavaScript с открытым исходным кодом Я знаю, что недостатка в фреймворках JavaScript нет. Но я просто не мог остановиться. Я хотел написать что-то сам, со своими собственными..

Советы по коду Laravel #2

1-) Найти // You can specify the columns you need // in when you use the find method on a model User::find(‘id’, [‘email’,’name’]); // You can increment or decrement // a field in..

Работа с временными рядами спутниковых изображений, часть 3 (аналитика данных)

Анализ временных рядов спутниковых изображений для данных наблюдений за большой Землей (arXiv) Автор: Рольф Симоэс , Жильберто Камара , Жильберто Кейрос , Фелипе Соуза , Педро Р. Андраде ,..

3 способа решить квадратное уравнение (3-й мой любимый) -

1. Методом факторизации — 2. Используя квадратичную формулу — 3. Заполнив квадрат — Давайте поймем это, решив это простое уравнение: Мы пытаемся сделать LHS,..

Создание VR-миров с A-Frame

Виртуальная реальность (и дополненная реальность) стали главными модными терминами в образовательных технологиях. С недорогими VR-гарнитурами, такими как Google Cardboard , и использованием..

Демистификация рекурсии

КОДЕКС Демистификация рекурсии Упрощенная концепция ошеломляющей О чем весь этот шум? Рекурсия, кажется, единственная тема, от которой у каждого начинающего студента-информатика..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Web Development Software Development Python Coding Deep Learning AI React Software Engineering Nodejs Front End Development Java Algorithms Computer Science Typescript Data Tech Development CSS HTML Programming Languages Tutorial Angular Startup Productivity Python Programming Neural Networks Computer Vision Javascript Tips AWS Education Open Source Learning NLP Mlops