Повторная идентификация человека с помощью k-обратного кодирования относится к методу, используемому в области компьютерного зрения и машинного обучения, особенно в контексте задач повторной идентификации человека (повторной идентификации). Повторная идентификация человека — это задача сопоставления изображений или видео одного и того же человека в разных ракурсах камеры или в разные моменты времени. Он находит применение в системах наблюдения, безопасности и слежения.

Проблема с повторной идентификацией человека заключается в том, что она часто усложняется из-за различий в освещении, позе, одежде и точках обзора камеры. Переранжирование с помощью k-обратного кодирования — это подход, разработанный для повышения точности систем повторной идентификации людей.

Вот разбивка ключевых понятий:

  1. Изменение рейтинга. Традиционные системы повторной идентификации личности часто используют подход, основанный на поиске данных. По запросу изображения человека система извлекает набор изображений-кандидатов из галереи (базы данных) на основе некоторой метрики сходства (например, евклидова расстояния или косинусного сходства). Повторное ранжирование включает в себя изменение порядка полученных кандидатов, чтобы они лучше соответствовали истинному совпадению с запросом. Этот процесс направлен на уменьшение количества ложных срабатываний и увеличение шансов найти правильное совпадение.
  2. K-обратное кодирование: это метод уточнения, применяемый в процессе повторного ранжирования. Основная идея состоит в том, чтобы учитывать не только первоначальное сходство между изображением запроса и кандидатами, но и отношения между самими кандидатами. Термин «k-взаимный» относится к рассмотрению взаимного сходства между двумя изображениями, гарантирующему, что они являются верхними k соседями друг друга.
  3. Кодирование включает в себя вычисление k-обратного показателя сходства между изображением запроса и каждым изображением-кандидатом. Этот балл отражает, насколько кандидат схож с запросом. Кроме того, для дальнейшего улучшения результатов повторного ранжирования часто используется этап постобработки.

Основными преимуществами повторной идентификации человека с помощью k-обратного кодирования являются:

  • Надежность. Этот метод помогает преодолеть проблемы, возникающие из-за различий во внешнем виде и точках зрения.
  • Уменьшение количества ложных срабатываний. Учитывая взаимное сходство, процесс повторного ранжирования может исключить неверные совпадения, которые могут иметь высокие начальные оценки сходства.
  • Повышение точности: уточненный рейтинг увеличивает вероятность того, что истинное совпадение окажется в верхней части списка, что повышает точность системы.

Повторная идентификация человека, важнейшая задача компьютерного зрения, предполагает сопоставление людей в различных изображениях камеры. В этом сообщении блога мы углубимся в инновационный подход к повышению точности повторной идентификации человека с помощью k-обратного кодирования. Мы шаг за шагом разберем ключевые понятия с математическими обозначениями, чтобы обеспечить полное понимание.

1. Определение проблемы

Рассмотрим пробное изображение человека, обозначенное как P, и галерею изображений, обозначенную как G. Задача состоит в том, чтобы выявить из галереи людей, наиболее похожих на зонд. Первоначальное сходство между двумя людьми, P и G_i, рассчитывается с использованием расстояния Махаланобиса:

где µp и µGi — векторы признаков внешнего вида, а M — положительная полуопределенная матрица.

2. k-взаимные ближайшие соседи.

Для повышения точности введем понятие k-обратных ближайших соседей. Учитывая тестового человека P, k-обратных ближайших соседей — это k лучших кандидатов в рейтинговом списке, которые находятся ближе всего к зонду. Это подмножество обозначается как R(P,k). Однако из-за различий во внешнем виде не все соответствующие положительные изображения могут быть включены в R(P,k).

3. Расстояние Жаккара: измерение сходства

Расстояние Жаккара измеряет сходство между двумя множествами. Для повторной идентификации личности мы применяем ее к множествам k-взаимных соседей. Расстояние Жаккара J(A,B) между множествами A и B определяется как:

В этом подходе используется идея о том, что если два изображения похожи, их наборы k-обратных соседей будут перекрываться. Расстояние Жаккара можно вычислить с использованием двоичных векторов, представляющих наличие соседей и взвешивание ядра Гаусса.

4. Расширение локального запроса

Вдохновленный общими функциями изображений одного и того же класса, расширение локального запроса использует k-ближайших соседей зонда для расширения k-обратного вектора признаков. Математически это расширение определяется как:

где R_expanded(P) представляет собой расширенный вектор k-обратных признаков для зонда P, а ℓ — параметр, управляющий размером расширения.

5. Итоговое расстояние: комплексный показатель

Чтобы устранить ограничения расстояния Жаккара, мы предлагаем окончательную метрику расстояния, которая сочетает в себе как расстояние Жаккара, так и исходное расстояние Махаланобиса. Конечное расстояние D_final определяется как:

где λε[0,1] — штрафной коэффициент, корректирующий влияние расстояния Жаккара.

В заключение, подход повторной идентификации людей с помощью k-обратного кодирования представляет собой надежную стратегию повышения точности идентификации людей при различных ракурсах камеры. Используя k-обратных соседей, расстояние Жаккара, расширение локального запроса и комплексную метрику конечного расстояния, этот метод демонстрирует многообещающие результаты для решения проблем повторной идентификации человека в сложных сценариях.

Ссылки:

Чжун З., Чжэн Л., Цао Д. и Ли С. (2017). Реранжирование переидентификации человека с помощью k-обратного кодирования. В Трудах конференции IEEE по компьютерному зрению и распознаванию образов (стр. 1318–1327).