Повторная идентификация человека с помощью k-обратного кодирования относится к методу, используемому в области компьютерного зрения и машинного обучения, особенно в контексте задач повторной идентификации человека (повторной идентификации). Повторная идентификация человека — это задача сопоставления изображений или видео одного и того же человека в разных ракурсах камеры или в разные моменты времени. Он находит применение в системах наблюдения, безопасности и слежения.
Проблема с повторной идентификацией человека заключается в том, что она часто усложняется из-за различий в освещении, позе, одежде и точках обзора камеры. Переранжирование с помощью k-обратного кодирования — это подход, разработанный для повышения точности систем повторной идентификации людей.
Вот разбивка ключевых понятий:
- Изменение рейтинга. Традиционные системы повторной идентификации личности часто используют подход, основанный на поиске данных. По запросу изображения человека система извлекает набор изображений-кандидатов из галереи (базы данных) на основе некоторой метрики сходства (например, евклидова расстояния или косинусного сходства). Повторное ранжирование включает в себя изменение порядка полученных кандидатов, чтобы они лучше соответствовали истинному совпадению с запросом. Этот процесс направлен на уменьшение количества ложных срабатываний и увеличение шансов найти правильное совпадение.
- K-обратное кодирование: это метод уточнения, применяемый в процессе повторного ранжирования. Основная идея состоит в том, чтобы учитывать не только первоначальное сходство между изображением запроса и кандидатами, но и отношения между самими кандидатами. Термин «k-взаимный» относится к рассмотрению взаимного сходства между двумя изображениями, гарантирующему, что они являются верхними k соседями друг друга.
- Кодирование включает в себя вычисление k-обратного показателя сходства между изображением запроса и каждым изображением-кандидатом. Этот балл отражает, насколько кандидат схож с запросом. Кроме того, для дальнейшего улучшения результатов повторного ранжирования часто используется этап постобработки.
Основными преимуществами повторной идентификации человека с помощью k-обратного кодирования являются:
- Надежность. Этот метод помогает преодолеть проблемы, возникающие из-за различий во внешнем виде и точках зрения.
- Уменьшение количества ложных срабатываний. Учитывая взаимное сходство, процесс повторного ранжирования может исключить неверные совпадения, которые могут иметь высокие начальные оценки сходства.
- Повышение точности: уточненный рейтинг увеличивает вероятность того, что истинное совпадение окажется в верхней части списка, что повышает точность системы.
Повторная идентификация человека, важнейшая задача компьютерного зрения, предполагает сопоставление людей в различных изображениях камеры. В этом сообщении блога мы углубимся в инновационный подход к повышению точности повторной идентификации человека с помощью k-обратного кодирования. Мы шаг за шагом разберем ключевые понятия с математическими обозначениями, чтобы обеспечить полное понимание.
1. Определение проблемы
Рассмотрим пробное изображение человека, обозначенное как P, и галерею изображений, обозначенную как G. Задача состоит в том, чтобы выявить из галереи людей, наиболее похожих на зонд. Первоначальное сходство между двумя людьми, P и G_i, рассчитывается с использованием расстояния Махаланобиса:
где µp и µGi — векторы признаков внешнего вида, а M — положительная полуопределенная матрица.
2. k-взаимные ближайшие соседи.
Для повышения точности введем понятие k-обратных ближайших соседей. Учитывая тестового человека P, k-обратных ближайших соседей — это k лучших кандидатов в рейтинговом списке, которые находятся ближе всего к зонду. Это подмножество обозначается как R(P,k). Однако из-за различий во внешнем виде не все соответствующие положительные изображения могут быть включены в R(P,k).
3. Расстояние Жаккара: измерение сходства
Расстояние Жаккара измеряет сходство между двумя множествами. Для повторной идентификации личности мы применяем ее к множествам k-взаимных соседей. Расстояние Жаккара J(A,B) между множествами A и B определяется как:
В этом подходе используется идея о том, что если два изображения похожи, их наборы k-обратных соседей будут перекрываться. Расстояние Жаккара можно вычислить с использованием двоичных векторов, представляющих наличие соседей и взвешивание ядра Гаусса.
4. Расширение локального запроса
Вдохновленный общими функциями изображений одного и того же класса, расширение локального запроса использует k-ближайших соседей зонда для расширения k-обратного вектора признаков. Математически это расширение определяется как:
где R_expanded(P) представляет собой расширенный вектор k-обратных признаков для зонда P, а ℓ — параметр, управляющий размером расширения.
5. Итоговое расстояние: комплексный показатель
Чтобы устранить ограничения расстояния Жаккара, мы предлагаем окончательную метрику расстояния, которая сочетает в себе как расстояние Жаккара, так и исходное расстояние Махаланобиса. Конечное расстояние D_final определяется как:
где λε[0,1] — штрафной коэффициент, корректирующий влияние расстояния Жаккара.
В заключение, подход повторной идентификации людей с помощью k-обратного кодирования представляет собой надежную стратегию повышения точности идентификации людей при различных ракурсах камеры. Используя k-обратных соседей, расстояние Жаккара, расширение локального запроса и комплексную метрику конечного расстояния, этот метод демонстрирует многообещающие результаты для решения проблем повторной идентификации человека в сложных сценариях.
Ссылки:
Чжун З., Чжэн Л., Цао Д. и Ли С. (2017). Реранжирование переидентификации человека с помощью k-обратного кодирования. В Трудах конференции IEEE по компьютерному зрению и распознаванию образов (стр. 1318–1327).