Arhn - архитектура программирования

Понимание команды Unix Diff

Я пытаюсь найти разницу между двумя файлами, где я хотел бы узнать новые записи в файле_2. Например:

Если .txt содержит:

a
b
c

И b.txt содержит:

c
d
f

Я хотел бы получить d and f

Я использую команду: diff --changed-group-format="%>" --unchanged-group-format=''

mymach@dev-machine:~/test$ grep 'C:/Documents and Settings/pandep2/AppData/Local/Google/Chrome/User Data/CrashpadMetrics.pma~RF115cef5.TMP' file_1.log
C:/Documents and Settings/pandep2/AppData/Local/Google/Chrome/User Data/CrashpadMetrics.pma~RF115cef5.TMP

mymach@dev-machine:~/test$ grep 'C:/Documents and Settings/pandep2/AppData/Local/Google/Chrome/User Data/CrashpadMetrics.pma~RF115cef5.TMP' file_2.log
C:/Documents and Settings/pandep2/AppData/Local/Google/Chrome/User Data/CrashpadMetrics.pma~RF115cef5.TMP

mymach@dev-machine:~/test$ diff --changed-group-format="%>" --unchanged-group-format='' file_1.log file_2.log >diff_file.log

mymach@dev-machine:~/test$ grep 'C:/Documents and Settings/pandep2/AppData/Local/Google/Chrome/User Data/CrashpadMetrics.pma~RF115cef5.TMP' diff_file.log
C:/Documents and Settings/pandep2/AppData/Local/Google/Chrome/User Data/CrashpadMetrics.pma~RF115cef5.TMP

Поскольку в обоих файлах существовал один и тот же файл, почему команда diff по-прежнему сообщает об этом файле?

14.06.2018

  • Возможно, расположение в каждом файле отличается? 14.06.2018
  • $ echo C:/Documents and Settings/pandep2/AppData/Local/Google/Chrome/User Data/CrashpadMetrics.pma~RF115cef5.TMP › file_1.log $ cp file_1.log file_2.log $ diff --changed-group-format =%› --unchanged-group-format='' file_1.log file_2.log $ Это должно работать. Ваши файлы явно не совпадают 14.06.2018
  • Я никогда не думал, что местоположение действительно играет важную роль, я всегда думал, что diff не нуждается в отсортированном файле? 14.06.2018
  • есть ли у кого-нибудь лучшее решение, чем diff для такого сценария? Я был бы очень признателен за это .... у меня есть два файла, каждый из которых содержит более 1 миллиона записей, и я хотел бы найти между ними разницу. 14.06.2018
  • я нашел команду: bash -c 'diff --changed-group-format=%› --unchanged-group-format='' ‹(sort file_1.log) ‹(sort file_2.log) › diff_file.log' это хорошо ? 14.06.2018

Ответы:


1

В таких случаях нам лучше использовать команду comm в Unix.

для приведенного выше сценария я использовал:

comm -23 <(sort file_1.txt) <(sort file_2.txt)

Это даст уникальные файлы file_1.txt

comm -13 <(sort a.txt) <(sort b.txt)

Это даст уникальные файлы file_2.txt

comm -12 <(sort a.txt) <(sort b.txt)

Это даст общие файлы между обоими файлами

14.06.2018
Новые материалы

Коллекции публикаций по глубокому обучению
Последние пару месяцев я создавал коллекции последних академических публикаций по различным подполям глубокого обучения в моем блоге https://amundtveit.com - эта публикация дает обзор 25..

Представляем: Pepita
Фреймворк JavaScript с открытым исходным кодом Я знаю, что недостатка в фреймворках JavaScript нет. Но я просто не мог остановиться. Я хотел написать что-то сам, со своими собственными..

Советы по коду Laravel #2
1-) Найти // You can specify the columns you need // in when you use the find method on a model User::find(‘id’, [‘email’,’name’]); // You can increment or decrement // a field in..

Работа с временными рядами спутниковых изображений, часть 3 (аналитика данных)
Анализ временных рядов спутниковых изображений для данных наблюдений за большой Землей (arXiv) Автор: Рольф Симоэс , Жильберто Камара , Жильберто Кейрос , Фелипе Соуза , Педро Р. Андраде ,..

3 способа решить квадратное уравнение (3-й мой любимый) -
1. Методом факторизации — 2. Используя квадратичную формулу — 3. Заполнив квадрат — Давайте поймем это, решив это простое уравнение: Мы пытаемся сделать LHS,..

Создание VR-миров с A-Frame
Виртуальная реальность (и дополненная реальность) стали главными модными терминами в образовательных технологиях. С недорогими VR-гарнитурами, такими как Google Cardboard , и использованием..

Демистификация рекурсии
КОДЕКС Демистификация рекурсии Упрощенная концепция ошеломляющей О чем весь этот шум? Рекурсия, кажется, единственная тема, от которой у каждого начинающего студента-информатика..