Arhn - архитектура программирования

Сопоставьте что-нибудь между строками для команды Linux Grep

Я прочитал сообщение загрузить все символы, включая новую строку, но я не работаю с XML, так что это немного отличается с моей командой Linux.

У меня есть следующие данные:

Example line 0</span>
<tag>Example line 1</tag>
<span>Example line 1.5</span>
<tag>
Example line 2
</tag>
Example line 3
<span>Example line 4</span>

Используя эту команду cat file.txt | grep -o '<tag.*tag>\|^--.*', я получаю:

<tag>Example line 1</tag>

Однако я хочу, чтобы вывод был:

<tag>Example line 1</tag>
<tag>Example line 2</tag>

Как я могу сопоставить что-либо между строками, включая новую строку?

Примечание. Мне нужно использовать <tag и tag> в виде строк, потому что другие файлы могут содержать несколько тегов и текст между строками. Будут обновлены образцы данных, чтобы показать это.


Ответы:


1

Это проще сделать с помощью gnu-awk, используя </tag> в качестве разделителя записей:

awk -v RS='</tag>' 'RT {gsub(/\n/, ""); print $0 RT}' file

<tag>Example line 1</tag>
<tag>Example line 2</tag>
14.10.2016
  • Нужно использовать <tag и tag>, чтобы попасть между ними. Обновление выборочных данных. Извини :-/ 14.10.2016
  • ок, попробуй так: awk -v RS='</tag>' 'RT {gsub(/.*?<tag>|\n/, ""); print "<tag>" $0 RT}' file 14.10.2016
  • Эй, Анбхава, это работает! Я собираюсь задать еще один вопрос, чтобы основываться на этом. Спасибо :-) 15.10.2016
  • Эй, Анубхава, не могли бы вы сказать мне, как также сопоставлять строки, начинающиеся с Example? Если нет, я задал вопрос: stackoverflow.com/questions/40052458/ 15.10.2016

  • 2

    Рассмотрим этот тестовый файл:

    $ cat file2
    Example line 0</span>
    <tag>Example line 1</tag>
    <span>Example line 1.5</span>
    <tag>
    Example line 2
    </tag>
    Example line 3
    <span>Example line 4</span>
    

    Это дает желаемый результат (требуется GNU sed):

    $ sed -z 's|\n||g; s|</tag>|&\n|g; s|[^\n]*<tag>|<tag>|; s|\n[^\n]*<tag>|\n<tag>|g; s|\n[^\n]*$|\n|' file2
    <tag>Example line 1</tag>
    <tag>Example line 2</tag>
    

    Ограничение: обратите внимание, что обработка XML-подобного текста с помощью неспециализированных инструментов может быть весьма хрупкой.

    14.10.2016
  • Привет, Джон, извини, у данных есть другие теги. Мой пример был слишком минималистичным. Я немного обновил его. 14.10.2016
  • @DomainsFeatured См. обновленный ответ для кода, который обрабатывает измененный входной файл. 14.10.2016
  • Новые материалы

    Коллекции публикаций по глубокому обучению
    Последние пару месяцев я создавал коллекции последних академических публикаций по различным подполям глубокого обучения в моем блоге https://amundtveit.com - эта публикация дает обзор 25..

    Представляем: Pepita
    Фреймворк JavaScript с открытым исходным кодом Я знаю, что недостатка в фреймворках JavaScript нет. Но я просто не мог остановиться. Я хотел написать что-то сам, со своими собственными..

    Советы по коду Laravel #2
    1-) Найти // You can specify the columns you need // in when you use the find method on a model User::find(‘id’, [‘email’,’name’]); // You can increment or decrement // a field in..

    Работа с временными рядами спутниковых изображений, часть 3 (аналитика данных)
    Анализ временных рядов спутниковых изображений для данных наблюдений за большой Землей (arXiv) Автор: Рольф Симоэс , Жильберто Камара , Жильберто Кейрос , Фелипе Соуза , Педро Р. Андраде ,..

    3 способа решить квадратное уравнение (3-й мой любимый) -
    1. Методом факторизации — 2. Используя квадратичную формулу — 3. Заполнив квадрат — Давайте поймем это, решив это простое уравнение: Мы пытаемся сделать LHS,..

    Создание VR-миров с A-Frame
    Виртуальная реальность (и дополненная реальность) стали главными модными терминами в образовательных технологиях. С недорогими VR-гарнитурами, такими как Google Cardboard , и использованием..

    Демистификация рекурсии
    КОДЕКС Демистификация рекурсии Упрощенная концепция ошеломляющей О чем весь этот шум? Рекурсия, кажется, единственная тема, от которой у каждого начинающего студента-информатика..