Arhn - архитектура программирования

Используйте sed для удаления нескольких строк между двумя наборами символов

Я использую sed на компьютере с macOS X.

У меня есть набор очень больших финансовых файлов размером 10 КБ, и я хочу сохранить только текст.

Прямо сейчас я пытаюсь удалить всю информацию между

<TYPE>XML

и

<DOCUMENT>

Обычно между ними находится много информации, но вот как будет выглядеть пример:

#Other things I want to keep
<TYPE>XML
<SEQUENCE>10
<FILENAME>rht-10qq3fy19_htm.xml
<DESCRIPTION>IDEA: XBRL DOCUMENT
<TEXT>
<XML>
<?xml version="1.0" encoding="utf-8"?>
<xbrl
...
<DOCUMENT>
#Some other text I need to keep

Я пытался использовать sed без особых результатов, я могу только удалить однострочные записи, такие как

<TYPE>XML SOME WORDS SOME WORDS <DOCUMENT>

Я использовал этот код, чтобы заставить это работать:

sed -i '' s/<TYPE>XML.*<DOCUMENT>//g' filename.txt

Что я должен изменить, чтобы получить желаемый результат?

Как только я смогу решить эту проблему, другие вещи, которые мне нужно очистить, также станут проще. Решение не должно использовать sed.

Я использую -i и '' в начале команды sed, потому что я работаю на Mac (BSD) и изменяю данные на месте.

02.09.2020

  • Пожалуйста, добавьте образец ввода (без описаний, изображений, ссылок) и желаемый результат для этого образца ввода к вашему вопросу (без комментариев). 02.09.2020

Ответы:


1

Если я вас правильно понял, это сработает для вас:

sed '/<TYPE>XML/,/<DOCUMENT>/d' filename.txt

Для всех, кто ищет, как удалить текст между двумя шаблонами, используйте:

sed '/START_PATTERN/,/END_PATTERN/d' filename.txt
02.09.2020
Новые материалы

Коллекции публикаций по глубокому обучению
Последние пару месяцев я создавал коллекции последних академических публикаций по различным подполям глубокого обучения в моем блоге https://amundtveit.com - эта публикация дает обзор 25..

Представляем: Pepita
Фреймворк JavaScript с открытым исходным кодом Я знаю, что недостатка в фреймворках JavaScript нет. Но я просто не мог остановиться. Я хотел написать что-то сам, со своими собственными..

Советы по коду Laravel #2
1-) Найти // You can specify the columns you need // in when you use the find method on a model User::find(‘id’, [‘email’,’name’]); // You can increment or decrement // a field in..

Работа с временными рядами спутниковых изображений, часть 3 (аналитика данных)
Анализ временных рядов спутниковых изображений для данных наблюдений за большой Землей (arXiv) Автор: Рольф Симоэс , Жильберто Камара , Жильберто Кейрос , Фелипе Соуза , Педро Р. Андраде ,..

3 способа решить квадратное уравнение (3-й мой любимый) -
1. Методом факторизации — 2. Используя квадратичную формулу — 3. Заполнив квадрат — Давайте поймем это, решив это простое уравнение: Мы пытаемся сделать LHS,..

Создание VR-миров с A-Frame
Виртуальная реальность (и дополненная реальность) стали главными модными терминами в образовательных технологиях. С недорогими VR-гарнитурами, такими как Google Cardboard , и использованием..

Демистификация рекурсии
КОДЕКС Демистификация рекурсии Упрощенная концепция ошеломляющей О чем весь этот шум? Рекурсия, кажется, единственная тема, от которой у каждого начинающего студента-информатика..