Arhn - архитектура программирования

Regex [] vs () в Python относительно re.split()

В чем разница между [,.] и (,|.) при использовании в качестве шаблона в re.split(шаблон,строка)? Может кто-нибудь объяснить в отношении этого примера в Python:

import re
regex_pattern1 = r"[,\.]"
regex_pattern2 = r"(,|\.)"
print(re.split(regex_pattern1, '100,000.00')) #['100', '000', '00']
print(re.split(regex_pattern2, '100,000.00'))) #['100', ',', '000', '.', '00']

  • Первый — это класс символов, а второй — группа захвата. 06.07.2020
  • Вы также можете проверить: Использование чередования или класса символов для сопоставления одного символа? 06.07.2020
  • Это было закрыто как дубликат страницы, которая вообще не объясняла поведение split. 06.07.2020
  • Извините, я думаю, что мой заголовок не был ясен, я хотел спросить, почему класс символов и группа захвата работают по-разному по отношению к re.split() 06.07.2020

Ответы:


1

[,\.] эквивалентно ,|\..[1]

(,|\.) эквивалентно ([,\.]).

() создает захват, а re.split возвращает захваченный текст, а также текст, разделенный шаблоном.

>>> import re
>>> re.split(r'([,\.])', '100,000.00')
['100', ',', '000', '.', '00']
>>> re.split(r'(,|\.)', '100,000.00')
['100', ',', '000', '.', '00']
>>> re.split(r',|\.', '100,000.00')
['100', '000', '00']
>>> re.split(r'(?:,|\.)', '100,000.00')
['100', '000', '00']
>>> re.split(r'[,\.]', '100,000.00')
['100', '000', '00']

  1. Однако иногда вам может понадобиться (?:,|\.), чтобы ограничить то, что считается операндами |, когда вы встраиваете его в более крупный шаблон.
06.07.2020
  • . не нужно экранировать в классе символов, поэтому он может быть [,.] 06.07.2020
  • Новые материалы

    Коллекции публикаций по глубокому обучению
    Последние пару месяцев я создавал коллекции последних академических публикаций по различным подполям глубокого обучения в моем блоге https://amundtveit.com - эта публикация дает обзор 25..

    Представляем: Pepita
    Фреймворк JavaScript с открытым исходным кодом Я знаю, что недостатка в фреймворках JavaScript нет. Но я просто не мог остановиться. Я хотел написать что-то сам, со своими собственными..

    Советы по коду Laravel #2
    1-) Найти // You can specify the columns you need // in when you use the find method on a model User::find(‘id’, [‘email’,’name’]); // You can increment or decrement // a field in..

    Работа с временными рядами спутниковых изображений, часть 3 (аналитика данных)
    Анализ временных рядов спутниковых изображений для данных наблюдений за большой Землей (arXiv) Автор: Рольф Симоэс , Жильберто Камара , Жильберто Кейрос , Фелипе Соуза , Педро Р. Андраде ,..

    3 способа решить квадратное уравнение (3-й мой любимый) -
    1. Методом факторизации — 2. Используя квадратичную формулу — 3. Заполнив квадрат — Давайте поймем это, решив это простое уравнение: Мы пытаемся сделать LHS,..

    Создание VR-миров с A-Frame
    Виртуальная реальность (и дополненная реальность) стали главными модными терминами в образовательных технологиях. С недорогими VR-гарнитурами, такими как Google Cardboard , и использованием..

    Демистификация рекурсии
    КОДЕКС Демистификация рекурсии Упрощенная концепция ошеломляющей О чем весь этот шум? Рекурсия, кажется, единственная тема, от которой у каждого начинающего студента-информатика..