Регулярные выражения в notepad++

Arioh · 25.04.2021

1. Удалить все html-теги, оставить только текст:

Код:

[<].*?>

2. В списке ссылок вида <a href=»LINK»>TITLE</a> удалить все html-теги, оставить только ссылки:

Код:

^[^"]+.([^"]+).*

заменить на:

Код:

$1

3. В том же самом списке оставить только тайтлы:

Код:

</?[^>]*.

4. Удалить строки с заданным количеством вхождения определенного символа. (Мне это понадобилось, когда нужно было очистить большой список ссылок на товары — 45 тыс. позиций — от ссылок на категории. Друг от друга они отличались общим количеством слешей — в категориях было 5, а в товарах — 6)

Код:

^([^/]*/){5}[^/]*$

разъяснение:
^ начало строки
( начало группы
[^/]* любой символ кроме слеша, 0 или более раз
/ слеш
){5} закончить и повторить группу 5 раз
[^/]* любой символ кроме слеша, 0 или более раз
$ конец строки

5. Удалить весь текст между двумя определенными символами (в данном примере — между двух кавычек):

Код:

"([^"]*)"

6. Удалить все html-теги с определенным атрибутом. Например, мы хотим удалить все теги (и содержимое тегов), у которых совпадает класс, или инлайн-стили
<td class="nowrap">([^<]*)</td> - то есть задаем искомую строку, внутри которой может быть произвольный текст. Текст оформляем как ([^<]*) - любые символы,
кроме символа открытия (или закрытия) тега.

7. Удалить все теги, внутри которых содержатся только числа:

Код:

<td>(\d+)</td>

8. Удалить заданное количество символов от начала строки (данный пример удаляет первые 9 символов):

Код:

^.{0,9}

В данном примере выражение \d+ означает любую цифры от 0 до 9 любое количество раз

Аналогично можно использовать следующие наборы выражений:

. — Один произвольный символ
^ — Начало строки
$ — Конец строки
\s — Пробел
\S — Не Пробел
\w — Буква, цифра или символ подчёркивания _
\d — Любая цифра
\D — Любой символ кроме цифр
[0-9] — Любая цифра
[a-z] — Любая буква от a до z (весь латинский набор символов) в нижнем регистре
[A-Z] — Любая буква от a до z в ВЕРХНЕМ регистре
[a-zA-Z] — Любая буква от a до z в произвольном регистре
[a-Z] — Любая буква от a до z в произвольном регистре
* — Повторение. Означает, что предшествующий символ может повторяться (0 или более раз)
.* — Любой набор символов. Например, условие <p> .*</p> — найдет все что между тегами <p> </p>
(^.*$) — Любой текст между началом и концом строки
([0-9][0-9]*.) — Любое двухзначное число
\n\r — Пустая строка
^\s*$ — Пустая строка с пробелом
^[ ]*$ — Ищет пустые строки содержащие пробел.

innerjoin86 · 25.04.2021

Для тех, кому интересна тема очень неплохой сервис для тестирования регулярных выражений.
Позволяет использовать для разных языков программирования, в том числе и для PHP.
Удобно использовать, т.к. сразу наглядно видно, что будет выбрано из искомой строки с помощью регулярки.

loitre · 26.04.2021

А как выделить последние 6 символов?

byura · 26.04.2021

положу здесь памятку

innerjoin86 · 26.04.2021

loitre сказал(а):
А как выделить последние 6 символов?

Код:

(.+)(.{6})

Выглядит примерно так

nikev · 26.04.2021

Не подскажете, как заменить каждый третий пробел в строке на /

Reset · 28.04.2021

Код:

\s\s\s

Код:

\s\s\\/

bolivar · 27.01.2022

Bash:

IP bt.ru.https > 192.168.88.10.54276: tcp 3374
IP 192.168.88.10.54276 > 192.168.88.18.https: tcp 0
IP 192.168.88.10.54276 > 192.168.88.18.https: tcp 0
IP 192.168.88.10.54276 > 192.168.88.18.https: tcp 0
IP somedomain.ru.https > 192.168.88.10.54276: tcp 334
IP 192.168.88.10.54276 > 192.168.88.18.https: tcp 0
IP 192.168.88.10.54276 > 192.168.88.18.https: tcp 0
IP 192.168.88.10.54276 > 192.168.88.18.https: tcp 0
IP www.somedomain.ru.https > 192.168.88.10.54276: tcp 228

Подскажите пожалуйста, как с помощью регулярки найти строки имеющие доменные имена?

lag · 27.01.2022

Код:

IP (?:\d+|\.|[a-z]()){7}\1[^\n]+

regex101: build, test, and debug regex

Online regex tester and debugger. Test, explain, benchmark, and generate code for PCRE2, JavaScript, Python, Go, Java, .NET, and Rust.

regex101.com

kiska · 05.02.2022

для парсинга укр/ру номеров телефонов в самых разных форматах (иногда, может захватить не номер, на больших объемах погрешность низкая)

Код:

/(?<!\w)(?:(?:(?:(?:\+?3)?8\W{0,5})?0\W{0,5})?[34569]\s?\d[^\w,;(\+]{0,5})?\d\W{0,5}\d\W{0,5}\d\W{0,5}\d\W{0,5}\d\W{0,5}\d\W{0,5}\d(?!(\W?\d))/x

nanocart · 16.04.2025

Кто не хочет заморачиватся, пишите gpt все задачи.
Если хорошо объяснишь, то поможет как правило.

Регулярные выражения в notepad++

Arioh

Создатель (I)

innerjoin86

loitre

Созидатель (II)

byura

Вложения

innerjoin86

nikev

Созидатель (II)

Reset

bolivar

Продвинутый (IV)

lag

Творец (III)

regex101: build, test, and debug regex

kiska

Творец (III)

nanocart