Mudanças entre as edições de "Regular expression"
De WikiLICC
m (→Padrões) |
m (→Padrões) |
||
Linha 6: | Linha 6: | ||
Classes de caracteres e padrões | Classes de caracteres e padrões | ||
− | ;[abc]: a, b ou c | + | ;[abc] :a, b ou c |
− | ;[a-c]: a, b ou c | + | ;[a-c] :a, b ou c |
− | ;[0123456789]: qualquer dígito | + | ;[0123456789] :qualquer dígito |
− | ;[0-9]: | + | ;[0-9] :qualquer dígito |
− | ;[^abc]: | + | ;[^abc] :qualquer caractere exceto a ,b ou c |
+ | ;\a :caractere BELL (BEL, 0x07) | ||
+ | ;\f :caractere form feed (FF, 0x0C) | ||
+ | ;\n :caractere fim de linha (LF, 0x0A) | ||
+ | ;\r :caractere carriage return (CR, 0x0D) | ||
+ | ;\t :caractere TAB (HT, 0x09) | ||
+ | ;\v :caractere TAB vertical (VT, 0x0B) | ||
+ | ;\xhhhh :caractere Unicode hhhh | ||
+ | ;. (dot):qualquer caractere (inclui newline) | ||
+ | ;\d :qualquer dígito [0-9] | ||
+ | ;\D :qualquer não-dígito [^0-9] ou [^\d] | ||
+ | ;\s :espaco em branco. Igual a [ \t\n\r] | ||
+ | ;\S :exceto espaco em branco. Igual a [^ \t\r\n] e [^\s] | ||
+ | ;\w :word caractere: dígito ou letra. Igual a [a-zA-Z0-9] | ||
+ | ;\W :exceto word caractere | ||
− | |||
− | + | Devem ser "escaped" | |
− | |||
− | + | ;] :Finaliza uma classe | |
− | \ | + | ;^ (caret) :Nega uma classe |
+ | ;- (dash) :Denotes um range | ||
+ | ;\ (backslash) :usado para "escape" | ||
− | + | Encontre "somente um dos" | |
− | |||
− | + | ;[a|b|1|2] :apenas a ou b ou 1 ou 2 | |
− | |||
− | |||
− | |||
− | + | Padrões de substituicão (entre parenteses) | |
− | |||
− | + | ;(int|float|double)\s+\w+ ;Somente um dos int, float ou double seguida por espaco e algumas letras. | |
− | |||
− | + | Referencias anteriores | |
− | |||
− | + | ;(\w+),\1 : encontras duas palavras repetidas separada por vírgula. Note que \1 repere o padrão | |
− | \ | ||
− | + | Olhando a frente | |
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
A lookahead assertion is a sub pattern, starting with either ?= or ?!. | A lookahead assertion is a sub pattern, starting with either ?= or ?!. | ||
− | + | ;Bill(?! Gates) :Bill Clinton, Billy the kid, mas não Bill Gates | |
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | + | Caracteres especiais em padrões de substituićão | |
− | + | ;\ (backslash) :Escape | |
− | + | ;^ (caret) :Comeco de string | |
− | + | ;$ :fim de string | |
+ | ;() :denota padrões de substituićào | ||
+ | ;{} :quantificadores numéricos | ||
+ | ;[] :delimita classes | ||
+ | ;| :ou lógico | ||
+ | ;+ :quantificador 1 ou mais | ||
+ | ;* :quantificador 0 ou mais | ||
+ | ;? :quantificador 0 ou 1 |
Edição das 13h10min de 24 de maio de 2015
Breve resumo de expressões regulares para o Kate.
Veja www.kate-editor.org/doc/regular-expressions.html
Padrões
Classes de caracteres e padrões
- [abc]
- a, b ou c
- [a-c]
- a, b ou c
- [0123456789]
- qualquer dígito
- [0-9]
- qualquer dígito
- [^abc]
- qualquer caractere exceto a ,b ou c
- \a
- caractere BELL (BEL, 0x07)
- \f
- caractere form feed (FF, 0x0C)
- \n
- caractere fim de linha (LF, 0x0A)
- \r
- caractere carriage return (CR, 0x0D)
- \t
- caractere TAB (HT, 0x09)
- \v
- caractere TAB vertical (VT, 0x0B)
- \xhhhh
- caractere Unicode hhhh
- . (dot)
- qualquer caractere (inclui newline)
- \d
- qualquer dígito [0-9]
- \D
- qualquer não-dígito [^0-9] ou [^\d]
- \s
- espaco em branco. Igual a [ \t\n\r]
- \S
- exceto espaco em branco. Igual a [^ \t\r\n] e [^\s]
- \w
- word caractere: dígito ou letra. Igual a [a-zA-Z0-9]
- \W
- exceto word caractere
Devem ser "escaped"
- ]
- Finaliza uma classe
- ^ (caret)
- Nega uma classe
- - (dash)
- Denotes um range
- \ (backslash)
- usado para "escape"
Encontre "somente um dos"
- [a|b|1|2]
- apenas a ou b ou 1 ou 2
Padrões de substituicão (entre parenteses)
- (int|float|double)\s+\w+ ;Somente um dos int, float ou double seguida por espaco e algumas letras.
Referencias anteriores
- (\w+),\1
- encontras duas palavras repetidas separada por vírgula. Note que \1 repere o padrão
Olhando a frente
A lookahead assertion is a sub pattern, starting with either ?= or ?!.
- Bill(?! Gates)
- Bill Clinton, Billy the kid, mas não Bill Gates
Caracteres especiais em padrões de substituićão
- \ (backslash)
- Escape
- ^ (caret)
- Comeco de string
- $
- fim de string
- ()
- denota padrões de substituićào
- {}
- quantificadores numéricos
- []
- delimita classes
- |
- ou lógico
- +
- quantificador 1 ou mais
- quantificador 0 ou mais
- ?
- quantificador 0 ou 1