Düzenli ifadeler
Düzenli ifadeler Yandex Webmaster’da URL verilerini filtrelemek için kullanılabilir:
- Aramaya dahil edilen sayfalar.
- Site sayfalarının tarama istatistikleri.
- Harici bağlantılar.
- Sorgu izleme.
İfadeler RE2 söz dizimine ve aşağıdaki kurallara göre ayrıştırılır:
- Düzenli ifade, protokol ve etki alanı adı dahil olmak üzere sayfanın tüm URL’sine uygulanır. Örneğin, aşağıdaki düzenli ifadeyi kullanabilirsiniz:
^http://. - Bir düzenli ifade iki kez uygulanır: orijinal URL’ye ve
wwwön eki ile ve onsuz URL’ye. Etki alanı adındawwwön ekine sahip olma durumu, ifade doğrulama sonucunu etkilemez. - Düzenli ifade, URL kodlarının (% dizileri) kodu çözülmüş karakterlerle değiştirildiği çözülmüş URL’ye uygulanır. İstisna:
/,&,=,?ve#karakterlerinin kodları değiştirilmez. Örneğin,%2F/ile değiştirilmez. Not:+karakteri bir boşluk ile değiştirilir. Örneğin, düzenli ifadetext=elephantişlenecek, ancaktext=%D1%81%D0%BB%D0%BE%D0%BDvetext=%\w\wişlenmeyecek. - Kiril alfabesi içeren URL’ler punycode kullanmaz. Örneğin, normal ifade
^http://ввв\.сайт\.рф/işlenir, ancak^http://xn--b1aaa\.xn--80aswg\.xn--p1ai/işlenmez. - Bazı karakterler, düzenli ifadeler kontrolünden önce URL sonundan hariç tutulur:
?,#,&, ve nokta (.). Örneğin, URL’lerhttp://example.com/?,http://example.com/#,http://example.com/?var=1&sırasıylahttp://example.com/,http://example.com/,http://example.com/?var=1ile karşılaştırılır. Kullanıcı URL’yihttp://example.com./olarak girerse, normal ifade\./$işlenmez. - Kontrol edilen normal ifadelerde, nicelik belirleyiciler mümkün olduğunca çok karakterle eşleşir.
- URL karakterleri büyük/küçük harf duyarlıdır.
Normal ifadeler notu
Aşağıdaki tabloda, a, b, c, d, e herhangi bir karakterdir, n, m pozitif sayılardır.
|
Olası seçenekler |
|
|
abc|de |
Seçeneklerden birini eşleştirir: |
|
Karakter sınıfları |
|
|
[abc] veya [a-c] |
Listedeki (veya aralıktaki) herhangi bir (tek) karakterle eşleşir. |
|
[^abc] veya [^a-c] |
Listelenen (veya aralıktaki) karakterler dışında herhangi bir (tek) karakterle eşleşir. |
|
\d |
Bir rakam karakteriyle eşleşir. Eşdeğeri: |
|
\D |
Bir rakam olmayan karakterle eşleşir. |
|
\s |
Bir boşluk karakteriyle eşleşir. Eşdeğeri |
|
\S |
Bir boşluk olmayan karakterle eşleşir. |
|
\pL |
Herhangi bir Unicode karakteriyle eşleşir. |
|
\w |
Herhangi bir Latin harfi (büyük/küçük), rakam veya alt çizgi karakteriyle eşleşir. Unicode karakterlerle çalışırken, \w yerine |
|
\W |
Herhangi bir karakterle Latin harfi (büyük/küçük), rakam veya alt çizgi dışında eşleşir. Unicode karakterlerle çalışırken, \w yerine |
|
Oluşum sayısı (nicelikler) |
|
|
a* |
|
|
a+ |
|
|
a? |
Karakter |
|
a{n,m} |
|
|
a{n,} |
Karakter |
|
a{n} |
Karakter |
|
a*? |
|
|
a+? |
|
|
a?? |
Karakter a 0 veya 1 kez tekrarlandığında eşleşir (karakterin varlığı önceliklidir). |
|
a{n,m}? |
|
|
a{n,}? |
|
|
Satırdaki konum: |
|
|
^ |
Bir dizenin başlangıcını eşleştirir. |
|
$ |
Bir dizenin sonunu eşleştirir. |
|
\b |
Kelime sınırını eşleştirir – alfasayısal karakter ( |
|
\B |
Bir kelime sınırı olmayanı eşleştirir. |
|
Kaçış |
|
|
\ |
[ ] \ ^ $ . | ? * + ( ) { } özel karakterinden önce gelen ters eğik çizgi, bu karakterin özel olmadığı ve motamot yorumlanması gerektiği anlamına gelir. Örnek: |
|
\Q...\E |
|