Regex; regular expression açılımına sahip ve dilimizde düzenli ifade anlamına gelmekte olan, metinler içerisinde tekrar eden ya da benzersiz yapıları tespit etmeye yönelik kullanılan arama yapısıdır.
Regexp olarak da bilinmekte olan bu yapı genellikle yazılım ya da programlama süreçlerinde kullanılmaktadır. Buna ek olarak metin ayrıştırma süreçleri ile ilgilenen ve büyük veri kümeleri üzerinde çalışmakta olan profesyoneller tarafından da kullanılmaktadır.
RegeX Nasıl Çalışır ? Regex stringler (
text) yapıları üzerinde çalışmaktadır.
Stringleri soldan sağa biz düzlemde eşleştirerek, girilen formüle uygun eşleşmeyi bulmak mantığı ile süreci tamamlamaktadır. Bu çalışma yapısı ilk olarak aranılan stringi bulmak temelindedir. Ancak gibi durumlarda find-replace mantığı da çalışmaktadır. Bu da bulunan stringi başka bir string ile yer değiştirmektedir.
RegeX işlemlerinin başlatılması için ilk olarak özel karakter dizisi oluşturulmalıdır. Bu yapı aşağıda bahsedeceğimiz özel karakter düzenlemelerini içererek hedeflenecek olan
stringi almaya yönelik kurgulanır. Bu sayede
find ya da
find-replace işlemleri tamamlanacaktır.
RegeX Neden Kullanılmalıdır? - Düzenli ifadeler (Regular expressions) büyük veri kümelerinde hızlı sonuçlar almanıza olanak tanır,
- Tekrarlı yapılan kontrol edilmesi ve tekrarlardan kaçınılmasını kolaylaştırır,
- Daha hızlı, kolay, temiz ve güvenilir bir kod yapısı kurmanıza olanak tanır,
- Verilerin daha anlaşılır bir şekilde analiz edilmesini sağlamaktadır,
- Büyük veri kümeleri içerisinde toplu değişiklikler yapılmasını sağlar
RegeX Karakterleri ve Karakter Setleri Regular expressions (
Düzenli ifade) yazımları esnasında kullanılabilecek karakterler ve karakter setleri vardır. Bu karakterlerin her biri farklı bir kullanım amacına hizmet eder ve karakterlerin birlikte kullanımları ile bambaşka sonuçlar ortaya gelebilmektedir.
Regular expressions yazımında kullanılmakta olan genel karakterler ve anlamları şu şekildedir;
-------------------------------------------------------
Karakter : . İşlevi: Wildcard olarak da bilinmektedir. Her şey ile eşleşmektedir.
-------------------------------------------------------
Karakter : ^ İşlevi: String sonu.
-------------------------------------------------------
Karakter : $ İşlevi: String sonu.
-------------------------------------------------------
Karakter : * İşlevi: Sıfır ya da çoklu tekrar.
-------------------------------------------------------
Karakter : + İşlevi: Bir ya da çoklu tekrar.
-------------------------------------------------------
Karakter : ? İşlevi: Sıfır yada bir tekrar.
-------------------------------------------------------
Karakter : {m} İşlevi: İçerisinde yer alan karakterler için tam eşleşmeyi ifade eder.
-------------------------------------------------------
Karakter : {1,10} İşlevi: İçerisinde yer alan karakterler için ilk ve ikinci ifade arasında bir eşleşmeyi ifade eder
-------------------------------------------------------
Karakter : | İşlevi: Veya anlamına gelmektedir.
-------------------------------------------------------
Karakter : [x] İşlevi: Karakter seti
-------------------------------------------------------
Karakter : (x) İşlevi: İçerisinde yer alan karakterleri gruplar
-------------------------------------------------------
Karakter : \ İşlevi: Escape karakter olarak bilinir. Tabloda yer alan özel karakterleri (örn. “.”) normal karaktere dönüştürmektedir.
-------------------------------------------------------
Karakter : \w İşlevi: Tüm harf ve rakamları içerisine alır. (Küçük harfler)
-------------------------------------------------------
Karakter : \w İşlevi: Tüm harf ve rakamları içerisine alır. (Küçük harfler)
-------------------------------------------------------
Karakter : \W İşlevi: Tüm büyük harf ve rakamları ifade eder.
-------------------------------------------------------
Karakter : \d İşlevi: Tüm rakamları ifade eder.
-------------------------------------------------------
Karakter : \n İşlevi: Satır işareti.
-------------------------------------------------------
Karakter : \s İşlevi: Boşluk.
-------------------------------------------------------
Karakter : \S İşlevi: Boşluk içermeyen.
-------------------------------------------------------
RegeX Nasıl Kullanılır? Regular expression yazımları genellikle
iki slash(taksim) işareti “
/ /” arasına yazılmaktadır. Bu işaretler ile
regeX yazımı açılır ve daha sonra kapatılabilir. Yukarıda vermiş olduğumuz karakter dizeleri kullanılarak tüm
find ve
find&replace işlemeleri yürütülebilir.
RegeX çalışma mantığı olarak verinin en solundan başlayarak sağ’a doğru verilen karakterler ile eşleştirme aşamalarına başlar. Eğer
“/g” yani global eklemesi
Regular expressions (
Düzenli ifade) yazım sonuna eklenmez ise
find işlemi ilk seferde duracak ve işlem tamamlanacaktır.
/g = global anlamına gelmektedir. Bu işaret Regular expressions (Düzenli ifade) yazım sonuna eklenir ve çalışan datanın hepsinin kapsama alındığını ve işlemin sadece ilk
find’da sonlanmaması gerektiğini ifade eder.
Örnek bir Regular expressions yazımı yapmak gerekir ise; - /^a.b/g bu yazım test içerisindeki > aeb, aib, ayb gibi terimler ile eşleşebilecektir. Yani “.” işareti wildcard olarak herhangi bir karakterin yerini alabilecektir. Ancak en başta kullandığımız “^” işareti nedeni ile terimler a ile başlamak zorunda olacaktır.
Başka bir örnek vermemiz gerekir ise; - /([A-Z])\w+/g bu örneğimizde ise büyük harf ile başlayan kelimeleri bizler için getirecek bir RegeX yazmış olacağız.
Eğer OR (veya) yapısını kullanmak istersek; - /(seo)|(SEO)|(Seo)/g şeklinde bir yazım yapılarak, SEO, Seo ya da seo eşleşmeleri hedeflenebilir.
Regular expressions yazım standartlarında kullanılabilecek “
Flag” türleri vardır. Bu “
Flag” yapıları eşleşmelerin nasıl olacağını, global ya da
Case insensitive olacağını belirlemekte olan
flag yapılarıdır.
-------------------------------------------------------
Flag : /g İşlevi: Global.
-------------------------------------------------------
Flag : /m İşlevi: Multiline anlamına gelmektedir. Çoklu satır seçimlerinde kullanılabilir.
-------------------------------------------------------
Flag : /i İşlevi: Case insensitive anlamına gelmektedir. Eşleşmelerde büyük ya da küçük harf ayrımını ortadan kaldırır.
-------------------------------------------------------
Flag : /s İşlevi: Dotail anlamına gelmektedir. Tüm yeni satırları da eşleşme içerisine dahil edecektir.
-------------------------------------------------------
Flag : /U İşlevi: Ungreedy anlamına gelmektedir. Niceleyicileri varsayılan olarak lazy olmayan.
-------------------------------------------------------
RegeX ve SEO Çalışmaları
Regex yapıları
SEO çalışmalarında da sıkça kullanılan bir yazım yöntemidir. Büyük veriler ve anahtar kelime kümleri ile ilgilenen
SEO ve dijital pazarlama profesyonelleri için
Regular expressions yazımı hayat kurtarıcı olmaktadır. Bu sayede tespit edilmek istenen anahtar kelimeler ya da türevleri hızlı bir şekilde bulunur.
Google Sheets’de RegeX Kullanımı
Google
sheets üzerinde
regeX kullanmak adına üç farklı formül bulunmaktadır;
- REGEXMATCH
- REGEXEXTRATCH
- REGEXREPLACE
REGEXMATCH REGEXMATCH formulü,
Google Sheets hücrelerinizde yer alan girdiler ile, oluşturduğunuz
RegeX find yapısının eşleşmesi halinda
“TRUE” dönüşü yapan, eşleşme olmaması halinde ise
“FALSE” dönüşü yapan bir formüldür. Yani sizlere aradığınız
stringin orada olup olmadığını getirecektir.
REGEXEXTRATCH REGEXEXTRATCH formülü, yazdığınız
Regular Expression için eşleşecek olan çıktıya sütuna ekler ve sizlere sunar.
REGEXMATCH yapısının aksine doğru-yanlış çıktısını vermez, eğer eşleşme olur ise size direkt olarak
stringi sunacaktır.
REGEXREPLACE REGEXREPLACE yapısı, belirlediğiniz
string ile başka bir
stringi değiştirmenize olanak tanır. Bu yanı hali hazırda
Google sheets üzerinde
Find&Replace olarak da bulunmaktadır. Ancak REGEXPEPLACE ile var olan
orjinal stringleri bozmadan yeni bir sütun üzerinde değiştirme işlemleri düzenlemek mümkün. Ayrıca
Google Sheets find&replace yapısının aksine
REGEXPLACE ile daha fazla eşleşme daha kolay ve geniş bir şekilde yürütebilirsiniz.
Google Search Console RegeX Kullanımı Google Search Console SEO çalışmaları adına büyük öneme sahiptir,
Organik kazanımların takip edilmesi adına günü birlik kullandığımız bir yapıdır. Bu nedenle burada karşılaşacağımız sorgular yığını ile baş etmek adına ya da URL yapılarımız üzerinde daha geniş aramalar yapmak adına
Regular expressions kullanırız.
GSC üzerinde RegeX kullanmak adına performans raporları içerisinde
“Filtre” kullanımları gerçekleştirilmelidir. Filtreler içerisinde hem
“Sorgu” filtresinde hem de
“Sayfa” filtresinde
regeX kullanımı faydalı olacaktır.
Regular expressions yazımlarını kullanmak adına istediğiniz filtreyi seçtikten sonra eşleşme türlerinden “
Özel(REGEX)” eşleşmesini seçmelisiniz.
Örneğin organik sorgularınız arasında regex ile arama yapmak için; - Performans raporlarını açın,
- Filtreye tıklayın,
- Sorgu filtresini seçin,
- Eşleşme türünü “Özel(REGEX)” olarak belirleyin,
- RegeX yazımınızı girin ve “Uygula” tuşuna basın, işte bu kadar.
Online RegeX Araçları
Regular expressions (Düzenli ifade) yazımlarımızı test etmek ve tarayıcı üzerinde veri kümeleri üzerinde işlem yapmak adına kullanabileceğimiz web siteleri bulunmaktadır. Bu siteler şu şekildedir;
Bu web siteleri
Regular expressions yazımlarımızı test etmek, veri kümeleri üzerinde online olarak işlem yapmak adına kullanılabilecek kaynaklardandır.
Bu araçlara ek olarak
Visual sutido code, PyCharm, PHPStorm üzerinde de RegeX kullanımlarını gerçekleştirmemiz mümkündür.
Kaynak :
[Üye Olmadan Linkleri Göremezsiniz. Lütfen Üye Olmak için TIKLAYIN...]