Vyzkoušejte si regulární výrazy, tentokrát naopak

Vytváření klíčových slov může být někdy docela oříšek. O to větší, pokud se vám pod ruce dostane datový feed, který nepatří zrovna k těm nejúhlednějším. Tím mám na mysli takový zdroj, kdy například product_name obsahuje spoustu detailů, které v klíčových slovech nepoužijete, neb jsou až moc obecná, nebo až příliš konkrétní.

Toto se dá řešit způsobem, kdy upravíte proměnnou tak, že vytvoříte pár nových vlastních proměnných, ve kterých postupně pomocí regulárních výrazů odstraňujete skupiny slov či znaků, dokud vám v proměnné nezbyde požadované slovo.

Možná jste si už ale při tomto trochu zdlouhavém procesu říkali, že by bylo fajn, kdyby se nějak dalo místo odstranění skupiny slov tuto skupinu slov z textu vybrat. Zkrátka, aby funkcionalita byla zcela opačná než klasický regulární výraz. A pokud jste si to neříkali, tak už ani nemusíte, protože jsme pro vás vytvořili novou funkci, která přesně tímto způsobem funguje — Extrahovat regex!

Jak vypadá užití v praxi si ukážeme na třech různých příkladech — na elektronice, módě a čemkoliv dalším mimo tyto dvě kategorie.

Na elektroniku je vhodným klíčovým slovem _brand_ + _cislo_modelu_. Řekněme, že jako vstupní text máme Lenovo Legion Y520–15IKB, černá. Chceme tedy inzerovat na Lenovo Y520–15IKB. Pomocí vlastní proměnné vytvoříme regulární výraz “Mix písmen a číslic (ve většině případů): \b((?=[A-Za-z-\/]{0,19}\d)[A-Za-z0–9\/-]{4,20})\ba vybereme funkci Extrahovat regex.

U oblečení a obuvi se určitě vyplatí mít více variant. Jako vstupní text máme Vans UltraRange 3D — Black/Asphalt 47 a chceme vytvořit tyto čtyři varianty:

1.) název boty bez barvy a velikosti

2.) název boty + barva

3.) název boty + velikost

4.) název boty + velikost + barva

Variantu 1.) vytvoříme tak, jak jsme byli zvyklí přes šablonu regulárních výrazů odstraněním barvy a velikosti. Vznikne nám Vans UltraRange 3D.

Ve variantě 2.) je potřeba k názvům bot vytvořit vlastní textovou proměnnou na barvy. Tu vytvoříme přes funkci Najdi regulár, v šabloně vybereme “Barvy anglicky: \b(black|white|grey|gray|red|green|blue|silver|gold|brown|yellow|orange|pink|purple)\b. Výsledkem bude Vans UltraRange 3D Black.

Stejně tak vytvoříme i variantu 3.) — Přes funkci Extrahovat regex: \b(35|36|37|38|39|40|41|42|43|44|45|46|47|48|L|XXS|XS|S|XL|M|XXL|XXXL)\b. Dostaneme tak Vans UltraRange 3D 47.

Poslední variantu 4.) už jen snadno vytvoříme pouhým přidáním vlastní textové proměnné _barva_ + _velikost_ k názvu bot. Klíčovým slovem bude Vans UltraRange 3D 47 Black.

Poslední příklad si ukážeme na stavebnici. Vstupní text je LEGO Batman Movie 70905 Batmobil. Inzerovat chceme na klíčové slovo _brand_ + _cislo_stavebnice_, v tomto případě tedy LEGO 70905. Takové klíčové slovo si vytáhneme pomocí vlastní textové proměnné. Funkcí Extrahovat regex si vytáhneme všechny číslice — \d+.

Pak už nezbývá, než se nám na support@pppcbee.com pochlubit, kolik času vám nová funkce ušetřila! A pokud jste narazili na jakékoliv nejasnosti, také se neváhejte ozvat. :)