Seriál Marketingová strategie | Rozdělení výrazů do podskupin, dokončení analýzy

✍️ Jakub Kašparů
📅 02. 01. 2015

Ve 4. části se společně podíváme na rozdělení klíčových slov do užších podskupin za použití Facetů.

Nástroje potřebné pro tento díl:

  1. Open Refine (měli bychom mít naistalováno z předchozích dílů)
  2. Microsoft Excel
  3. Scraper, doplněk do prohlížeče Chrome

Filtrace skupiny

Pro větší přehlednost budeme pracovat s každou vytvořenou skupinou samostatně. Jako příklad si ukážeme filtraci skupiny “Advokátní, právní služby”.

Postup je následující:

  1. Rozbalíme si volby u sloupečku “Co”. Zvolíme “Facet” > “Text Facet”.
  2. V “Text Facetu” pomocí volby “Include” označíme skupinu “Advokátní, právní služby”.
  3. V hlavičce dokumentu se objeví 1179 matching rows (11012 total). Nyní pracuje pouze s 1 179 řádky.

Pro přehled je dobré vyfiltrovaná data projít. Vhodným způsobem, jak toto můžeme udělat, je aplikace “Word Facetu”. Při náhledu zjistíme, že nejvíce lidé hledají právní služby ve spojení s městem.

Filtrace dotazů obsahujících město

Nyní si ukážeme, jak získat databázi měst v ČR. Následně použijeme databázi pro vyfiltrování dotazů, které v sobě obsahují město.

Na internetu je možné najít mnoho databází měst v ČR. Tato data stačí vzít a aplikovat je na náš soubor. K tomu potřebujeme nainstalovat doplněk do prohlížeče Chrome, jež nám pomůže snadno a rychle vytáhnout potřebná data.

Jak na to:

  1. Pokud ještě nemáme nainstalován doplněk do prohlížeče, nainstalujeme ho.
  2. Na internetu najdeme zdroj, který obsahuje přehled měst v ČR. Nalezl jsem tuto databázi měst.
  3. Označíme si první sloupec v tabulce na stránce státní správy. Klikneme pravým tlačítkem myši a vybereme volbu “Scrape similar”.
  4. Nástroj nám nabídne v náhledu naši tabulku. Pokud je vše v pořádku, pokračujeme tlačítkem “Export to Google Docs”.
  5. Nyní musíme povolit doplňku zapisovat do Google Docs. Následně se data krásně zobrazí v tabulkovém editoru. Soubor si můžeme v Google Docs přes menu “Soubor” > “Stáhnout jako” > “Excel”

Jak použít databázi měst

Databáze měst je pochopitelně velmi obsáhlá. Pokud bychom chtěli každé město vyskloňovat v jednotném i množném čísle a aplikovat pomocí vlastního Facetu “or.(value.contains(“praha”),value.contains(“brno”)), Open Refine tak rozsáhlý příkaz nezvládne.

Nabízejí se 2 možnosti řešení:

  1. Necháme Open Refine přistupovat do externí databáze, kde postupně bude prověřovat výskyt měst v klíčových slovech.
  2. Další možností je postupná ruční filtrace po menších částech, kterou aplikujeme na dotazy bez diakritiky.

Jak aplikovat filtr na část měst:

  1. V našem Excelu zkopírujeme krajská města.
  2. Pomocí Open Refine, PSPadu či jiného nástroje odstraníme diakritiku z měst.
  3. Pomocí našeho nástroje vytvoříme podmínku pro vlastní textový Facet.
  4. Rozbalíme volby u sloupce “Dotaz” > “Facet” > Custom text Facet.
  5. Zkopírujeme vzoreček.
  6. Facet zobrazí hodnoty ”True” nebo “False”, kde “True” jsou řádky, které obsahují ve sloupci dotaz město.

Vyfiltrovaná data můžeme zařidit do Vámi zvolené podskupiny. Díky tomu můžete ušetřit čas při třídění klíčových slov.Podobným způsobem si můžeme práci ušetřit nejen v případě měst, ale například u databáze výrobců, názvů značek, jmen, čísel atd.

Rozdělení klíčových slov do podskupin

Pro následné úkony již nepotřebujeme žádné doplňky ani nové znalosti.

Postup dalšího třídění je následující:

  1. V “Text Facetu” aplikovaném na sloupeček “Co” zvolíme “Include” u kategorie “Advokátní, právní služby”. Tímto způsobem vyfiltrujeme pouze tyto dotazy.
  2. V případě, že jsme již vytvořili nové podskupiny, je dobré mít aktivovaný “Text Facet” na sloupec “Kategorie 2”, kde pomocí volby “Include” označíme veškeré “blank” buňky. Díky tomu budeme pracovat pouze s nerozdělenými klíčovými slovy.
  3. Měli bychom mít stále aktivovaný “Word Facet”, který nám dává inspiraci na možné podskupiny klíčových slov.
  4. Pomocí aplikace vzorečku value.contains(“kořen”), případně “Include” tlačítkem ve “Word Facetu” u sloupečku “Dotaz”, vybereme novou skupinu.
  5. Následně v “Text Facetu” u sloupce “Kategorie 2” přejmenujeme vybrané “blank” buňky na nový název podskupiny.
  6. Hotovo.

Proces opakujeme, dokud ve “Word Facetu” nacházíme rozsáhlejší skupiny klíčových slov. Jakmile zbudou ve “Word Facetu” klíčová slova v malém počtu, roztřídíme zbývající výrazy podle skupin na základě nejvíce hledaného výrazu ve výpisu. Takto pokračujeme do hledanosti menší než 100. Zbytek výrazů zařadíme do podskupiny “Ostatní”.

Hledání vylučujících slov

Mezi klíčovými slovy se vyskytují i výrazy, které do oboru, na který jsme se zaměřili, nepatří. Jedná se například o klíčové slovo “ďáblův advokát”. Pro tyto potřeby si vytvoříme nový sloupeček, který si nazveme “Vylučující slovo”. Aplikujeme “Text Facet” a dané výrazy si označíme například hodnotou “Ano”. Při dalším dělení budeme mít v text Facetu u sloupce “Vylučující” označené prázdné hodnoty “blank”. Díky tomu nám nebudou vylučující klíčová slova překážet.

Shrnutí

Pokud budeme postupovat na základě popsaného postupu z 2. a 3. článku seriálu, úspěšně se nám podaří dokončit analýzu klíčových slov. Tím ale práce nekončí. V další díle se podíváme na výstup z analýzy a její aplikaci.

Hotová analýza ve formátu Excel

4 comments on “Seriál Marketingová strategie | Rozdělení výrazů do podskupin, dokončení analýzy”

  1. Dobrý den,

    díky za článek, opět jsem se nenudil.

    Analýzu dělám na jiný obor a narazil jsem na pár věcí se kterými si nejsem úplně jistý.

    Mám produkt, který má 4 verze a sklik mi vyhodí KW například: vysavač 1 a vysavač1 nebo kamera 3 a kamera3 - je potřeba třídit zvlášť KW s mezerou a bez? Každá fráze má jinou vyhledávanost takže logicky to třídím, ovšem jestli je to správně nevím 🙂 Vzniká mi tím 8 podkategorií, je to dobře (čím podrobnější, tím lepší?), nebo je to zbytečné?

    Díky za info.

  2. Stanis:
    Dobrý den,
    děkuji.
    Když se podíváte na kompletní analýzu nerozlišuji výrazy, které mají například navíc pomlčku. Tyto výrazy minimálně v analýze spadají do stejné skupiny. Nedokážu si ani moc dobře přestavit samostatnou stránku, kde budu mít například ten samý produkt akorát bez mezery. Jednalo by se velmi pravděpodobně o duplicitní obsah z pohledu SEO. Navíc vyhledávače jsou dnes schopné poznat, že se jedná o ten samý dotaz.

    Jediné co by se snad dalo udělat navíc, je na stránce pro "vysavač 1" zmínil někde v textu i verzi "vysavač1".

  3. Dobrý den,

    děkuji za zajímavý článek spolu i s nápadem na řešení práce s klíčovými slovy a vlastně i za odkaz na tools k použití.
    V popisu "Jak použít databázi měst" jsem se zasekl u vzorečku pro OpenRefine, lépe řečeno nefunguje, ačkoliv slova jsou bez diakritiky [or(value.contains("NovyJicin"),value.contains("Ostrava-mesto"),value.contains("Olomouc"), a tak dále]. Je možné nahrát krátké video, jak se má tato činnost aplikovat, aby vše bylo ok?
    Jak by se dalo nechat OpenRefine přistupovat do externí databáze? Je možné také k tomu vytvořit video?

    Díky za info

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *


Lynt services s.r.o

Již 12 let vytváříme efektivnější kampaně, zrychlujeme weby a řešíme jejich bezpečnost. Kombinujeme marketing, vývoj a automatizaci.
poptávka služeb