[edit 7.1.2019]

Vybráno

Nakonec to všechno dopadlo trochu jinak než jsem si původně myslel. Koupil jsem si VW Passat 1.6 TDI, 77kW 11/2011 s nájzedem kolem 140k, ale se super historií (pouze autorizovaný VW servis) a auto mám navíc proklepnuté od shora dolu. Cena byla někde pod 250k, ale je nutno započítat další náklady na dovoz, přihlášení, nějaké kontroly apod.. Mám ho zatím necelé 2 měsíce a najel jsem na něm cca 2000km, přičemž v tomhle období najezdíme opravdu nejméně, takže počítám že ročně to bude někde 15–20k. V zimě po městě ve všech těch zácpách to jezdí někde 5.5–6.5l/100 (dost s tím jezdí žena :-D). Mimo město dost záleží jak jsme naložený apod.., ale je to někde mezi 4.5–6l..takže …


I am not going to introduce any huge or magic list of Data Science sources. I'd like to show you which DSC (Data Science) source I regularly use.

Learning

DataCamp.com

Coursera


Bylo to poprvé co jsem navštívil tento legendární webový event. Kdysi během studií na VŠE jsem si koupil studentský lístek, ale nakonec jsem nešel a využil pouze přístup k videu. Delší dobu jsem na žádné konferenci nebyl, takže jsem se i docela těšil. Rovnou na začátku prozradím, že WebExpo ve mě zanechalo pozitivní dojem a příští rok bych rád šel znovu. Nicméně tenhle event měl i svá negativa (nikdo není dokonalý). Nechystám se zde nějak detailně rozebírat jednotlivé přednášky, spíš bych chtěl vyjádřit svůj celkový dojem.

Příprava

Ve čtvrtek jsem si poctivě otevřel stránky WebExpo a začal procházet detailně program na následující 2 dny. Měl jsem už nějaký základní přehled toho co tam bude, ale teprve ve čtvrtek jsem se do toho ponořil. Původně jsem si myslel, že to bude jednochuché, ale to jsem se mýlil. Často jsem měl dilema kam jít, protože se mi zajímavá témata překrývala. Na druhou stranu jsem se uklidňoval tím, že po akci budou dostupná videa i s prezentací. To se potvrdilo, akci natáčela firma SlidesLive.com, kterou jsem poznal nedávno díky zajímavému rozhovoru na webu MladyPodnikatel.cz. Musím se přiznat, že můj původní naplánovaný program dostával během akce občas trhliny. Mohla za to částečně lenost chodit mezi sály, případně jsem někde zůstal s nějakým kolegou z práce apod. Vždy jsem se ale ujistil, že mě dané téma nějak zajímá nebo pro mě bude alespoň přínosem. …


K napsání toho blogpostu mě částečně nakopla nedávná diskuze na Twitteru Lukáše Pítry respektive Pavla Ungra. Konkrétně tedy tento text

Na první pohle to může vypadat jako fajn nápad, ale má to několik důležitých “ALE”. Především je potřeba si uvědomit, že R není něco, co se naučíte za 1 den školení. Pavel ve svém tweetu doporučuje spíše podklady než školení(řekl bych že s tím nemá dobrou zkušenost :-)).

Rko je jazyk a prostředí, které se používá pro statistiku, data mining, manipulaci s daty či vizualizaci dat. Samozřejmě Rko toho umí ještě mnohem více( “What is R”).

Obecně aby vůbec takové školení mělo význam, tak uživatelé musí znát základní syntaxi jazyka. V podstatě je to stejné jako kdybych chtěl školení na Python, JavaScript nebo jiný jazyk pro e-commerce, ale neznal jsem základní principy toho jazyka. Dokážete si to přestavit? Já docela jo :-). Domu si odnesu pár souborů skriptů a možná nějakou prezentaci. Za pár dní na to budu koukat s určitou nejistotou a za pár týdnů už nebudu moc tušit. Možná mi některé skripty budou k něčemu otrocky sloužit, ale pravděpodobně mi to dlouhodobě nebude k ničemu. …


Trochu si na začátek zavzpomínám na moje studium Informačního managementu na KSA VŠE v Praze :-). V současné době jsme obklopeni celou řadou různých zdrojů ze kterých můžeme čerpat data, přiřadit jim význam a tak z nich vytvořit informace. Informace pak dáváme do různých souvislostí a utváříme z nich znalosti -> moudra, které využíváme.

Image for post
Image for post

Proč vlastně ten úvod? Tím jsem chtěl naznačit, že rozhodně není dobré všechna data považovat za informace. Dat okolo sebe najdeme mnoho, ale jen některé z nich by pro nás měly být informací či posléze znalostí a možná i moudrem.

V podobném duchu mě někdy minulý rok (možná v roce 2015 ) inspirovala zajímavá přednáška Vojty Ročka na téma “řešíš píčoviny, protože čteš sračky”. Super věc je třeba s tím kruhem zájmů. Uričtě doporučuji si to přečíst. …


Dlouho mi trvalo než jsem se dokopal k napsání tohoto blogpostu. Už delší dobu bych se rád podělil o věci které mě zajímají. Když to nebude nikoho zajímat, tak si alespoň procvičím psaní a utřídím myšlenky.

Přemýšlel jsem jestli mám psát v CZ nebo EN, nakonec jsem se rozhodl, že to zkusím různě střídat. Psání v CZ pro mě přirozenější, ale na druhou stranu publikováním v EN si procvičím moji chabou “ČENGLIŠ” a třeba to bude zajímat i někoho za hranicemi našeho malého království.

O čem to bude?

Zhruba 7–8 let se věnuji online marketingu. Posledních pár let mě hodně baví data, konkrétně data z webů či nativních aplikací. K datům jsem se pořádně dostal až v roce 2013 a to v podobě Google Analytics. Tehdy jsem GA začal aktivně využívat jako SEO konzultant. Ještě kdysi dávno jsem se na střední učil Visual Basic .NET, základy PHP, JS či SQL. Na vysoké jsem pak trpěl v Javě. Avšak někdy počátkem roku 2015 jsem narazil na statistický jazyk R, který mi dnes pomáhá v každodenních činostech okolo dat a vlastně mě hodně otočil na datovou dráhu. …


Don’t trust your GEO location data within Google Analytics via Opera Mini browser. [valid until 12/2016]
Opera use own servers that sends a compressed version on to the mobile device.
I tried connect to my site via Opera Mini browser one month ago. My real location was Czech Republic — Prague and GA displayed Kenya location.

The most used GEO loacation via Opera Mini

opera-mini
opera-mini

[edit 13.12.2016]

I have probably seen right GEO within GA via Opera Mini since November 2016.


Do you want to get your data from multiple Google Analytics profiles? Are you interested in your website traffic? You can merge your data from multiple profiles about whatever you want(locations, channels, browser etc.).

I usually use Rstudio where i combine R library “RGA” and “for loop”.

Use RGA library

Detailed description of RGA library is here.

library(rga)
options(RCurlOptions = list(verbose = FALSE, capath = system.file("CurlSSL", "cacert.pem", package = "RCurl"), ssl.verifypeer = FALSE))
rga.open(instance = "ga")

Unsampled GA data

Sometimes you have to use “lubridate” library, because GA returns SAMPLE data(Free user account) and it is neccessary use “lubridate”.
If you want to get unsampled data then use option “walk = TRUE” within ga$getData. This library gets data from GA by days and increases your chance for unsampled data. More about data sampling in GA.
It is not neccessary use “lubridate” in all cases, but it depends on data volume and date range which use. …


If you want to get data from Google Analytics via RGoogleAnalytics from last week or last month. You have to change fix date as “2016–02–01” to floating date. Can you paste this date directly to code? Of course — you can. However if you scheduled your script via Cron, you have to change date dynamically.

Use Lubridate library

library(lubridate)

Set First and Last day of Last Month

currentDate <-Sys.Date() #current date
# end of previous month:
eopm <- as.character(currentDate - days(day(currentDate)))

# start of previous month:
sopm <- currentDate - days(day(currentDate))
sopm <- as.character(sopm - days(day(sopm) - 1))

Set First and Last day of Last Week

currentDate <-Sys.Date() #current date
# end of previous week
eopw <- as.character((currentDate - days(wday(currentDate))+1))

# start of previous week:
sopw <- currentDate - days(wday(currentDate))
sopw <- as.character(sopw …

About

Antonin Kučera

Head of Business Intelligence at livesport.eu

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store