Gerçek Zamanlı Analiz Projesi

Web siteniz üzerinden belli alanlarda tıklama ve özel bilgileri takip etmek istediğinizde kullanabileceğiniz bazı ürünler var. Bunların birleşimini hızlıca ayağa kaldırmak için ne yapabilirizi paylaşacağım.

  1. Divolte Collector
    Scalable clickstream collection for Hadoop and Kafka
  2. Apache Kafka
    Distributed streaming platform
  3. Docker
    open platform for developers and sysadmins to build, ship, and run distributed applications, whether on laptops, data center VMs, or the cloud.

Detaylı geliştirmeleri ihtiyacınıza göre şekillendirebilirsiniz. İşlemler kabaca. Böyle. Burada karşılaşılan büyük bir sorun Avro’nın deserialize edilmesi. Onu da paylaştığım Java kodu ile sorunsuz yapabilirsiniz.

Linkler: 
https://github.com/Landoop/fast-data-dev
https://github.com/volkan/docker-divolte
https://github.com/volkan/divolte-kafka-streams