KNIME ile Dosya Okuma

Rahime Yeşil
Data Runner
Published in
5 min readNov 13, 2020

--

Excel , CSV

Merhabalar! Bir önceki yazımızda Mert Alabaş arkadaşımızın yazdığı Knime ile Veri Analizi yazısında Knime nedir ne değildir nerelerde kullanılır ve ekran tanıtımlarıyla KNIME yazı serimize genel bir giriş yaptık. Bu yazıda sizlere knime ortamında excel ve csv uzantılı dosyalarınızı nasıl okutacağınızdan bahsedeceğim.

Resim 1.1 -Knime Açılış Ekranı

Öncelikle Knime ekranı ilk açıldığında Resim 1.1 ‘de ki gibi bir ekran ile karşılaşacaksınız. Bu ekranda yapılması gerekenleri şu şekilde sıralayabiliriz;

1-Yeni bir iş akışı oluştur

2– İş Akışına Düğüm Ekle

3–Düğüm Ayarlamalarını Yap

4-Düğümü Çalıştır

Şimdi bu adımları sırasıyla ilk excel daha sonrasında ise csv ile yapalım.

Excel Dosyası Okuma

1- Yeni bir iş akışı oluştur

Yeni bir iş akışı oluşturmak için öncelikle sol üst köşedeki File > New menüsüne tıkladıktan sonra önümüze bir seçim sihirbazı(select a wizard) belirecek buradan New KNIME Workflow ‘u seçerek ilerlemeliyiz.

Ardından yeni oluşturacağımız iş akışı için bir isim vermeliyiz. Bu iş için ben KNIME_Read_Files adını verdim. Siz istediğiniz gibi adlandırabilirsiniz. Destination of new workflow kısmından browse diyerek iş akışınızı seçeceğiniz bir konumda oluşturabilirsiniz. Hemen ardından Finish butonuna basarak iş akışımızı oluşturmuş olduk. Bu sefer karşımıza açılış ekranından farklı olarak boş bir iş akış ekranı eşlik ediyor.

Resim 1.3 -İş akış Ekranı

2- İş Akışına Düğüm Ekle

Boş iş akış ekranımıza öncelikle excel dosyasını eklemek istediğim için Node Repository alanından IO sekmesini açarak altında bulunan Read’in altından Excel Reader(XLS) düğümünü seçerek iş akış ekranına sürükleyelim. Aramakla zaman kaybetmek istemezseniz yine Node Repository’nin sağ üst köşesinde konumlanmış olan arama boşluğuna Excel Reader yazmanız yeterli olacaktır.

3-Düğüm Ayarlamalarını Yap

Bir önceki yazımızda bahsedilen düğümlerde beliren renklerin ne anlama geldiğini bildiğinizi varsayarak henüz ayarları yapılmamış olan düğümümüzü ayarlamak için düğümün üzerine gelip sağ tık >> configure menüsünü seçelim.

Yukarıdaki resmin sağ tarafındaki gibi bir ekran ile karşılaşacaksınız. Burada yapmanız gereken öncelikle hangi veri setini kullanacaksanız Browse’a tıklayarak seçmeniz. Ben önceden oluşturduğum veri setini seçtim.

Yukarıdaki resimde de görüldüğü üzere kolon başlıkları satır olarak değerlendirilmiş. Bu durumdan kurtulmak için Column Names alanında bulunan Table contains column names in row number 1 alanını işaretlemelisiniz. Sayıyı veri setinizin durumuna göre değiştirebilirsiniz ama genelde ilk satır kolon adı olur. Burayı işaretledikten sonra en altta bulunan Preview alanından reload butonuna tıklayarak veri setinde meydana gelen değişikliği görebilirsiniz.

Şuana kadar yapmış olduğumuz değişiklikleri Apply >> OK adımlarını izleyerek kaydedelim.

3-Düğümü Çalıştır

Resimde gördüğünüz gibi düğümde sarı ışık belirmekte yani düğümde bir değişiklik meydana gelmiş ama henüz bu değişiklik Execute edilmemiş. Düğüme Sağ tık >>Execute edelim ya da kırmızıyla işaretlediğim sembole tıklayarak da düğümü çalıştırabilirsiniz. Dikkat ederseniz düğümde yeşil ışık mevcut yani düğüm hazır, veri seti sorunsuz bir biçimde iş akışına eklendi. Tüm veri setini görüntülemek için düğüme Sağ tık >> Output table’ı seçelim. Gördüğünüz gibi artık excel dosyasındaki veri setini iş akışına eklemiş olduk.

CSV Dosyası Okuma

1- İş Akışına Düğüm Ekle

Knime ortamında csv dosyalarımızı okumak için öncelikle Node Repository’nin altında bulunan IO >>Read >>CSV reader’ı iş akış ekranına sürükleyelim. Yine excel dosyamızı okurken söylediğim gibi bulmak istediğiniz düğüm(node) ismini sağ üst köşede bulunan arama kutusuna yazarak da bulabilirsiniz. Bu örnekte arama kutusuna yazarak ilerleyeceğiz.

Bir önceki örnekte de gördüğünüz gibi CSV Reader düğümü bize henüz configure edilmediği mesajını veriyor, bu durumu düzeltmek için düğümün üzerine gelip Sağ tık >> Configure diyerek düğümün ayarlarını yapalım.

3-Düğüm Ayarlamalarını Yap

Düğümün üzerine tıklayıp F6 tuşuna basarak kısa yoldan ayarlar(configure) ekranına ulaşmanız mümkün olacaktır.

Ayarlar kısmından iş akışına eklemek istediğiniz csv uzantılı dosyanızı Browse diyerek ekleyebilirsiniz. Benim veri setimde kolon başlıkları ilk satırda olduğu için Has Column/Row Header alanlarında bir değişiklik yapmadım. Aynı zamanda verilerim “,” ile ayrıldığından dolayı da Column Delimiter’da yine bir değişiklik yapmadım. Örneğin veri setinizdeki kolonlarınız “/” ile ayrılsaydı Column Delimiter’da ki vilgülü silerek slash işareti koymalısınız. Değişiklikleri Apply >> OK diyerek kaydedelim.

3-Düğümü Çalıştır

Artık son adım olarak ayarları yapılmış olan düğümü çalıştırmak kaldı. Öncelikle CSV Reader düğümünün üzerine tıklayıp aşağıdaki resimde olduğu gibi kırmızı olarak işaretlediğim Execute butonuna basarak düğümü çalıştıralım.

Yukarıdaki resmi incelediğimizde düğümdeki sarı ışık, düğüm execute edildikten sonra yeşil renge döndü. Yeşil ışık bizlere ayarlarda bir problem olmadığını göstermektedir. Veri setimizi görüntüleyelim. Knime ortamına yüklediğimiz veri setini görüntülemek için öncelikle düğümün üzerine gelip Sağ tık >> File table dediğimiz zaman ekrana veri setimiz gelir.

Evet, böylelikle bu yazımızda Knime ortamına nasıl Excel ve CSV dosyalarımızı yüklediğimizi öğrendik, bir sonraki yazımızda Knime ortamına SQL database’inden nasıl veri kaynağı ekleyebileceğimizi paylaşıyor olacağız. O zamana kadar bizi takipte kalın.

Keyifli Okumalar.

--

--