<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0" xmlns:cc="http://cyber.law.harvard.edu/rss/creativeCommonsRssModule.html">
    <channel>
        <title><![CDATA[Stories by Dikasintia on Medium]]></title>
        <description><![CDATA[Stories by Dikasintia on Medium]]></description>
        <link>https://medium.com/@dikasintia28?source=rss-6b853755a55f------2</link>
        <image>
            <url>https://cdn-images-1.medium.com/fit/c/150/150/0*J8Wb5Dox4rhYs0eD</url>
            <title>Stories by Dikasintia on Medium</title>
            <link>https://medium.com/@dikasintia28?source=rss-6b853755a55f------2</link>
        </image>
        <generator>Medium</generator>
        <lastBuildDate>Tue, 26 May 2026 22:56:02 GMT</lastBuildDate>
        <atom:link href="https://medium.com/@dikasintia28/feed" rel="self" type="application/rss+xml"/>
        <webMaster><![CDATA[yourfriends@medium.com]]></webMaster>
        <atom:link href="http://medium.superfeedr.com" rel="hub"/>
        <item>
            <title><![CDATA[Dari Data Mentah ke Model Cerdas: Panduan Alur Kerja Machine Learning untuk Pemula]]></title>
            <link>https://medium.com/@dikasintia28/dari-data-mentah-ke-model-cerdas-panduan-alur-kerja-machine-learning-untuk-pemula-30233b3bf4df?source=rss-6b853755a55f------2</link>
            <guid isPermaLink="false">https://medium.com/p/30233b3bf4df</guid>
            <category><![CDATA[machine-learning]]></category>
            <category><![CDATA[data-science]]></category>
            <category><![CDATA[technology]]></category>
            <dc:creator><![CDATA[Dikasintia]]></dc:creator>
            <pubDate>Fri, 22 May 2026 11:39:41 GMT</pubDate>
            <atom:updated>2026-05-22T11:39:41.172Z</atom:updated>
            <content:encoded><![CDATA[<p>Di era digital saat ini, data menjadi salah satu aset paling berharga. Hampir semua aktivitas yang kita lakukan menghasilkan data, mulai dari penggunaan media sosial, transaksi online, hingga penggunaan aplikasi sehari-hari. Namun, data mentah tidak akan memberikan manfaat jika tidak diolah dengan baik. Di sinilah Machine Learning (ML) hadir sebagai solusi.</p><p>Machine Learning merupakan cabang dari kecerdasan buatan (Artificial Intelligence) yang memungkinkan komputer untuk belajar dari data dan membuat prediksi atau keputusan tanpa diprogram secara eksplisit. Teknologi ini sudah digunakan di berbagai bidang, seperti rekomendasi film di Netflix, sistem navigasi Google Maps, chatbot, deteksi spam email, hingga analisis kesehatan.</p><p>Bagi pemula, Machine Learning mungkin terlihat rumit karena melibatkan banyak istilah teknis dan proses yang panjang. Padahal, jika dipahami langkah demi langkah, alur kerja Machine Learning sebenarnya cukup terstruktur dan mudah dipelajari.</p><p>Artikel ini akan membahas bagaimana proses Machine Learning berjalan dari awal hingga model siap digunakan. Mulai dari pengumpulan data, preprocessing, pemilihan algoritma, evaluasi model, hingga deployment. Selain itu, akan dijelaskan juga tools populer seperti Python, Pandas, dan scikit-learn yang sering digunakan oleh para praktisi data science.</p><h3><strong>Ilustrasi Alur Kerja Machine Learning</strong></h3><figure><img alt="" src="https://cdn-images-1.medium.com/max/1024/1*wGgpu3HqcTijSS-3-UByWw.png" /><figcaption>Alur Kerja Mesin Learning (End-to-End)</figcaption></figure><ol><li><strong>Pengumpulan Data (Data Collection)</strong></li></ol><p>Langkah pertama dalam Machine Learning adalah mengumpulkan data. Data merupakan bahan utama yang akan digunakan model untuk belajar. Semakin baik kualitas data yang dimiliki, maka semakin baik pula hasil model yang dihasilkan.</p><p>Data dapat diperoleh dari berbagai sumber, seperti:</p><ul><li>Database perusahaan</li><li>API (Application Programming Interface)</li><li>Website scraping</li><li>File CSV atau Excel</li><li>Sensor IoT</li><li>Media sosial</li></ul><p>Sebagai contoh, jika ingin membuat model prediksi harga rumah, maka data yang dibutuhkan bisa berupa:</p><ul><li>Luas rumah</li><li>Jumlah kamar</li><li>Lokasi</li><li>Tahun pembangunan</li><li>Harga rumah</li></ul><p>Dalam proses ini, bahasa pemrograman yang paling populer digunakan adalah Python karena memiliki banyak library pendukung. Salah satu library yang sering digunakan adalah Pandas.</p><p>Contoh membaca data menggunakan Pandas:</p><figure><img alt="" src="https://cdn-images-1.medium.com/max/718/1*fgQxh0lm8PKfnc2KfzCm-w.png" /></figure><p>Library Pandas sangat membantu dalam membaca, mengelola, dan menganalisis data dengan lebih mudah.</p><p><strong>2. Preprocessing Data</strong></p><p>Setelah data berhasil dikumpulkan, langkah berikutnya adalah preprocessing atau pembersihan data.</p><p>Pada kenyataannya, data mentah sering kali memiliki banyak masalah, seperti:</p><ul><li>Data kosong (missing value)</li><li>Data duplikat</li><li>Format tidak konsisten</li><li>Outlier atau nilai yang terlalu ekstrem</li></ul><p>Jika data kotor langsung digunakan, maka model Machine Learning akan menghasilkan prediksi yang kurang akurat.</p><p>Beberapa proses preprocessing yang umum dilakukan antara lain:</p><h4>a. Menghapus Data Kosong</h4><p>data = data.dropna()</p><h4>b. Menghapus Data Duplikat</h4><p>data = data.drop_duplicates()</p><h4>c. Normalisasi Data</h4><p>Normalisasi dilakukan agar nilai data berada pada rentang yang seimbang.</p><p>Contohnya:</p><ul><li>Harga rumah: jutaan rupiah</li><li>Jumlah kamar: hanya angka kecil</li></ul><p>Jika tidak dinormalisasi, model bisa lebih fokus pada data dengan nilai besar.</p><p><strong>3. Exploratory Data Analysis (EDA)</strong></p><p>Sebelum membangun model, seorang data scientist biasanya melakukan Exploratory Data Analysis atau EDA.</p><p>Tujuan EDA adalah memahami pola data melalui statistik dan visualisasi.</p><p>Tools yang sering digunakan:</p><ul><li>Pandas</li><li>Matplotlib</li><li>Seaborn</li></ul><p>Contoh visualisasi sederhana:</p><figure><img alt="" src="https://cdn-images-1.medium.com/max/716/1*iqrXdPeqWwODJkaSHAy2Qw.png" /></figure><p>Melalui EDA, kita bisa mengetahui:</p><ul><li>Distribusi data</li><li>Hubungan antar variabel</li><li>Pola tertentu</li><li>Data yang tidak normal</li></ul><p>Tahap ini sangat penting karena membantu menentukan strategi model yang tepat.</p><p><strong>4. Membagi Data Training dan Testing</strong></p><p>Setelah data siap, langkah berikutnya adalah membagi data menjadi:</p><ul><li>Training data</li><li>Testing data</li></ul><p>Training data digunakan untuk melatih model.</p><p>Testing data digunakan untuk menguji performa model.</p><p>Biasanya pembagian dilakukan dengan rasio:</p><ul><li>80% training</li><li>20% testing</li></ul><p>Contoh menggunakan scikit-learn:</p><figure><img alt="" src="https://cdn-images-1.medium.com/max/717/1*KLN8rDBM0SajQD6U7CvGbg.png" /></figure><p>Library scikit-learn merupakan salah satu library Machine Learning paling populer karena mudah digunakan oleh pemula.</p><p><strong>5. Pemilihan Algoritma Machine Learning</strong></p><p>Tahap berikutnya adalah memilih algoritma Machine Learning yang sesuai. Pemilihan algoritma tergantung pada jenis masalah yang ingin diselesaikan.</p><h4>a. Regression</h4><p>Digunakan untuk memprediksi angka.</p><p>Contoh:</p><ul><li>Prediksi harga rumah</li><li>Prediksi penjualan</li></ul><p>Algoritma populer:</p><ul><li>Linear Regression</li><li>Decision Tree Regressor</li></ul><h4>b. Classification</h4><p>Digunakan untuk menentukan kategori.</p><p>Contoh:</p><ul><li>Spam atau bukan spam</li><li>Lulus atau tidak lulus</li></ul><p>Algoritma populer:</p><ul><li>Logistic Regression</li><li>Random Forest</li><li>Support Vector Machine</li></ul><h4>c. Clustering</h4><p>Digunakan untuk mengelompokkan data.</p><p>Contoh:</p><ul><li>Segmentasi pelanggan</li><li>Pengelompokan produk</li></ul><p>Algoritma populer:</p><ul><li>K-Means</li><li>DBSCAN</li></ul><p>Contoh membuat model sederhana:</p><figure><img alt="" src="https://cdn-images-1.medium.com/max/721/1*Lm_ilvuPFoag9pcb_RhsZw.png" /></figure><p>Pada tahap ini, model mulai belajar dari data yang diberikan.</p><p><strong>6. Evaluasi Model</strong></p><p>Setelah model selesai dilatih, langkah selanjutnya adalah mengevaluasi performanya. Tujuannya adalah mengetahui apakah model bekerja dengan baik atau tidak.</p><p>Beberapa metrik evaluasi yang umum digunakan:</p><p>Untuk Regression</p><ul><li>MAE (Mean Absolute Error)</li><li>MSE (Mean Squared Error)</li><li>R² Score</li></ul><p>Untuk Classification</p><ul><li>Accuracy</li><li>Precision</li><li>Recall</li><li>F1 Score</li></ul><p>Contoh evaluasi model:</p><figure><img alt="" src="https://cdn-images-1.medium.com/max/724/1*BWwfeI-EJNpif64e7u_6DQ.png" /></figure><p>Jika hasil evaluasi masih kurang baik, maka biasanya dilakukan:</p><ul><li>Perbaikan preprocessing</li><li>Penambahan data</li><li>Mengganti algoritma</li><li>Hyperparameter tuning</li></ul><p>Proses ini sering disebut sebagai iterasi karena dilakukan berulang hingga mendapatkan hasil terbaik.</p><p><strong>7. Hyperparameter Tuning</strong></p><p>Hyperparameter tuning adalah proses mencari konfigurasi terbaik agar model bekerja lebih optimal.</p><p>Misalnya:</p><ul><li>Jumlah pohon pada Random Forest</li><li>Nilai K pada K-Nearest Neighbor</li></ul><p>Scikit-learn menyediakan tools seperti:</p><ul><li>GridSearchCV</li><li>RandomizedSearchCV</li></ul><p>Contoh:</p><p>from sklearn.model_selection import GridSearchCV</p><p>Tahap ini penting untuk meningkatkan akurasi model.</p><p><strong>8. Deployment Model</strong></p><p>Setelah model memiliki performa yang baik, model dapat di-deploy agar bisa digunakan oleh pengguna. Deployment berarti model ditempatkan ke aplikasi atau server sehingga dapat digunakan secara nyata.</p><p>Contohnya:</p><ul><li>Sistem rekomendasi e-commerce</li><li>Prediksi cuaca</li><li>Chatbot AI</li><li>Sistem deteksi penipuan</li></ul><p>Beberapa tools deployment yang populer:</p><ul><li>Flask</li><li>FastAPI</li><li>Streamlit</li><li>Docker</li><li>Cloud Platform (AWS, Google Cloud, Azure)</li></ul><p>Contoh sederhana menggunakan Flask:</p><figure><img alt="" src="https://cdn-images-1.medium.com/max/720/1*8w-Y8qddO80VEycD_D3dVw.png" /></figure><p>Melalui deployment, model Machine Learning dapat digunakan oleh banyak pengguna secara online.</p><p><strong>9. Monitoring dan Maintenance</strong></p><p>Banyak orang mengira pekerjaan selesai setelah deployment. Padahal, model Machine Learning tetap perlu dipantau.</p><p>Hal ini karena data di dunia nyata terus berubah.</p><p>Contohnya:</p><ul><li>Tren belanja berubah</li><li>Perilaku pengguna berubah</li><li>Kondisi ekonomi berubah</li></ul><p>Jika model tidak diperbarui, performanya bisa menurun. Karena itu, monitoring dan retraining model menjadi bagian penting dalam workflow Machine Learning.</p><h3>Tools Populer dalam Machine Learning</h3><p>Berikut beberapa tools yang paling sering digunakan dalam workflow Machine Learning:</p><figure><img alt="" src="https://cdn-images-1.medium.com/max/659/1*jfJ-CZmdhK6cpQMYI5dJYw.png" /></figure><p>Python menjadi pilihan utama karena syntax-nya sederhana dan memiliki komunitas yang sangat besar.</p><h3>Kesimpulan</h3><p>Machine Learning bukan hanya tentang membuat model canggih, tetapi juga tentang memahami alur kerja secara menyeluruh. Mulai dari pengumpulan data, preprocessing, eksplorasi data, pemilihan algoritma, evaluasi, hingga deployment, semuanya memiliki peran penting dalam menghasilkan model yang berkualitas.</p><p>Bagi pemula, memahami workflow Machine Learning langkah demi langkah jauh lebih penting daripada langsung mempelajari algoritma yang rumit. Dengan bantuan tools seperti Python, Pandas, dan scikit-learn, proses pembelajaran menjadi lebih mudah dan terstruktur.</p><p>Seiring berkembangnya teknologi, kemampuan Machine Learning akan semakin dibutuhkan di berbagai industri. Oleh karena itu, mempelajari dasar-dasar workflow ML sejak sekarang dapat menjadi investasi keterampilan yang sangat berharga di masa depan.</p><h3>Sumber Referensi</h3><ol><li>Géron, Aurélien. <em>Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow</em>. O’Reilly Media.</li><li>Documentation scikit-learn: <a href="https://scikit-learn.org/">https://scikit-learn.org/</a></li><li>Documentation Pandas: <a href="https://pandas.pydata.org/">https://pandas.pydata.org/</a></li><li>IBM Machine Learning Overview: <a href="https://www.ibm.com/topics/machine-learning">https://www.ibm.com/topics/machine-learning</a></li></ol><img src="https://medium.com/_/stat?event=post.clientViewed&referrerSource=full_rss&postId=30233b3bf4df" width="1" height="1" alt="">]]></content:encoded>
        </item>
        <item>
            <title><![CDATA[Mengubah Data Menjadi Insight: Pengenalan Data Science di Era Digital]]></title>
            <link>https://medium.com/@dikasintia28/mengubah-data-menjadi-insight-pengenalan-data-science-di-era-digital-52619b22a0bb?source=rss-6b853755a55f------2</link>
            <guid isPermaLink="false">https://medium.com/p/52619b22a0bb</guid>
            <dc:creator><![CDATA[Dikasintia]]></dc:creator>
            <pubDate>Fri, 06 Mar 2026 15:48:44 GMT</pubDate>
            <atom:updated>2026-03-06T15:48:44.020Z</atom:updated>
            <content:encoded><![CDATA[<figure><img alt="" src="https://cdn-images-1.medium.com/max/1024/1*YFXNEJRqkwTiUGIhghfkeA.jpeg" /></figure><p>Setiap hari kita menghasilkan data tanpa disadari. Saat membuka media sosial, menonton video, berbelanja online, atau bahkan melakukan transaksi digital, semua aktivitas tersebut menghasilkan data dalam jumlah besar.</p><p>Namun data tersebut tidak hanya disimpan. Data dianalisis untuk menemukan pola, memahami perilaku pengguna, dan membantu organisasi membuat keputusan yang lebih tepat.</p><p>Inilah yang menjadi dasar dari <strong>Data Science</strong>, sebuah bidang yang menggabungkan statistik, pemrograman, dan analisis data untuk menghasilkan wawasan yang bernilai.</p><p>Banyak perusahaan teknologi besar seperti <strong>Google</strong>, <strong>Netflix</strong>, dan <strong>Amazon</strong> memanfaatkan Data Science untuk memahami perilaku pengguna dan meningkatkan layanan mereka.</p><h4>Apa itu Data Science?</h4><p>Data Science adalah bidang ilmu yang berfokus pada proses mengumpulkan, mengolah, dan menganalisis data untuk menghasilkan informasi yang dapat digunakan dalam pengambilan keputusan.</p><p>Dalam praktiknya, Data Science memanfaatkan berbagai teknik seperti analisis statistik, pemrograman, dan <strong>Machine Learning</strong> untuk mengubah data mentah menjadi insight yang bermanfaat.</p><p>Contohnya, dari ribuan data transaksi penjualan, perusahaan dapat mengetahui:</p><ul><li>produk apa yang paling laris</li><li>waktu pembelian pelanggan</li><li>pola perilaku konsumen</li></ul><p>Informasi ini sangat penting untuk menentukan strategi bisnis yang lebih efektif.</p><h4>Mengapa Data Science Penting?</h4><p>Di era digital saat ini, jumlah data yang dihasilkan setiap hari sangat besar. Tanpa analisis yang tepat, data tersebut tidak memiliki nilai yang berarti.</p><p>Data Science membantu organisasi dalam beberapa hal penting:</p><h3>1. Pengambilan Keputusan Berbasis Data</h3><p>Perusahaan dapat membuat keputusan berdasarkan fakta dan analisis data, bukan hanya berdasarkan intuisi.</p><h3>2. Memprediksi Tren</h3><p>Dengan menggunakan teknik seperti <strong>Artificial Intelligence</strong>, Data Science dapat digunakan untuk memprediksi perilaku pelanggan dan tren pasar.</p><h3>3. Personalisasi Layanan</h3><p>Platform seperti <strong>Spotify</strong> atau <strong>YouTube</strong> menggunakan Data Science untuk memberikan rekomendasi konten yang sesuai dengan minat pengguna.</p><figure><img alt="" src="https://cdn-images-1.medium.com/max/1024/1*Oi3dxx84mmVIRjeGOCGCaA.jpeg" /></figure><h4>Komponen Utama Data Science</h4><p>Data Science merupakan kombinasi dari beberapa bidang ilmu utama.</p><h3>Statistik</h3><p>Statistik digunakan untuk memahami pola dalam data dan menarik kesimpulan yang valid.</p><h3>Programming</h3><p>Bahasa pemrograman seperti <strong>Python</strong> dan <strong>R</strong> sering digunakan untuk mengolah dan menganalisis data.</p><h3>Data Visualization</h3><p>Hasil analisis data biasanya disajikan dalam bentuk grafik atau dashboard agar lebih mudah dipahami menggunakan tools seperti <strong>Tableau</strong> atau <strong>Microsoft Power BI</strong>.</p><figure><img alt="" src="https://cdn-images-1.medium.com/max/1024/1*y-p0D_c8ATvQ-OoExJxg9A.jpeg" /></figure><h4>Tantangan Data Science</h4><p>Walaupun memiliki banyak manfaat, Data Science juga menghadapi beberapa tantangan, seperti:</p><ul><li>kualitas data yang tidak selalu baik</li><li>volume data yang sangat besar</li><li>masalah privasi dan keamanan data</li><li>kebutuhan tenaga ahli yang masih terbatas</li></ul><p>Karena itu, pengelolaan data yang baik menjadi sangat penting dalam proses analisis data.</p><h3>KESIMPULAN</h3><p>Data Science merupakan bidang yang sangat penting di era digital karena mampu mengubah data mentah menjadi informasi yang bernilai. Dengan memanfaatkan statistik, pemrograman, dan teknologi seperti Machine Learning, Data Science membantu organisasi memahami data serta membuat keputusan yang lebih tepat.</p><p>Seiring dengan meningkatnya jumlah data di dunia, peran Data Science diperkirakan akan semakin besar di masa depan dan menjadi salah satu bidang yang paling berpengaruh dalam perkembangan teknologi dan bisnis.</p><img src="https://medium.com/_/stat?event=post.clientViewed&referrerSource=full_rss&postId=52619b22a0bb" width="1" height="1" alt="">]]></content:encoded>
        </item>
    </channel>
</rss>