Keyfiyyətli data niyə lazımdır? Datanın keyfiyyəti necə ölçülür?

Turkan Shukurova
ABB Data Portal
Published in
4 min readApr 9, 2024

Datanın emalı biznes əməliyyatları ilə mürəkkəb şəkildə əlaqələndirildiyi və data analitikada qərarların qəbuluna təkan verdiyi üçün məlumatların keyfiyyətinin əhəmiyyəti artmışdır.

Səhv məlumat şirkətlər üçün əhəmiyyətli dərəcədə əlavə iş yükü yaradır. Keyfiyyətsiz data, əməliyyat səhvlərinə, qeyri-dəqiq analitikaya və yanlış idarə olunan biznes strategiyalarına səbəb ola bilər. Gartner konsaltinq şirkəti 2021-ci ildə məlumat keyfiyyətinin aşağı olmasının təşkilatlara ildə orta hesabla 12,9 milyon dollara başa gəldiyini bildirib.

Bu günün ən böyük və ən uğurlu təşkilatları yüksək təsirli biznes qərarları qəbul edərkən məlumatlardan öz üstünlükləri üçün faydalanırlar və data əsaslı qərarlar qəbul edirlər.

Data əsaslı qərar qəbuletmə qərar qəbul etməzdən öncə uygun təhlillərin aparılması və qərarın bu təhlillərə uyğun olaraq qəbul edilməsidir.

Biznesdə bu, bir çox formalarda ola bilər. Məsələn:

• Müştərilərinin bəyəndiyi məhsul və xidmətləri müəyyən etmək üçün şirkət sorğu keçirir.

• Müştərilərin öz məhsul və ya xidmətlərindən necə istifadə etməyə meylli olduqlarını müşahidə edərək yeni məhsul buraxılışından əvvəl həll edilməli olan potensial problemləri müəyyən etmək üçün istifadəçi testi tətbiq edir.

• Hər hansı məhsulu istifadə edən müştəri məlumatlarını təhlil etməklə artıq bu məhsulu kimə təklif edəcəyini müəyyənləşdirir.

Datanın qərarvermə prosesinə daxil edilməsi şirkətin biznes hədəflərindən tutmuş datanın keyfiyyətinə kimi bir neçə amildən asılıdır. Data əsaslı qərarvermədə mütləq keyfiyyətli datadan istifadə olunmalıdır.

Bəsr datamızın keyfiyyətini necə ölçək?

Datanın keyfiyyəti onun data istehlakçısının gözlənti və ehtiyaclarını nə dərəcədə qarşılaması ilə ölçülür. Datanın keyfiyyətinin ölçülməsi üçün müxtəlif mənbələrdə 13-ə qədər meyar təqdim olunur. Lakin bunlardan ən çox istifadə olunanı 6 meyardır. Biz də bu gün onlarla tanış olacağıq. Daha öncədən qeyd edim ki, biz hər hansı bir datanın dəqiqliyini ölçərkən bu 6 meyarın hamısını eyni anda tətbiq etməyə bilərik. Bir və ya bir neçə meyar üzrə ölçü aparmağımız da mümkündür. Bu, keyfiyyətini ölçdüyümüz datanın xüsusiyyətlərindən asılıdır.

1. Tamlıq

Tələb olunan datanın mövcudluğunu ölçür. Tamlıq cədvəl və ya sütun səviyyəsində ölçülə bilər. Məsələn, bizim bir müştəri məlumatları cədvəlimiz var və burada müştərinin ad, soyad, ata adı, doğum tarixi kimi şəxsi məlumatları saxlanılır. Gəlin, biz müştərilərin ad, soyad, ata adının tamlığını ölçək. Əgər bizim üçün ata adı o qədər də vacib məlumat deyilsə, ad, soyad və ata adı birləşməsinin tamlığını birgə ölçə bilərik. Yəni, ata adı olmasa da, adı tamlıq meyarına görə tam qəbul edə bilərik. Amma bizim üçün ata adı da vacib məlumatdırsa, o, olmadığı halda artıq bizim datanın tamlığı pozulur.

2. Etibarlılıq: Bu meyara əsasən, məlumatın formata uyğunluğu yoxlanır. Məsələn, mobil nömrə sütununda təqdim olunan məlumat, yəni, mobil nömrələr mobil nömrə formatına uyğundurmu?

Məsələn, cədvəldə gördüyümüz nümunəyə nəzər salsaq, görərik ki, etibarlılıq meyarı “0” o halda olur ki, ya operator kodu düzgün qeyd olunmayıb və ya nömrə standartdan daha uzundur.

3. Dəqiqlik. Dəqiqlik meyarı keyfiyyətini ölçdüyümüz datanın mənbəyindən dəqiqləşdirilməsini tələb edir. Deyək ki, biz müştərimizin şəxsiyyət vəsiqəsinin FİN məlumatlarının keyfiyyətini ölçürük. Bunu təsdiq olunmuş dövlət mənbəyindən təsdiqləyə biliriksə, onda məlumatımızın nə dərəcədə dəqiq olmağını ölçə bilərik.

Burada soldakı cədvəl bizim oz daxili sistemlərimizdə olan müxtəlif zamanda toplanılmış müştəri datası, sağdakı cədvəldəki isə təsdiq olunmuş dövlət mənbəyindən tədqim olunmuş cədvəldir. Müqayisə nəticəsində bizim cədvəlimizin iki sətrindəki müştəri məlumatlarının səhv olduğunu görürük ki, bunların da dəqiqliyi sıfra bərabərdir.

4. Üst-üstə düşmə: Tutaq ki, bizim İnsan resursları departamenti

və Mühasibatlıq departamenti əməkdaşların məlumatlarını ayrı-ayrı cədvəllərə yazır. İnsan resursları tərəfindən yazılan cədvəldə XXX nömrəli əməkdaşın iki ay əvvəl işdən ayrıldığı göstərilsə də, Mühasibatlıq departamentinin cədvəlində bu əməkdaşa hər ay məlumat köçürüldüyü göstərilir. Burada XXX nömrəli əməkdaşın datası eyni şirkət daxilində iki cədvəldə üst-üstə düşmür və bu meyar üzrə keyfiyyət 0 olur.

5. Unikallıq

Bu meyar muəyyən bir data şəbəkəsində bir məlumatın bir dəfə yazılmasını yoxlayır. Məsələn, bilirik ki, şəxsiyyət vəsiqəsinin PİN nömrəsi hər bir vətəndaş üçün vahiddir. Yəni, hər bir PİN bir vətəndaşı müəyyən edir. Bu, ikinci bir vətəndaşı müəyyən edə bilməz. Bu səbəbdən bizim müştəri məlumatları cədvəlimizdə iki dəfə yazılan PİN artıq düzgün deyil və unikallıq meyarını pozaraq 0 olur.

6. Vaxtlı-vaxtındalıq

Bu meyar lazım olan datanın vaxtında əlçatan olmasını tələb edir. Məsələn, bir çatdırılma şirkətinə daxil olan sifariş saniyələr içərisində proqrama daxil edilməlidir. Bu sifarişin bir saat gecikdirilərək sistemə daxil edilməsi vaxtlılıq meyarını pozur.

--

--