Azərbaycanlı rep artistlərin lüğət analizi

5 min readMar 9, 2024

“Dəyişdikcə ali-məkan yoxsul və də xaliq”
Bir neçə il əvvəl, xroniki onlayn olduğum vaxtlar, data elmləri ilə yenicə maraqlanmağa başlarkən qabağıma Matt Daniels-in bu məqaləsi çıxdı (şiddətlə tövsiyə olunur). Azərbaycan repinə marağım çox olmasa da, Amerikan repini çox sevdiyim üçün, bu məqalə mənə xeyli informativ gəlmişdi. Elə o vaxtlar mənə heç vaxt lazım olmayacaq proyektlər üstündə işləməkdənsə, özümə, community-ə maraqlı ola biləcək “fun” birşeylər üstündə işləmək qərarına gəlmişdim. Qərara gəlmək işin 50 faizi olsa da, 100 faizi deyildi və ilk dəfə bu proyekti yadımda saxlayıb üzərindən başqa ideyalara keçmişdim. Üstündən bir il keçdikdən sonra, təsadüfən, “Az-Rap”-in ustad dediyi A4-ün 101MoonAve-də Metafora “stream”-lərinə baxanda, A4 bu məqaləni göstərib kiminsə bu məqalənin Azərbaycan reperləri üçün olan versiyasını çıxarmağı istəmişdi. Ulduzlar üst-üstə çox yaxşı oturmuşdu və bu istək mənim də istəyim ilə üst-üstə düşürdü. Çətin ki, məndən başqa kimsə bu qədər “niche” ideyanı reallaşdırmağa cəhd göstərərdi. Ondan sonra, mən ilk dəfə bu mini proyekti reallaşdırmağa çalışdım. O vaxtlar çox proyektlər kimi bu proyekt də, ikinci dəfə yarıda qalmışdı. Artıq üstündən bir müddət keçib, hərkəs və hərşey dəyişib, yüzlərlə yeni track çıxıb, bir-ikisi “Genius”-a əlavə edilib və bu məqalə artıq onlayndırsa deməli bu mini proyekti də mən bitirə bilmişəm.

“Necə oldu ki, bu qədər kirlə insan irqi ali”
Bu mini proyektin əsas məqsədi, hər artistin dediyi sözləri götürüb digər artistlərin dediyi sözlərlə müqayisə edib, hər artistin nə qədər özünəməxsus söz dediyini tapmaq, beləcə hər artistin söz bazasını araşdırmaq idi. Sözləri tapmaq üçün orijinal məqalədə Matt Daniels “Genius”-dan istifadə etmişdi. Bir neçə mənbə gəzdikdən sonra əsas datanı “Genius”-dan götürməyin ən məntiqli yol olduğunu mən də qəbullandım. “Python”-da John W. Millerin “Genius API”-la işləmək üçün yaratdığı çox rahat “lyricsgenius” modulunu istifadə edib “lyrics”-ləri əldə edib, elə “Python”-da da teksti formatladım. “Genius” xaricdə, hətta bizdə də artıq ən çox istifadə olunan “lyrics” platforması olmasına baxmayaraq köhnə və böyük nəslin sözlərinin çoxu orada mövcud deyildi. Sözlərin yarısını “Genius”-dan götürdükdən sonra yeganə çıxış yolu başqa platformalarda artistləri bir-bir gəzmək oldu. Onları da etdikdən sonra hələ də yetəri data olmadığı üçün manual olaraq bir neçə artistin tracklərini “Youtube”-da kommentlərdən tapıb istifadə elədim. Digər hissəsini də özüm sözlərini dinləyib yazdım. Bu demək olar əziyyətin çox hissəsini təşkil elədi. Çünki, hər “track”-i özüm bir-bir “transcribe” etməli oldum. (btw, bütün özüm yazdığım, tapdığım sözlərin, albomların çoxunu “Genius”-a əlavə eləmişəm, enjoy)

Digər problemlərdən biri də, artistlərin söz sayının fərqli olması idi. Matt Daniels-in məqaləsində hərkəsin fiks 35,000 sözünün analiz edildiyinə görə statistikada 35,000 sözə nə qədər özünəməxsus söz düşdüyü göstərilmişdi. Mənim statistikam üçün bu uyğun olmayacaqdı. Yığdığım datada ən az sözü olanın ~1000, ən çox sözü olanın ~7000 sözü var idi. Fiks ortalama bir ədəd götürmək də ekstrim hallar üçün doğru nəticə verməyəcəkdi və statistikadan onları çıxarmaq məcburiyyətində qalacaqdım. Onsuz siyahıdan yetəri qədər sözü olmayan bir neçə nəfəri çıxarmışdım (məs. F-Souljah, Hüseyn Dərya və s.) və 40 nəfərlik bir statistikadan daha da adam çıxarmaq istəmədiyim üçün digər bir yol tapdım. Hər artist üçün dediyi özünəməxsus sözlərin faiz nisbətini hesabladım, beləcə hər artist üçün söz sayı fərqli olsa da dediyi sözlərin nə qədər özünəməxsus olmasını nisbətən daha dürüst ayırd edə biləcəkdim. Bütün bunları etdikdən sonra isə geriyə bu sözləri biraz daha işlənəbiləcək hala salmaq, təmizləmək və analizini etmək qaldı. Bunun üçün də bir neçə python skripti yazdıqdan sonra sonda belə bir statistika əldə etdim:

#10 “Bizimlə bir sırada durmaq özü böyük bir ixtiyardıya”
“Underground”-dan hər kəs tərəfindən sevilən unikal reperə çevrilən Uran-a digər reperlər qədər qulaq asmasam da, dinlədiyim “verse”-lərin çoxunda sözlərdənsə “storytelling”-in çox önəmli bir rol daşıdığını görmək olar. Sözlərindən çox da böyük data yığa bilmədiyimə baxmayaraq, çox vaxt sadə sözlərlə mürəkkəb mövzulara toxunan Uranı ilk 10-luqda görmək mənə xoş oldu. Belə baxanda elə ilk 10-luqda gözlədiyim bir neçə nəfərdən biri də elə Uran idi.
#3 “Mənə lazım deyil qafiyə əvəzinə rhyme demək, əsas daim demək!”
Biraz dediyi söz siyahısına baxandan sonra belə qərara gəldim ki, Payam Türklə onun sözlərindən istifadə edib keçmiş türk və azərbaycan tarixi kitabını yenidən düzəltmək olar (bu proyekt də qalsın gələn dəfələrə).
#2 “Bəs eləməz 4 albom zəlil dilimə səpdi yara”
Əslində niyəsə uşaqlıqdan hamımız Xperti gözümüzdə böyütdüyümüzə görə(haqlı yerə), mən də daxil soruşduğum bir neçə nəfər də Xpert-i birinci yerdə gözləyirdi. Elə, ikinci yerdə olması da həqiqətən bu gözləntini əsaslandırmağa və onun o səviyyədə bir reper olmasına sübutdu.
#1 “Rakim kimi çözmüşəm mətnlərin formulunu”
Frhyme-ı ikinci, üçüncü yerdə gözləsəm də, necəsə o ~40 artistin içində birinci yerdə olmağı bacardı. Düzdü, Okaber və Xpertdən faiz baxımından çox irəlidə olmasa da, onlardan bəlkə də 2 dəfə daha az karyerası olduğuna baxmayaraq birinci yerdə olması ona çox böyük üstünlük verir. Qafiyə baxımından da onun çox güclü olduğunu qəbullansaq, daha az subyektiv olaraq onun söz baxımından ən yaxşı reper olduğunu deyə bilərik.

“Aşıram həddimi, bilinmir danışdığım nə dili”
Statistikaları müqayisə etdikdə “yerli” nəticənin bəzi yerlərdə daha yaxşı olması məni təəccübləndirdi. Ingilis dilində 171,476 söz hal-hazırda aktiv istifadə olunsa da, danışıqda orta statistik maksimum 6000 söz danışılır. Bizdə isə bu göstərici daha da aşağıdı(80,000–100,000). Normal danışıqda istifadə olunan sözlərin sayı isə lüğətdəki söz sayından bir neçə dəfə azdı. Buna baxmayaraq, xarici reperlər üçün maksimum özünəməxsus söz faizi ~20-lərdə, bizdə isə 32 faizdi. Digər bir maraqlı faktor da, reperləri yaş qrupuna görə böldükdə ortaya çıxır. Amerikan repində daha yeni reperlərin söz ağırlığı faiz baxımından daha aşağıdı (Hər iki mədəniyyətdə bəzi trenddə olan, terminlər, slenq sözlər çox işləndiyinə görə onu hesaba qatmıram). Statistikaya baxanda isə, Azərbaycanda inkişaf 2000-lərdən çox primitiv başladığına görə biraz orta nəsilə çatanda bu inkişafın daha çox getdiyini və repin, sözlərin daha mürəkkəbləşdiyini, yeni nəsilin isə haradasa amerikan repi ilə təxmini eyniləşdiyini demək olar.

“Hər gün fərqli, mənə gəlir təkrar”
Əlimdə hazır söz bazası olduqdan sonra, onlarla başqa nə edə biləcəyimi düşünərkən ağlıma ən çox hansı sözlərin işləndiyinə baxmaq gəldi. Bəzi çox işlənən sözlərin sırasını da aşağıdakı siyahıda göstərmişəm:

1. bir — 5625
10. var — 2229
27. gün — 1125
45. həyat — 636
47. gecə — 628
69. yol — 497
79. söz — 448
88. sevgi — 400
96. pul — 371

“Və bir də bir gün olmam əlbət, məni al dillərdən”
Son olaraq birşeyin altından xətt çəkmək istəyirəm ki, bu sadəcə maraqlı statistikadı və heç vaxt sadəcə bir kriteriyaya görə artistin nə qədər yaxşı artist olduğunu demək mümkün deyil. Lakin, eyni zamanda bir artist bir neçə başqa kriteriyada da üstündürsə, bu reperin obyektiv olaraq “daha yaxşı reper” olduğunu deməyə haradasa əsas verir və bəlkə də yeganə ölçü metodudu. Sırf subyektiv fikrimə görə, bir artist üçün çox söz bilmək bir hədəf olmamalıdı. Musiqi(beatlər, sempl seçimi, production), ideya/konsept, flow və rhyme daha intellektual sözlərlə, incə bənzətmələr və açıqlamalar ilə, daha az işlənən, şablon olmayan ifadələrlə birləşdikdə ancaq ortaya keyfiyyətli iş çıxır və bu keyfiyyətli işlərin cəmi bir artisti daha yaxşı artist edir.

Data və kodlar üçün “Github” linki

Azərbaycanlı rep artistlərin lüğət analizi

Written by tabibyte