Zoltán Baráti
Like / Share
Published in
9 min readDec 11, 2018

--

Baráti Zoltán — Tóth Martin:
A magyar filmes közízlés leképeződése az nCore p2p-oldal alapján

Dolgozatunk célja egy önállóan konstruált adatbázis bemutatása, illetve annak módszertani előzményeinek magyarázata. Témánk a hazai torrentezők körében legnépszerűbb oldal, az nCore filmes filmes felhasználói fogyasztásának összefésülése az egyes termékek internetes moziadatbázisban található specifikus jellemzőivel.

A torrentezés definiálása és az nCore, mint közösség hazai szerepe

Ahhoz, hogy kontextusba helyezzük a továbbiakban taglaltakat, elengedhetetlen annak definiálása, hogy mit is értünk azon fogyasztási metódus alatt, hogy torrentezés.

Ez a kifejezés tulajdonképpen a peer-to-peer, azaz kliensek egymások közt darabonkénti fájlmegosztását értjük, melynek nagy vonzereje és több, mint tíz éves használatban létének magyarázata nagyrészt az, hogy kiválóan alkalmas nagyobb fájlokhoz való viszonylag gyors hozzájutásra, ugyanis a feldarabolt meta-fájlokat egyszerre több csomópontról, lényegében egymás töredékeinek kipótolásával teszik elérhetővé egymás számára.¹

Pár lényeges szakkifejezés definiálása a torrent fogyasztással kapcsolatban elengedhetetlen ahhoz, hogy a továbbiakban érthetővé tegyük azt a logikát, mely alapján a létrehozott adatbázis elnyerte végleges formáját.

Egy torrent, azaz az adott meta-fájl letöltésében két igazán fontos résztvevő összműködése szükséges: peernek nevezzük azokat a résztvevőket, akik az egész fájl egyes töredékeit birtokolják, más és más számítógépeken. Ahhoz, hogy ezek a peerek az egész fájlhoz hozzájussanak végül, szükségesek a seedek, akik már rendelkeznek a teljes letöltött adatmennyiséggel, és ennek visszatöltését végzik, ezzel gyorsítva az egyes peerek hozzáférését. A seedet és a peert együttesen nevezzük a fájl megosztóinak, vagyis a swarmnak.²

A torrent oldalak maguk a trackerek, ahonnan ezekhez a kiterjesztésű fájlokat letölthető formában megszerezzük, lényegében gyűjtőhely és felügyeleti funkciót látnak el. Mi azonban jóval nagyobb lehetőséget láttunk meg benne, egy olyan adatbázisét, melyből a megfelelő hozzájutás után igen releváns következtetéseket sikerülne levonnunk a hazai kultúrafogyasztási szokások egyes szegmenseiről.

Torrent trackerből viszont kifejezetten sok létezik, nem csak nemzetközi, de hazai viszonylatban is, legismertebbek, legrégebbiek, és legnagyobbak mint a The Pirate Bay ugyan teljes egészében ingyenes felületként működnek, bárki számára internacionálisan elérhetőek a szervereik bizonyos formákban, viszont sokkal kevésbé ragadhatók meg az ottani letöltési szokások és azoknak alakulásai, mint egy zártabb, szabályozottabban működő, viszont legalább annyira jól strukturált hazai tracker esetén.

Választásunk így esett az nCore közösségre, amely a korábban Endless és Skyline néven működő trackerek egyesüléséből jött létre 2006 nyarán. Ez az oldal komoly szabályzattal rendelkezik a felhasználás tekintetében, a bekerülés is csupán az úgynevezett meghívós módszerrel lehetséges, avagy kizárólag a már tagként funkcionáló felhasználók képesek további felhasználók beinvitálására a közösségbe havonta egyszer, továbbá a bekerülés után is szintén szigorú szabályok vonatkoznak a le- és feltöltési arányok megtartására az egyes felhasználóknál, a meghívó például mindvégig felelős marad meghívottjáért, az ő vissza nem töltött adataiért mindkét fél büntetésben és rangvesztésben részesül, ezzel szabályozva és megtartva a gyors és felhasználóbarát hozzáféréseket.

Az oldal résztvevői tehát különböző rangbesorolásokat érhetnek el, a legalacsonyabb felhasználói rang után következik a tag, őt követi az elite, majd a legend és végül a feltöltő státusz. Ezeket a rangokat minden hónap elején újraosztják az aktuális hó végi teljesítményük alapján, így kiszűrve az ellustultabb, kevésbé aktív felhasználókat. A különböző rangok közti eltérés nem csupán a közösség presztízs-kérdése, társulnak hozzájuk különböző, egyre bővülő lehetőségek is, ilyenek a más felhasználók aktivitásába való mélyebb belelátás, a kiterjesztett keresésnek, az új torrentek kérésének, a felhasználók egyéni keresésének, meghívóküldések mennyiségének, a reklámmentességnek, az anonimitásnak, fel- és letöltések számának és méretének növekedésének a lehetőségei.

Az nCore tehát kifejezetten szigorú és hierarchikus elvek alapján építi fel működését, ennek ellenére hazánk első számú trackerének tekinthető, melyeket a következő dinamikus adatokból való lekérdezés legitimálja: 739 993 felhasználó (ebből 331826 sima felhasználói rangú, 339 305 tag, 45 138 elite, 3 308 legend), 270 922, avagy az összfelhasználók 36.61%-a naponta látogató, 529 335, avagy az összfelhasználók 71.53%-a hetente látogató, 674 565, avagy az összfelhasználók 91.16%-a pedig havonta látogató az oldalon, az elérhető fájlok száma pedig 414 431, mely 841,7 TB elérhető fájlmennyiséget jelent. (A lekérdezés dátuma: 2017. 03. 12.)³

Módszertani előzmények ismertetése és a kutatási kérdés meghatározása

Az ismertetett tulajdonságok alapján elmondható, hogy az nCore az a hazai p2p oldal, amelyik a legrelevánsabban leképezi a hazai kultúrafogyasztási szokásokat, illetve legnagyobb részvétellel alakítja azt a torrentezés magyarországi miliőjében.

Kutatásunk ezen output kiválasztása után a következő lépésként fontos megjegyezni, hogy ahhoz, hogy az nCore-on szereplő tartalmakat miképp kategorizálja maga az oldal, és miként választottunk mi ebből egy (részben önállóan megalkotott) kategóriát.

Az oldalon a kategóriák a film, sorozat, zene, xxx, játék, program, könyv fő címkékkel vannak szortírozva, ezen címkéken belül további kategóriák jelennek meg az adott anyag minősége, és formátuma és nyelve alapján, a filmeknél (melyeket mi választottunk ezen kutatáshoz) például ezek az alkategóriák a SD/HU, SD/EN, DVDR/HU, DVDR/EN, DVD9/HU, DVD9/EN, HD/HU, HD/EN rövidítéssel rendelkeznek, melyeknél az SD, DVDR, DVD9 és a HD tagok a kép és hangminőséget jelölik növekvő sorrendben, ezáltal növekvő fájlmérettel, a HU és EN tagok pedig az anya- és idegen nyelvűséget rövidítik az egyes torrentek esetében. Ezek a szelekciók megosztottabbá teszik az önálló nagy kategóriát (ez esetben a filmet), így előfordulhat az is, hogy akár egy ugyanazon tartalom többször is fellelhető a fájlok között, csak éppen eltérő minőségben, vagy nyelven, ettől függetlenül az a tartalom kulturális szempontból megegyező. Fontos megjegyezni továbbá, hogy az nCore-on található kategóriák nem önkényesek, tehát nem csak erre az oldalra jellemzőek, mint sajátos megjelölések, hanem a torrentezési protokoll hagyományossá vált univerzális kategorizálása ez a fajta elkülönítése a fájloknak.⁴

Mindazok után, hogy egyértelműsítettük, hogy az nCore-on megtalálható fájlmennyiség valóban képes egy átfogó képet adni az kultúrafogyasztás alakulásairól jogosan vetődhet fel a kérdés, hogy akkor ahogyan a címben is említettük, miért csupán a filmek aspektusából vizsgáljuk meg ezúttal a problémát, miért nem kezdünk bele minden egyes kategóriának a lekérdezésébe?

Erre a speciális kategorikus szűkítésre két magyarázatunk van: egyrészt a kísérletünk célja a módszertani eljárások általános bemutatását célozza meg, így nincs szükség minden kategória egyenkénti megvizsgálására, másrészt, és legfőképpen az oka a filmekre való kihegyezettségnek az, hogy semmiképp sem a nagy mennyiségű adattal való öncélú rendelkezés volt a célunk, hanem összefüggések keresése szociológiai szemüvegen keresztül. A filmek pedig erre azért is a legalkalmasabbak, és a számunkra legérdekesebb kategória, mert kiválóan összevethető az nCore-os hazai fogyasztás milyensége az internetes moziadatbázis, azaz az IMDb nevű oldal adataival, ahol nem csupán a filmek címét, műfaji besorolását, hosszát, nemzetiségét, stábját, pénzügyi hátterét, de felhasználók által való összesített értékelését és különböző specifikus jellemzőik alapján alkotott úgynevezett tageket is elérhetjük.

Az IMDb-s adatok felhasználása a torrentes fogyasztás megítéléséhez nem egy új keletű probléma, Bodó Balázs és Lakatos Zoltán például 2011-ben különböző survey statisztikai módszerek alkalmazásával a lokális magyar filmes piac kulturális fogyasztását vetette össze az akkori torrentes, peer-to-peer feketepiaci fogyasztásokkal a mozibevételek, a film disztribúciója, a felhasználók internetes értékelései, és tágabb műfaji megjelölések figyelembevételével⁵.

A mi szándékunk viszont nem a hagyományos módszerek alkalmazása, illetve a piaci sikerek, a mozik szerepe, vagy egyéb filmiparági kontextusba helyezés, hanem egy online adatlekérésekkel végrehatott önálló adatbáziskészítés, és kifejezetten minél specifikusabb műfaji, jellegi besorolások alapján való kirajzolása annak, hogyan fogyasztanak a magyar torrentfelhasználók az internacionális filmadatbázisbeli jellegzetességek tükrében.

Kutatási kérdésünk lényegében tehát így fogalmazható meg:

Hogyan képeződik le a nCore felhasználók filmes preferenciája a legnépszerűbb letöltések és a nemzetközi értékelések, specifikus műfajtagek összevetésében?

Hogyan állapítjuk meg mik a legnépszerűbb letöltések az nCore-on? Az oldalon található tartalmak több szempont szerint és több mennyiségben sorba rendezhetők növekvő és csökkenő sorba is típus szerint, alfabetikusan, a feltöltés dátuma alapján a korábban definiált feltöltők (seedek) és a letöltők mennyisége alapján.

Ezek közül a seedek, tehát a feltöltők alapján való sorba rendezés az, ami a legalkalmasabb a népszerűség megállapítására, ugyanis ha kizárólag a letöltőket vizsgálnánk, akkor elmennénk amellett a hibaforrás mellett, hogy korántsem lehetünk biztosak abban, hogy akik épp letöltik az adott filmet, azok be is fejezik majd ezt a műveletet, míg a seedek, tehát a feltöltők mennyiségét kiválasztván biztosak lehetünk abban a torrentezés szabályszerűségei alapján, hogy akik már feltöltik az adott fájlt, azok már egyszer le is töltötték azt, így biztos fogyasztóknak minősülnek.

Az adatbázisok létrejöttének folyamata és jellemzőik

Manuálisan feljegyezni ennyi adatot — habár nem volna lehetetlen — rendkívül fáradtságos és időigényes munka volna, ezért a kézi megoldás helyett web scraper applikációkat használtunk az adatok begyűjtésére. A web scraperek (vagy web harvesterek, web data extractorok) olyan stand-alone, vagy böngészőbe beépített programok, amik különféle adatokat, adathalmazokat mentenek le weboldalakról, majd ezeket strukturáltan exportálják különböző formátumokban, mint .csv (Comma seperated values) vagy .json (JavaScript Object Notation). Az általunk használt 2 scraper alkalmazás ráadásul lehetőséget ad arra, hogy API-kat (Application Programming Interface) hozzunk létre, amik segítségével a lekéréseket automatizálni lehet, így bizonyos idő elteltével újra le tudja menteni az általunk kért adatokat.

Két scraper alkalmazás került felhasználásra az adatbázis létrejötte során: az nCore felületéről az Import.io nevű programmal mentettünk le adatokat, majd utána a Kimono névre hallgató, Google Chrome-ba pluginként beépíthető szolgáltatással hoztuk létre a második, és harmadik adatbázist.

Az első adatbázist — mint már említettük — az nCore filmes feltöltéseinek seed szerinti csökkenő sorrendű listájából építettük meg. Itt ezeket az adatokat mentettük le: formátum, film feltöltési címe, film magyar címe, IMDb értékelés, IMDb link, feltöltés dátuma, pillanatnyi seed, pillanatnyi leech. Az nCore minden, az nCore-on kívül eső oldalra történő hivatkozás esetén egy úgynevezett “dereferer” címet tesz a valós cím elé, azért, hogy a külső oldal ne tudjon arról, hogy egy torrentoldalról érkezett a kattintás. Ezt egy egyszerű replace függvénnyel ki lehetett szedni, majd az így kapott IMDb linkeket be lehetett tölteni a második scraper API-unkba.

Az 500 filmből 4-nek nem volt IMDb oldala. A maradék 496 hivatkozást betöltöttük egy másik scraper API-ba — ezúttal már Kimonoba — és itt lementettük egyrészt a műfaji megjelöléseket, illetve a cselekményhez tartozó kulcsszavakat. Az eredetileg 2 lépéses adatbázisból ezen a ponton lett 3, ugyanis az IMDb-n a cselekmény kulcsszavak (plot keywords) szekció csupán pár találatot mutat meg, az összes eléréséhez rá kell kattintani a “See All” hivatkozásra. Így a kulcsszavak helyett ezeket a hivatkozásokat kértük le a műfaji megjelöléseken felül, majd egy harmadik Kimono API-jal jutottunk hozzá a teljes kulcsszó listához.

Az adatok elemzése

Az nCore-ról lekért adatok alapján kirajzolódik pár érdekes motívum. Elsőkörben a formátumot vizsgálva vehetjük azt észre, hogy a legnépszerűbb 500 film 95,4%-a vagy magyar nyelvű, vagy legalábbis magyar szinkronos. A másik, ami kirajzolódik, hogy ezen 500 filmnek a 81,6%-a alacsony felbontású feltöltés, és csupán 18,2%-a magas felbontású (a maradék 0,2% az 1 darab DVD-R feltöltés. (Lásd: 1. tábla)

1. tábla

A következő pedig az IMDb értékelések vizsgálata volt. A legalacsonyabban értékelt film 3,4 pontot kapott, viszont legmagasabban értékelt filmből három is 8,8-es értékeléssel állt az oldalon az adatbázis készítése során. (Lásd: 2. tábla).

Pár statisztikai adat kiszámítása után viszonylag hamar be lehetett látni, hogy az átlagos nCore felhasználó nem feltétlenül az IMDb értékelések alapján választja ki a megnézendő filmet: az átlagos IMDb értékelése az 500 listában szereplő filmnek ~6,8, a leggyakrabban előforduló a 7,2, a középérték pedig a 6,8. Összehasonlításképp: az IMDb Top 250 listájának tetején lévő 1. és 2. film 9,2 csillagos értékeléssel rendelkezik, míg a utolsó 38 film (213–250) is 8,0-ás pontszámmal bír.

2. tábla

A feltöltések dátumát vizsgálva azt vehetjük észre, hogy minél régebbi feltöltésről van szó, annál inkább csökken a valószínűsége, hogy az 500-as listába kerül: 197 darab 2017-es feltöltés van, 175 2016-os, viszont 2015-ösből már csak 64. 34 darab 2014-es, 20 darab 2013-as, és mindösszesen 10 darab feltöltés 2012-ből.

A legárnyaltabb fogyasztási szokásokból kirajzolódó jellemzést a már korábban definiált bővített műfaji tagek összevetésében lehet feltárni. Ezek kirajzolásához adatvizualizációs szempontból a szófelhőt tartottuk legalkalmasabbnak, hiszen ebben jól elkülöníthetően, és elég szemléletesen megjelennek azok a tendenciák, melyek a vizsgált közösség kurrens legnépszerűbb filmes preferenciáira jellemzők.

Szófelhő

Élesen kirajzolódik az akciófilmek dominanciája, melynek magyarázata, hogy ezen kategória viszonylag jól összevonható egyéb szintén nagy népszerűségnek örvendő műfajokkal. Az akció és komédia, az akció és sci-fi, akár az akció és thriller átmenetek sem idegenek a filmes piacról. Meglepően alacsony az érdeklődés a családi, a romantikus, még inkább a sport és a zenés filmek iránt is, utóbbi kettőnél ezen jelenség ugyan magyarázható mennyiségi szempontból, azaz hogy jóval kevesebb ilyen műfaji besorolású film lát napvilágot manapság (és mint a második tábla alapján rámutattunk, az újdonságfaktor erősen befolyásolja a filmes fogyasztást az nCore-on), a családi és romantikus filmeknél viszont ez a szempont nem feltétlen érvényesíthető. A családi filmek alulreprezentáltsága különösen azért is érdekes, mert a korábban már hivatkozott 2012-es p2p kutatás eredményei alapján ez a kategória kifejezetten pozitívan szerepelt. Ugyanezzel a kutatással egyezést mutat viszont, hogy az erőszakos és eszképista műfajok dominanciája továbbra is a töretlen.

Konklúzió

Kutatásunk célja tehát az nCore nevű magyar torrentes közösség filmes fogyasztási szokásainak feltérképezése volt nemzetközi értékelési és műfaji szempontból, melyhez harmadik szempontként jelentkezett az időbeliség és az aktualitás szerepe.

Mint említettük az önálló módszertani megközelítés, melyet az adatbázisalkotásunkhoz alkalmaztunk kifejezetten képes a legnagyobb hazai p2p közösség preferenciáinak, illetve azon preferenciák formálódásának pontos kirajzolására.

Az eljárás ugyanakkor lehetővé teszi újabb változók bevonásával összefüggéseket is megláttatni egyéb felhasználói adatbázis-szerű felületek (mint ezesetben az IMDb) népszerűségi mintázata, és az itteni fogyasztói szokások között.

Hivatkozások

¹ Czerniawski, M. — Responsibility of Bittorrent Search Engines for Copyright Infringements, 2009.

² BEP3, The BitTorrent Protocol Specialisation

³ https://ncore.cc/

⁴ Cohen, B. — BitTorrent Protocol 1.0, 2002.

⁵ Balázs, B., Zoltán, L. — Theatrical Distribution and P2P Movie Piracy:A Survey of P2P Networks in Hungary Using Transactional Data in.: International Journal of Communication 6 (2012)

--

--