diff options
-rw-r--r-- | misc/analiza.txt | 38 |
1 files changed, 38 insertions, 0 deletions
diff --git a/misc/analiza.txt b/misc/analiza.txt index bb8b5f8..ca0f4f6 100644 --- a/misc/analiza.txt +++ b/misc/analiza.txt @@ -1 +1,39 @@ cd www; find .. -maxdepth 1 -name *.torrent | parallel ./insert.php 'mysql:host=tranzistor:3306\;dbname=travnik\;charset=utf8' travnik $TRAVNIK_DB_PASSWORD {} | tee ../tmp/insert.txt; ocd + +analizirati: +- kateri nestandardni ključi so v info slovarjih +- encodingi +- končnice datotek +- kategoriziranje po imenih torrentov in datotek +- število datotek -- percentile +- velikost torrenta -- percentile +- velikost torenta/število datotek -- percentile +- seznam največjih n torrentov in največjih n datotek +- filmi po letnicah -- percentile +- kodeki (iz imena; x265, x264, ...) +- resolucije (iz imena, 4K, 4K60fps, 720p) +- top n source +- tipi vsebine: filmi/porn/knjige/revije/igrice/programi/dokumenti/ilegalne (TEŽKO, veliko ročnega dela, ChatGPT?) +- ip naslovi + geoip +- odjemalci: verzije, popularnost v državi +- porti odjemalcev -- distribucija +- koliko % torrentov ima google -- sear.c + +citirati: +- bep +- parallel, r + +napisati: +- teorija DHT +- ostali projekti crawlanja DHTja +- program travnik in delovanje +- struktura podatkovne zbirke +- programi za analizo + +analiza za naprej, z novimi podatki: +- koliko časa so peeri živi po prvem videnju - percentile + glede na državo +- koliko časa po DL metadata imajo peeri še vedno metadata - percentile + glede na državo + glede na torrent +- število peerov v swarmu torrentov skozi čas (PeX -- treba implementat uTP in TCP) +- torrenti z največjimi swarmi +- kako hitro peeri nalagajo/bandwidth glede na has_pieces - percentile + glede na državo + glede na torrent +- a obstaja kak LPD na T-2 /16 mreži? |