summaryrefslogtreecommitdiffstats
diff options
context:
space:
mode:
-rw-r--r--misc/analiza.txt38
1 files changed, 38 insertions, 0 deletions
diff --git a/misc/analiza.txt b/misc/analiza.txt
index bb8b5f8..ca0f4f6 100644
--- a/misc/analiza.txt
+++ b/misc/analiza.txt
@@ -1 +1,39 @@
cd www; find .. -maxdepth 1 -name *.torrent | parallel ./insert.php 'mysql:host=tranzistor:3306\;dbname=travnik\;charset=utf8' travnik $TRAVNIK_DB_PASSWORD {} | tee ../tmp/insert.txt; ocd
+
+analizirati:
+- kateri nestandardni ključi so v info slovarjih
+- encodingi
+- končnice datotek
+- kategoriziranje po imenih torrentov in datotek
+- število datotek -- percentile
+- velikost torrenta -- percentile
+- velikost torenta/število datotek -- percentile
+- seznam največjih n torrentov in največjih n datotek
+- filmi po letnicah -- percentile
+- kodeki (iz imena; x265, x264, ...)
+- resolucije (iz imena, 4K, 4K60fps, 720p)
+- top n source
+- tipi vsebine: filmi/porn/knjige/revije/igrice/programi/dokumenti/ilegalne (TEŽKO, veliko ročnega dela, ChatGPT?)
+- ip naslovi + geoip
+- odjemalci: verzije, popularnost v državi
+- porti odjemalcev -- distribucija
+- koliko % torrentov ima google -- sear.c
+
+citirati:
+- bep
+- parallel, r
+
+napisati:
+- teorija DHT
+- ostali projekti crawlanja DHTja
+- program travnik in delovanje
+- struktura podatkovne zbirke
+- programi za analizo
+
+analiza za naprej, z novimi podatki:
+- koliko časa so peeri živi po prvem videnju - percentile + glede na državo
+- koliko časa po DL metadata imajo peeri še vedno metadata - percentile + glede na državo + glede na torrent
+- število peerov v swarmu torrentov skozi čas (PeX -- treba implementat uTP in TCP)
+- torrenti z največjimi swarmi
+- kako hitro peeri nalagajo/bandwidth glede na has_pieces - percentile + glede na državo + glede na torrent
+- a obstaja kak LPD na T-2 /16 mreži?