Habra-nyomozó: elveszett a képed

Habra-nyomozó: elveszett a képed
Elgondolkozott már azon, hogy mennyi információ vész el nyomtalanul? Végül is az információ az, amiért Habr létezik. Tudod, mi történik leggyakrabban a felhasználói bejegyzéseken alapuló erőforrásokkal? A szerzők képeket, képeket és videókat helyeznek be harmadik felek webhelyeiről, és egy idő után már nem érhetők el. Valaha erre hozták létre. Habrastorage. A gyakorlat azt mutatja, hogy senki (a szerkesztők és néhány rajongó kivételével) nem tölt fel magától oda képeket. Ezért valamikor a Habr adminisztrációja automatikussá tette ezt a funkciót – minden egyes kiadványban megjelenő kép automatikusan felkerül a tárhelyre, és nem tűnik el onnan, amíg maga a Habr létezik. Természetesen vannak kivételek és valami elromolhat, de most nem róluk.

Ebben az egész rendszerben a legnagyobb probléma a képek Habrastorage-ba való betöltésével a megvalósítás során jelentkezett. Ekkorra néhány régi kiadványon már nem volt rajz, így az is maradt. Ma megpróbáljuk kideríteni, mennyi grafikus információt veszített Habr születése óta. Emellett talán találunk valamit, ami hiányzott? Ez a "kép nem tölthető be" csonk idegesítő, nem? A mai detektívtörténetet pontosan ennek szentelik. Kezdjük el!

Lehet, hogy egy megemlítés juttatta el ehhez a cikkhez nyomozó? Valószínűleg az egyik régi kiadványodból eltűnt egy kép, és megtaláltam. Ha nem szeretnéd elolvasni a teljes bejegyzést, görgess a legvégén lévő spoilerhez (szakasz Álláspontja), amely felsorolja az összes talált publikációt és képet. Köszönöm!

Bevezetés és módszerek

Detektív történetünk a legelejétől fog indulni (logikus, ugye?). A Habr elejétől fogva. Végtére is, minél korábban tettek közzé egy bejegyzést, annál nagyobb az esélye annak, hogy a róla készült képek valahol elvesztek a történelemben. Ezért 2006-tól indulunk, és egy kicsit előre lépünk.

A számításba beletartozik a 40 központ összes publikációja, amely jelenleg a rangsor elején található. Ezen hubok teljes listája a spoiler alatt található. Valójában akkoriban sok közülük nem is létezett, de amikor új csomópontok jöttek létre, a kiadványok átkerültek oda.

Hubok listája

*semmi, Algoritmusok, Mesterséges Intelligencia, Űrhajózás, Biotechnológia, Agy, C + +, Fejlesztési menedzsment, DIY, Ökológia, Játékfejlesztés, Játékok és játékkonzolok, Geek egészség, Az informatika története, Információ biztonság, IT karrier, IT infrastruktúra, IT cégek, Jáva, JavaScript, Jogszabályok az informatikában, Lifehackek strébereknek, Gépi tanulás, Elektronika gyártása, fejlesztése, nginx, Nyílt forráskód, Személyzeti menedzsment, Fizika, Népszerű tudomány, Termékmenedzsment, Programozás, Projektmenedzsment, Piton, Olvasószoba, Visszafejtés, Közösségi hálózatok és közösségek, Rendszer adminisztráció, Rendszer elemzés és tervezés, Itt a jövő, Weboldal fejlesztés

Az információkat PHP-szkriptek segítségével gyűjtöttük össze. Minden kiadványt letöltöttek, meghatározták a címke tartalmát <div id="post-content-body" > és ellenőrizte a címkéket < img > belül. Minden egyes képhez a képekre mutató hivatkozások tárolódnak, amelyek a Habré kiadványazonosítójához kapcsolódnak. Ezt az információt tovább elemzik.

Mi jelent meg és mikor

2006

A Habr legelején nem volt annyi kiadvány, mint most, és még kevesebb kép volt bennük. 2006-ban (05.06.2006. 221. 53-tól) összesen 75 bejegyzés jelent meg a felsorolt ​​központokban. A bejegyzések közül 10 összesen XNUMX képet tartalmaz. Maximum kép (XNUMX db) egy kiadványban "Tíz kütyü, ami megváltoztatta a világot50 rajz már a Habrastorage-on van. További 25 elveszett. Mindegyik egyedi és nem ismétlődik.

Érdekes tény: A képek közül kettő magához Habrhoz vezet, de hosszú ideje nem elérhető. Ezek a képek: http://www.habrahabr.ru/tmp/sup_blogs_preview.gif és http://www.habrahabr.ru/tmp/upgrade-chart.gif.

Tehát 2006-ra elveszett 33.3% képek a kiadványokban.

2007

2007-ben jelentősen nőtt a publikációk száma, és a képeké is - 1 bejegyzés jelent meg. Az 713 bejegyzés 599 képet tartalmaz. 1 kép került át a Habrastorage-ba, és 467 elveszett (16.2%).

Érdekes tény: kiadvány A 100 legnépszerűbb Mac OS alkalmazás legfeljebb 2007 képet tartalmaz 100-ben, és nem tartalmaz szerzői jogi szöveget.

Ezenkívül néhány elveszett kép ismétlődő. Tehát egyikük 6-szor fordul elő egyben Publikáció csak 6 képpel. Ezenkívül az „Up.gif” kép 21-szer, a „Down.gif” 16-szor és a „Same.gif” 8-szor ismétlődik egy tartományból. És ez a 45 kép innen egy bejegyzést, amely mindössze 47 képet tartalmaz.

191 egyedi < img > maradt.

2008

Mivel a Habréval kapcsolatos publikációk száma évről évre csak nőtt, 2008-ban nyomozónk 2 publikációt, valamint 520 képet néz át. Észrevettük, hogy 2-ban történt, hogy a kiadványokban található képek száma végre meghaladta a publikációt. Ráadásul csak 969 bejegyzés tartalmaz képet, és legfeljebb 2008 grafikus információelemet mutat be a kiadvány.A Google ünnepi logóinak története". 1 képet már elmentettek a Habrastorage-ra, és 943 elveszett (34.6%).

Érdekes tény: A legváratlanabb kép (vagy inkább a kiadvány tervezési problémája) található itt. Ennek eredményeként Habr megpróbálja letölteni a képet a http://#/ címen keresztül.

Habra-nyomozó: elveszett a képed

Rizs. 1. A figyelembe vett általános statisztika

Lehetséges legalább valamit helyreállítani?

A részleges helyreállítás nem nehéz. Például a leglustább módja a használata Internet Archive a mentett kiadványoldalak betöltésére tett kísérlet során. Ezenkívül megpróbálhatja magukat a képeket „megtalálni” az archívumban közvetlen hivatkozások segítségével.

Lifehack: Az archívumban lévő oldal összes verziójában ellenőriznie kell a képek jelenlétét, nem csak a legrégebbi és a legújabb verzióban.

Sajnos, bár ez a módszer bizonyos esetekben működik, olyan nehéz visszaállítani a képek legalább felét. Ezért a következő lépés a keresztküldés, az eredeti fordítások és természetesen az eredeti oldalak archív másolatainak ellenőrzése.

Ezenkívül megpróbálhatja megtalálni a kívánt képeket Habr egyik nem hivatalos tükrével, amely egykor működött, és még mindig tárolja a másolt információk egy részét.

Az utolsó és legnehezebb lehetőség a keresőmotorok használata. Ha pontosan tudja, hogy minek kell lennie a képen (van leírás és kontextus), akkor van esély rá, hogy azonos nevű fájlokat találjon, ha valaki egyszer átmásolta őket egy másik erőforrásba.

Természetesen minden további lépés nemlineárisan növeli a keresési időt.

Amit találtak

Talán nem nyűgöz le az eddig talált képek száma – 300 van belőlük (140 szerző 81 publikációjában). Ha figyelembe vesszük a „veszteségek” számát (1), akkor az eredmény kb 24.2%. Miért van kevesebb hiányzó kép, mint volt? Minden haszontalan kép (például nézetszámláló) és nem létező kép (mint a már említett http://#/, valamint http://fig.jpg/ és így tovább).

Hogy jutott eszedbe egy ilyen kerek szám? A tény az, hogy körülbelül 300 napos keresés véget ért. Eleinte a 333-ra akartam menni, de a 300 egész jól néz ki. Ráadásul jelen pillanatban kb 33% az összes "keresés áldozata".

Habra-nyomozó: elveszett a képed

Rizs. 2. Aktuális keresési eredmények

Minden talált kép (kivéve egy .bmp, azzal 301 lenne) fel van töltve ide hsto.org, valamint az ezekre és a kiadványokra mutató hivatkozásokat, valamint a bennük lévő képek indexeit a következő részben közöljük.

Álláspontja

Tehát a spoiler alatt a sikeresen megtalált képek, valamint a publikációk azonosítója, a kiadvány szövegében lévő kép indexe (1-től kezdődően, nem 0-tól) és a publikáció szerzője található. Ha Ön az említett kiadvány szerzője, és a talált képek helyesek, javítsa ki hozzászólásait. Köszönöm!

Egyes képek egyébként valójában még megtekinthetők a kiadványokban, de nem kerültek át a Habrastorage-ba, így egy idő után azok is elérhetetlenné válhatnak.

300 kép

Szerző
Kiadványazonosító
Indexek és linkek
Példa

0x62ash
27149
1
Habra-nyomozó: elveszett a képed

0xa8
11105
1

2 Rossz
607
1

1097
1

1106
1, 2, 3, 5, 24

13836
2

4eese
30820
1, 2, 3, 5
Habra-nyomozó: elveszett a képed

8cinq
41853
1

46498
1

Ádám_B
12582
1

Ainu
39501
1

alardus
2628
1

Alaszka
23447
1, 2
Habra-nyomozó: elveszett a képed

aleks_raiden
24479
2

30594
3

39037
1

40312
1, 2, 3, 4

44152
1, 2, 3

46294
1

46741
1

47782
1, 2, 3, 4, 5

alfsoft
42782
1, 2, 3, 4, 5

alizar
37779
1, 2

altblog
44677
1

arestov
37921
1

arch
19726
1

rossz kiskacsa
16292
1, 2, 3, 4, 5

Barkov
26335
1

BBSoD
8505
1

bO_oblik
22150
1, 2, 3, 4, 5

22186
1

22215
1

22322
1, 2, 3, 4, 5, 6

22334
1, 2

22375
1, 2, 3

22510
1, 2

22614
1

22836
1, 2

26181
1, 2, 3, 4, 6

28196
1, 2, 3, 4, 5, 6, 7, 8
Habra-nyomozó: elveszett a képed

29706
1, 2, 3, 4

31490
1, 2, 3, 4

36713
1

37180
1

37249
1

37306
1, 2

38013
1

38389
1, 2

41104
1, 2

41647
1

41821
1, 2

tiszta_v
12783
1

chulak
45783
1, 2, 3, 4, 5, 6, 7
Habra-nyomozó: elveszett a képed

Coss
31069
1

Kapcsos zárójel
11010
1

11941
1

14157
1

37303
1

dreikanter
31320
1, 2, 4

entze
40767
1

Fennik
20843
2

23902
1

39109
1

firstbyte
38314
1

freetonik
26593
1

frujo
40987
1

garbuz
29694
1

gorinich
12027
1

Gravitáció
28840
1

href
46908
1, 2
Habra-nyomozó: elveszett a képed

iljava
30902
2, 3

Imposeren
26566
1

invladis
42904
1

Karlsson
8971
Le.gif, Ugyanaz.gif, tpci_trends.png, Fel.gif

31042
1

31050
1

31141
1, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17
Habra-nyomozó: elveszett a képed

Klaus
15775
1, 2, 3, 4, 5, 6, 7, 8

Lain_13
16891
2

le0pard
38391
1

LukaSzafonov
43537
1

meako
26705
1

Midgard
31419
2, 3, 4

Mio
396
1

753
1

936
1

mozaik-
744
1

Mr_Floppy
28343
1

nulla
44476
1

tiszt
110
1

oleg_bunin
7207
1

7226
1

8679
1

12768
1

olegafx
43934
1, 2, 3, 4, 5, 6, 7, 8-9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19

ostrovyanin
37146
2, 3
Habra-nyomozó: elveszett a képed

ponomar
14141
1

porchini
21850
1, 2

Pure_BY
8416
1

RAF
851
1, 2

ramber
43693
1

névsor
44380
1

ruskar
42578
3, 5, 8
Habra-nyomozó: elveszett a képed

kanonizált
702
1

SamDark
30104
1

Scala
37804
4

Shapelez
23260
1

44379
1, 2

46113
1

46599
1

47536
1

slaff
8134
1, 2

smartov
17160
3

smitana
30375
1

spanasik
44755
17

spiritus_sancti
41129
1, 2
Habra-nyomozó: elveszett a képed

SummerDream
3801
1

napmedve
31211
1, 2

kapcsoló
9095
1

Taoorus
37507
1

thoggen
38733
1

45024
1

45170
1

tsepelev
36611
1

VadimUA
46922
1

vitol
26073
1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21
Habra-nyomozó: elveszett a képed

30171
1, 2, 3

XaocCPS
40036
1

284390
1

284392
1

284394
1

284396
1

yaneblog
39007
1, 6

40621
3

yesutin
9453
1

9645
1

31078
1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12
Habra-nyomozó: elveszett a képed

yshilyaev
5556
1, 2, 3

zada
31123
2

Cikcakk
15492
1

Ahelyett, hogy egy következtetés

Talán valaki úgy gondolja, hogy az ilyen elavult információk visszaállításának nincs értelme. Ráadásul a talált képek egy része már közzétételükkor is értelmetlen volt. Ez kétségtelenül igaz.

Minden információ fontos. Legalábbis a történeti elemzés szempontjából. Arról nem is beszélve, hogy egyes szerzői joggal védett anyagokban kulcsszerepet játszik. Igen, jelenleg Habr még 15 éves sem, és a források egy része még elérhető, de idővel egyre kevesebb lesz, ezért érdemes előre gondolkodni, hogy marad-e valami későbbre, vagy lesz-e legyen egy örök „nem elérhető kép”.

Nos, ne felejtsük el, hogy a hozzáférhetetlen képek helyőrzői egyszerűen bosszantóak. Természetesen kevesen olvasnak „régi dolgokat”, de lesznek ilyenek. Ezért, mivel ezek a kiadványok még mindig elérhetők a Habrén, tartalmuk a lehető legteljesebb legyen.

Sajnos a Habrastorage még nem támogatja az összes képformátum közvetlen letöltését, de talán ezt is megoldják egyszer.

Az utolsó probléma, amelyet szeretnék megemlíteni, és amelyre valószínűleg gondolt: „mi van, ha a szerző hosszú ideje nem használja a Habrt, és nem érdekli a régi dolgok javítása?” Ez a kérdés nem egyszer felmerült a fejemben, de a megoldás itt nem olyan nehéz. A régi kiadványokat mindig lehet javítani ufó moderátorok személyében (lehet, Exoszféra?) vagy adminisztráció (Boomburum feladatot adhat valakinek).

Mit gondolsz, érdemes megpróbálni legalább valamit helyreállítani?

Ez minden mára. Köszönöm a figyelmet, és minden képed probléma nélkül kerülhet fel a Habrastorage-ba! Ez ne történjen meg

Habra-nyomozó: elveszett a képed

PS Ha elírást vagy hibát talál a szövegben, kérem jelezze. Ezt úgy teheti meg, hogy kijelöli a szöveg egy részét, és megnyomja a "Ctrl / ⌘ + Enter", ha rendelkezik Ctrl / ⌘ vagy via privát üzenetek. Ha mindkét lehetőség nem elérhető, írjon a hibákról a megjegyzésekben. Köszönöm!

PPS Talán más Habr kutatásom is felkeltette érdeklődését, vagy saját témát szeretne javasolni a következő publikációhoz, esetleg új publikációsorozatot.

Hol található a lista, és hogyan lehet javaslatot tenni

Minden információ megtalálható egy speciális adattárban Habra nyomozó. Ott azt is megtudhatja, hogy mely javaslatok kerültek már bejelentésre, és melyek vannak már készülőben.

Megemlíthetsz engem is (írással VaskivskyiYe).

Forrás: will.com

Hozzászólás