Elgondolkozott már azon, hogy mennyi információ vész el nyomtalanul? Végül is az információ az, amiért Habr létezik. Tudod, mi történik leggyakrabban a felhasználói bejegyzéseken alapuló erőforrásokkal? A szerzők képeket, képeket és videókat helyeznek be harmadik felek webhelyeiről, és egy idő után már nem érhetők el. Valaha erre hozták létre. Habrastorage. A gyakorlat azt mutatja, hogy senki (a szerkesztők és néhány rajongó kivételével) nem tölt fel magától oda képeket. Ezért valamikor a Habr adminisztrációja automatikussá tette ezt a funkciót – minden egyes kiadványban megjelenő kép automatikusan felkerül a tárhelyre, és nem tűnik el onnan, amíg maga a Habr létezik. Természetesen vannak kivételek és valami elromolhat, de most nem róluk.
Ebben az egész rendszerben a legnagyobb probléma a képek Habrastorage-ba való betöltésével a megvalósítás során jelentkezett. Ekkorra néhány régi kiadványon már nem volt rajz, így az is maradt. Ma megpróbáljuk kideríteni, mennyi grafikus információt veszített Habr születése óta. Emellett talán találunk valamit, ami hiányzott? Ez a "kép nem tölthető be" csonk idegesítő, nem? A mai detektívtörténetet pontosan ennek szentelik. Kezdjük el!
Lehet, hogy egy megemlítés juttatta el ehhez a cikkhez nyomozó? Valószínűleg az egyik régi kiadványodból eltűnt egy kép, és megtaláltam. Ha nem szeretnéd elolvasni a teljes bejegyzést, görgess a legvégén lévő spoilerhez (szakasz Álláspontja), amely felsorolja az összes talált publikációt és képet. Köszönöm!
Bevezetés és módszerek
Detektív történetünk a legelejétől fog indulni (logikus, ugye?). A Habr elejétől fogva. Végtére is, minél korábban tettek közzé egy bejegyzést, annál nagyobb az esélye annak, hogy a róla készült képek valahol elvesztek a történelemben. Ezért 2006-tól indulunk, és egy kicsit előre lépünk.
A számításba beletartozik a 40 központ összes publikációja, amely jelenleg a rangsor elején található. Ezen hubok teljes listája a spoiler alatt található. Valójában akkoriban sok közülük nem is létezett, de amikor új csomópontok jöttek létre, a kiadványok átkerültek oda.
Az információkat PHP-szkriptek segítségével gyűjtöttük össze. Minden kiadványt letöltöttek, meghatározták a címke tartalmát <div id="post-content-body" > és ellenőrizte a címkéket < img > belül. Minden egyes képhez a képekre mutató hivatkozások tárolódnak, amelyek a Habré kiadványazonosítójához kapcsolódnak. Ezt az információt tovább elemzik.
Mi jelent meg és mikor
2006
A Habr legelején nem volt annyi kiadvány, mint most, és még kevesebb kép volt bennük. 2006-ban (05.06.2006. 221. 53-tól) összesen 75 bejegyzés jelent meg a felsorolt központokban. A bejegyzések közül 10 összesen XNUMX képet tartalmaz. Maximum kép (XNUMX db) egy kiadványban "Tíz kütyü, ami megváltoztatta a világot50 rajz már a Habrastorage-on van. További 25 elveszett. Mindegyik egyedi és nem ismétlődik.
Érdekes tény: A képek közül kettő magához Habrhoz vezet, de hosszú ideje nem elérhető. Ezek a képek: http://www.habrahabr.ru/tmp/sup_blogs_preview.gif és http://www.habrahabr.ru/tmp/upgrade-chart.gif.
Tehát 2006-ra elveszett 33.3% képek a kiadványokban.
2007
2007-ben jelentősen nőtt a publikációk száma, és a képeké is - 1 bejegyzés jelent meg. Az 713 bejegyzés 599 képet tartalmaz. 1 kép került át a Habrastorage-ba, és 467 elveszett (16.2%).
Ezenkívül néhány elveszett kép ismétlődő. Tehát egyikük 6-szor fordul elő egyben Publikáció csak 6 képpel. Ezenkívül az „Up.gif” kép 21-szer, a „Down.gif” 16-szor és a „Same.gif” 8-szor ismétlődik egy tartományból. És ez a 45 kép innen egy bejegyzést, amely mindössze 47 képet tartalmaz.
191 egyedi < img > maradt.
2008
Mivel a Habréval kapcsolatos publikációk száma évről évre csak nőtt, 2008-ban nyomozónk 2 publikációt, valamint 520 képet néz át. Észrevettük, hogy 2-ban történt, hogy a kiadványokban található képek száma végre meghaladta a publikációt. Ráadásul csak 969 bejegyzés tartalmaz képet, és legfeljebb 2008 grafikus információelemet mutat be a kiadvány.A Google ünnepi logóinak története". 1 képet már elmentettek a Habrastorage-ra, és 943 elveszett (34.6%).
Érdekes tény: A legváratlanabb kép (vagy inkább a kiadvány tervezési problémája) található itt. Ennek eredményeként Habr megpróbálja letölteni a képet a http://#/ címen keresztül.
Rizs. 1. A figyelembe vett általános statisztika
Lehetséges legalább valamit helyreállítani?
A részleges helyreállítás nem nehéz. Például a leglustább módja a használata Internet Archive a mentett kiadványoldalak betöltésére tett kísérlet során. Ezenkívül megpróbálhatja magukat a képeket „megtalálni” az archívumban közvetlen hivatkozások segítségével.
Lifehack: Az archívumban lévő oldal összes verziójában ellenőriznie kell a képek jelenlétét, nem csak a legrégebbi és a legújabb verzióban.
Sajnos, bár ez a módszer bizonyos esetekben működik, olyan nehéz visszaállítani a képek legalább felét. Ezért a következő lépés a keresztküldés, az eredeti fordítások és természetesen az eredeti oldalak archív másolatainak ellenőrzése.
Ezenkívül megpróbálhatja megtalálni a kívánt képeket Habr egyik nem hivatalos tükrével, amely egykor működött, és még mindig tárolja a másolt információk egy részét.
Az utolsó és legnehezebb lehetőség a keresőmotorok használata. Ha pontosan tudja, hogy minek kell lennie a képen (van leírás és kontextus), akkor van esély rá, hogy azonos nevű fájlokat találjon, ha valaki egyszer átmásolta őket egy másik erőforrásba.
Természetesen minden további lépés nemlineárisan növeli a keresési időt.
Amit találtak
Talán nem nyűgöz le az eddig talált képek száma – 300 van belőlük (140 szerző 81 publikációjában). Ha figyelembe vesszük a „veszteségek” számát (1), akkor az eredmény kb 24.2%. Miért van kevesebb hiányzó kép, mint volt? Minden haszontalan kép (például nézetszámláló) és nem létező kép (mint a már említett http://#/, valamint http://fig.jpg/ és így tovább).
Hogy jutott eszedbe egy ilyen kerek szám? A tény az, hogy körülbelül 300 napos keresés véget ért. Eleinte a 333-ra akartam menni, de a 300 egész jól néz ki. Ráadásul jelen pillanatban kb 33% az összes "keresés áldozata".
Rizs. 2. Aktuális keresési eredmények
Minden talált kép (kivéve egy .bmp, azzal 301 lenne) fel van töltve ide hsto.org, valamint az ezekre és a kiadványokra mutató hivatkozásokat, valamint a bennük lévő képek indexeit a következő részben közöljük.
Álláspontja
Tehát a spoiler alatt a sikeresen megtalált képek, valamint a publikációk azonosítója, a kiadvány szövegében lévő kép indexe (1-től kezdődően, nem 0-tól) és a publikáció szerzője található. Ha Ön az említett kiadvány szerzője, és a talált képek helyesek, javítsa ki hozzászólásait. Köszönöm!
Egyes képek egyébként valójában még megtekinthetők a kiadványokban, de nem kerültek át a Habrastorage-ba, így egy idő után azok is elérhetetlenné válhatnak.
Talán valaki úgy gondolja, hogy az ilyen elavult információk visszaállításának nincs értelme. Ráadásul a talált képek egy része már közzétételükkor is értelmetlen volt. Ez kétségtelenül igaz.
Minden információ fontos. Legalábbis a történeti elemzés szempontjából. Arról nem is beszélve, hogy egyes szerzői joggal védett anyagokban kulcsszerepet játszik. Igen, jelenleg Habr még 15 éves sem, és a források egy része még elérhető, de idővel egyre kevesebb lesz, ezért érdemes előre gondolkodni, hogy marad-e valami későbbre, vagy lesz-e legyen egy örök „nem elérhető kép”.
Nos, ne felejtsük el, hogy a hozzáférhetetlen képek helyőrzői egyszerűen bosszantóak. Természetesen kevesen olvasnak „régi dolgokat”, de lesznek ilyenek. Ezért, mivel ezek a kiadványok még mindig elérhetők a Habrén, tartalmuk a lehető legteljesebb legyen.
Sajnos a Habrastorage még nem támogatja az összes képformátum közvetlen letöltését, de talán ezt is megoldják egyszer.
Az utolsó probléma, amelyet szeretnék megemlíteni, és amelyre valószínűleg gondolt: „mi van, ha a szerző hosszú ideje nem használja a Habrt, és nem érdekli a régi dolgok javítása?” Ez a kérdés nem egyszer felmerült a fejemben, de a megoldás itt nem olyan nehéz. A régi kiadványokat mindig lehet javítani ufó moderátorok személyében (lehet, Exoszféra?) vagy adminisztráció (Boomburum feladatot adhat valakinek).
Mit gondolsz, érdemes megpróbálni legalább valamit helyreállítani?
Ez minden mára. Köszönöm a figyelmet, és minden képed probléma nélkül kerülhet fel a Habrastorage-ba! Ez ne történjen meg
PS Ha elírást vagy hibát talál a szövegben, kérem jelezze. Ezt úgy teheti meg, hogy kijelöli a szöveg egy részét, és megnyomja a "Ctrl / ⌘ + Enter", ha rendelkezik Ctrl / ⌘ vagy via privát üzenetek. Ha mindkét lehetőség nem elérhető, írjon a hibákról a megjegyzésekben. Köszönöm!
PPS Talán más Habr kutatásom is felkeltette érdeklődését, vagy saját témát szeretne javasolni a következő publikációhoz, esetleg új publikációsorozatot.
Hol található a lista, és hogyan lehet javaslatot tenni
Minden információ megtalálható egy speciális adattárban Habra nyomozó. Ott azt is megtudhatja, hogy mely javaslatok kerültek már bejelentésre, és melyek vannak már készülőben.