Habra-spæjari: myndin þín er týnd

Habra-spæjari: myndin þín er týnd
Hefur þú einhvern tíma velt því fyrir þér hversu miklar upplýsingar glatast án þess að hafa spor? Eftir allt saman, upplýsingar eru það sem Habr er til fyrir. Veistu hvað gerist oftast með auðlindir byggðar á notendafærslum? Höfundarnir setja inn myndir, myndir og myndbönd frá síðum þriðja aðila og eftir nokkurn tíma eru þau ekki lengur tiltæk. Þetta er það sem það var einu sinni búið til. Habrageymsla. Æfingin hefur sýnt að enginn (nema ritstjórar og nokkrir áhugamenn) setur þar inn myndir á eigin spýtur. Þess vegna, á einhverjum tímapunkti, gerði stjórn Habr þessa aðgerð sjálfvirka - sérhver mynd sem birtist í riti er sjálfkrafa hlaðið upp á geymsluna og mun ekki hverfa þaðan á meðan Habr sjálft er til. Auðvitað eru undantekningar og eitthvað gæti farið úrskeiðis, en ekki um þá núna.

Stærsta vandamálið í öllu þessu kerfi við að hlaða myndum inn í Habrastorage kom upp við innleiðingu þess. Á þeim tíma höfðu sum gömul rit þegar engar teikningar og voru því áfram þannig. Í dag munum við reyna að komast að því hversu mikið af grafískum upplýsingum Habr hefur misst frá fæðingu. Að auki getum við kannski fundið eitthvað sem vantaði? Þessi „mynd er ekki hægt að hlaða“ er pirrandi, er það ekki? Spæjarasaga dagsins er tileinkuð nákvæmlega þessu. Byrjum!

Þú gætir hafa verið færður í þessa grein með því að nefna í rekja spor einhvers? Sennilega hvarf mynd úr einu af gömlu ritunum þínum og ég fann hana. Ef þú vilt ekki lesa alla færsluna geturðu bara skrunað að spoilernum alveg í lokin (kafli Niðurstöður), sem sýnir öll rit og myndir sem fundust. Þakka þér fyrir!

Inngangur og aðferðir

Leynilögreglusagan okkar mun byrja alveg frá upphafi (rökrétt, ekki satt?). Frá upphafi Habr. Enda, því fyrr sem færsla var birt, þeim mun meiri líkur eru á að myndir úr henni hafi glatast einhvers staðar í sögunni. Þess vegna ætlum við að byrja á árinu 2006 og fara aðeins áfram.

Öll rit frá 40 miðstöðvum sem eru nú í upphafi röðunarinnar eru innifalin í athuguninni. Allur listi yfir þessar miðstöðvar er sýndur undir spoilernum. Reyndar voru margar þeirra ekki til þá, en þegar nýjar miðstöðvar bættust við voru útgáfur fluttar þangað.

Listi yfir miðstöðvar

* nix, Reiknirit, Artificial Intelligence, Astronautics, líftækni, Brain, C + +, Þróunarstjórnun, DIY, Vistfræði, Leikjaþróun, Leikir og leikjatölvur, Geek heilsa, Saga upplýsingatækni, upplýsingar Öryggi, IT ferill, Uppbygging upplýsingatækni, upplýsingatæknifyrirtæki, Java, JavaScript, Löggjöf í upplýsingatækni, Lifehacks fyrir nörda, vél nám, Framleiðsla og þróun raftækja, Nginx, opinn uppspretta, Starfsmannastjórnun, Eðlisfræði, Vinsæl vísindi, vara Stjórnun, Forritun, Verkefnastjórn, Python, Lesstofa, Andstæða verkfræði, Samfélagsnet og samfélög, Kerfisstjórnun, Kerfisgreining og hönnun, Framtíðin er hér, Website þróun

Upplýsingunum var safnað með því að nota safn af PHP forskriftum. Hvert rit var hlaðið niður, innihald merkisins var ákvarðað <div id="post-content-body" > og leitaði að merkjum < img > inni. Fyrir hverja mynd eru geymdir tenglar á myndirnar, tengdar við útgáfuauðkenni á Habré. Þessar upplýsingar eru greindar nánar.

Hvað var gefið út og hvenær

2006

Strax í upphafi Habr var ekki eins mikið af ritum og nú, og enn færri myndir í þeim. Alls var 2006 færsla birt á skráðum miðstöðvum árið 05.06.2006 (frá og með 221/53/75). 10 af þessum færslum innihalda alls XNUMX myndir. Hámarksfjöldi mynda (XNUMX stykki) í riti "Tíu græjur sem breyttu heiminum". 50 teikningar eru þegar á Habrastorage. Aðrar 25 eru týndar. Allar eru þær einstakar og ekki endurteknar.

Áhugavert staðreynd: Tvær myndanna leiða til Habr sjálfs, en hafa ekki verið fáanlegar í langan tíma. Þetta eru myndirnar http://www.habrahabr.ru/tmp/sup_blogs_preview.gif og http://www.habrahabr.ru/tmp/upgrade-chart.gif.

Svo, tapað fyrir 2006 33.3% myndir í ritum.

2007

Árið 2007 fjölgaði útgáfum umtalsvert sem og myndafjöldi - 1 færslur birtust. 713 færslur innihalda 599 myndir. 1 myndir voru fluttar á Habrastorage og 467 týndu (16.2%).

Áhugavert staðreynd: Útgáfa Topp 100 Mac OS forritin inniheldur að hámarki 2007 myndir fyrir árið 100 og inniheldur ekki höfundarréttartexta.

Að auki eru sumar af þessum týndu myndum afrit. Svo, einn þeirra kemur 6 sinnum fyrir í einu Birting með aðeins 6 myndum. Einnig er myndin „Up.gif“ endurtekin 21 sinnum, „Down.gif“ 16 sinnum og „Same.gif“ 8 sinnum frá einu léni. Og allar þessar 45 myndir frá eina færslu, sem inniheldur aðeins 47 myndir.

Það eru 191 einstök < img > eftir.

2008

Þar sem útgáfum á Habré hefur aðeins fjölgað ár frá ári mun leynilögreglumaður okkar árið 2008 fara yfir 2 útgáfur, auk 520 myndir. Við tókum eftir því að það var árið 2 sem fjöldi mynda í ritum fór loksins yfir fjölda birtinga. Þar að auki innihalda aðeins 969 færslur myndir og að hámarki 2008 þættir grafískra upplýsinga eru sýndir í ritinu "Saga jólamerkja Google". 1 myndir hafa þegar verið vistaðar á Habrastorage og 943 hafa glatast (34.6%).

Áhugavert staðreynd: Óvæntasta myndin (eða öllu heldur, vandamálið í hönnun útgáfunnar) er staðsett hér. Fyrir vikið reynir Habr að hlaða niður myndinni í gegnum http://#/.

Habra-spæjari: myndin þín er týnd

Hrísgrjón. 1. Almenn tölfræði yfirvegaðra

Er hægt að endurheimta að minnsta kosti eitthvað?

Endurreisn að hluta er ekki erfið. Til dæmis væri latalegasta leiðin að nota Internet Archive í tilraun til að hlaða vistuðum útgáfusíðum. Að auki geturðu reynt að „finna“ myndirnar sjálfar í skjalasafninu með beinum hlekkjum.

Lifehack: Þú þarft að athuga hvort myndir séu til staðar í öllum útgáfum síðunnar í skjalasafninu, ekki bara þeirri elstu og nýjustu.

Því miður, þó að þessi aðferð virki í sumum tilfellum, er svo erfitt að endurheimta að minnsta kosti helming myndanna. Því er næsta skref að athuga krossfærslur, frumþýðingar og að sjálfsögðu geymsluafrit af upprunalegu síðunum.

Að auki geturðu reynt að finna myndirnar sem þú vilt með því að nota einn af óopinberum speglum Habr, sem einu sinni virkaði og geymir enn nokkrar af afrituðu upplýsingarnar.

Síðasti og erfiðasti kosturinn er að nota leitarvélar. Ef þú veist nákvæmlega hvað ætti að vera á myndinni (það er lýsing og samhengi), þá er möguleiki á að finna skrár með sama nafni ef þær voru einu sinni afritaðar af einhverjum í aðra auðlind.

Auðvitað eykur hvert næsta skref leitartímann ólínulega.

Það sem við fundum

Þú gætir ekki verið of hrifinn af fjölda mynda sem finnast hingað til - þær eru 300 (í 140 ritum frá 81 höfundi). Ef við tökum tillit til fjölda „tjóna“ (1) er niðurstaðan u.þ.b 24.2%. Af hverju vantar færri myndir en það var? Allar gagnslausar myndir (eins og skoðateljarar) og myndir sem ekki eru til (eins og áðurnefndu http://#/, sem og http://fig.jpg/ og svo framvegis).

Hvernig datt þér í hug svona hringlaga tölu? Staðreyndin er sú að um það bil 300 daga leit lauk. Í fyrstu ætlaði ég að fara í 333, en 300 lítur nokkuð vel út. Að auki, í augnablikinu um 33% öll „fórnarlömb leitarinnar“.

Habra-spæjari: myndin þín er týnd

Hrísgrjón. 2. Núverandi leitarniðurstöður

Allar fundnar myndir (fyrir utan eina .bmp, með henni væri það 301) er hlaðið upp á hsto.org, og tenglar á þær og rit, svo og skrár yfir myndir í þeim, eru gefnar í næsta kafla.

Niðurstöður

Svo, undir spoilernum eru myndirnar sem fundust vel, auk auðkennis ritanna, vísitölu myndarinnar í texta útgáfunnar (byrjar frá 1, ekki frá 0) og höfundur útgáfunnar. Ef þú ert höfundur nefndrar útgáfu og myndirnar sem fundust eru réttar, vinsamlegast leiðréttu færslur þínar. Þakka þér fyrir!

Við the vegur, sumar myndir eru reyndar enn til áhorfs í útgáfum, en hafa ekki verið fluttar til Habrastorage, og því á einhverjum tímapunkti geta þær líka orðið ófáanlegar.

300 myndir

Höfundur
Útgáfukenni
Vísitölur og tenglar
Dæmi

0x62 ösku
27149
1
Habra-spæjari: myndin þín er týnd

0xa8
11105
1

2 Slæmt
607
1

1097
1

1106
1, 2, 3, 5, 24

13836
2

4eee
30820
1, 2, 3, 5
Habra-spæjari: myndin þín er týnd

8cinq
41853
1

46498
1

Adam_B
12582
1

Ainu
39501
1

alardus
2628
1

Alaska
23447
1, 2
Habra-spæjari: myndin þín er týnd

aleks_raiden
24479
2

30594
3

39037
1

40312
1, 2, 3, 4

44152
1, 2, 3

46294
1

46741
1

47782
1, 2, 3, 4, 5

alfsoft
42782
1, 2, 3, 4, 5

alizar
37779
1, 2

altblogg
44677
1

arestov
37921
1

artch
19726
1

illgresi
16292
1, 2, 3, 4, 5

Barkov
26335
1

BBSoD
8505
1

bO_oblik
22150
1, 2, 3, 4, 5

22186
1

22215
1

22322
1, 2, 3, 4, 5, 6

22334
1, 2

22375
1, 2, 3

22510
1, 2

22614
1

22836
1, 2

26181
1, 2, 3, 4, 6

28196
1, 2, 3, 4, 5, 6, 7, 8
Habra-spæjari: myndin þín er týnd

29706
1, 2, 3, 4

31490
1, 2, 3, 4

36713
1

37180
1

37249
1

37306
1, 2

38013
1

38389
1, 2

41104
1, 2

41647
1

41821
1, 2

hreint_v
12783
1

chulak
45783
1, 2, 3, 4, 5, 6, 7
Habra-spæjari: myndin þín er týnd

Coss
31069
1

CurlyBrace
11010
1

11941
1

14157
1

37303
1

dreikanter
31320
1, 2, 4

entze
40767
1

Fenniks
20843
2

23902
1

39109
1

fyrsta bæti
38314
1

freetonik
26593
1

frujo
40987
1

garbuz
29694
1

gorinich
12027
1

Þyngdarafl
28840
1

href
46908
1, 2
Habra-spæjari: myndin þín er týnd

iljava
30902
2, 3

Imposeren
26566
1

invladis
42904
1

Karlsson
8971
Down.gif, Sama.gif, tpci_trends.png, Up.gif

31042
1

31050
1

31141
1, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17
Habra-spæjari: myndin þín er týnd

Klaus
15775
1, 2, 3, 4, 5, 6, 7, 8

Lain_13
16891
2

le0pard
38391
1

Luka Safonov
43537
1

meako
26705
1

Miðgarð
31419
2, 3, 4

Mio
396
1

753
1

936
1

mósaík
744
1

Mr_Floppy
28343
1

núll
44476
1

liðsforingi
110
1

oleg_bunin
7207
1

7226
1

8679
1

12768
1

olegafx
43934
1, 2, 3, 4, 5, 6, 7, 8-9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19

ostrovityanin
37146
2, 3
Habra-spæjari: myndin þín er týnd

ponomar
14141
1

porchini
21850
1, 2

Pure_BY
8416
1

RAF
851
1, 2

ramber
43693
1

ryð
44380
1

ruskar
42578
3, 5, 8
Habra-spæjari: myndin þín er týnd

heilagur
702
1

SamDark
30104
1

mælikvarði
37804
4

Shapelez
23260
1

44379
1, 2

46113
1

46599
1

47536
1

slauf
8134
1, 2

smartov
17160
3

smitana
30375
1

spanasik
44755
17

spiritus_sancti
41129
1, 2
Habra-spæjari: myndin þín er týnd

Sumardraumur
3801
1

sólarbjörn
31211
1, 2

Switch
9095
1

Taoorus
37507
1

Þöggen
38733
1

45024
1

45170
1

tsepelev
36611
1

VadimUA
46922
1

vitol
26073
1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21
Habra-spæjari: myndin þín er týnd

30171
1, 2, 3

XaocCPS
40036
1

284390
1

284392
1

284394
1

284396
1

yaneblogg
39007
1, 6

40621
3

Yesutin
9453
1

9645
1

31078
1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12
Habra-spæjari: myndin þín er týnd

yshilyaev
5556
1, 2, 3

Zada
31123
2

Sikksakk
15492
1

Í stað þess að niðurstöðu

Kannski mun einhver telja að það sé ekki skynsamlegt að endurheimta slíkar úreltar upplýsingar. Og þar að auki voru sumar myndirnar sem fundust marklausar jafnvel þegar þær voru birtar. Þetta er eflaust rétt.

Allar upplýsingar eru mikilvægar. Að minnsta kosti frá sjónarhóli sagnfræðigreiningar. Svo ekki sé minnst á þá staðreynd að í sumum höfundarréttarvörðu efni gegnir það lykilhlutverki. Já, í augnablikinu er Habr ekki einu sinni 15 ára og sumar heimildirnar eru enn til, en með tímanum verða þær færri og færri og því er rétt að hugsa fyrirfram hvort eitthvað verði eftir til seinna, eða hvort það verði vera eilíf „mynd ekki tiltæk“.

Jæja, ekki gleyma því að staðgenglar fyrir óaðgengilegar myndir eru einfaldlega pirrandi. Auðvitað munu fáir lesa „gamalt dót“ en slíkt fólk mun vera til. Þess vegna, þar sem þessi rit eru enn aðgengileg á Habré, ætti innihald þeirra að vera eins fullkomið og mögulegt er.

Því miður styður Habrastorage ekki enn beint niðurhal fyrir öll myndsnið, en kannski lagast þetta einhvern tímann.

Síðasta vandamálið sem ég vil nefna, og sem þú hefur líklega hugsað um, "hvað ef höfundur hefur ekki notað Habr í langan tíma og hefur ekki áhuga á að leiðrétta gamalt efni?" Þessi spurning hefur vaknað í hausnum á mér oftar en einu sinni, en lausnin hér er ekki svo erfið. Það er alltaf hægt að leiðrétta gömul rit UFO í persónu stjórnenda (þú getur, Exosphere?) eða stjórnun (Búmburum getur gefið einhverjum verkefni).

Hvað finnst þér, er það þess virði að reyna að endurheimta að minnsta kosti eitthvað?

Það er allt í dag. Þakka þér fyrir athyglina og megi öllum myndum þínum hlaðast upp á Habrastorage án vandræða! Látum þetta ekki gerast

Habra-spæjari: myndin þín er týnd

PS Ef þú finnur einhverjar innsláttarvillur eða villur í textanum, vinsamlegast láttu mig vita. Þetta er hægt að gera með því að velja texta og ýta á "Ctrl / ⌘ + Enter" ef þú ert með Ctrl / ⌘, annað hvort í gegnum einkaskilaboð. Ef báðir valkostir eru ekki tiltækir skaltu skrifa um villurnar í athugasemdunum. Þakka þér fyrir!

Pps Kannski munt þú líka hafa áhuga á öðrum Habr rannsóknum mínum eða þú vilt stinga upp á þínu eigin efni fyrir næstu útgáfu, eða kannski jafnvel nýja ritröð.

Hvar á að finna listann og hvernig á að gera tillögu

Allar upplýsingar er að finna í sérstakri geymslu Habra einkaspæjari. Þar má einnig kynna sér hvaða tillögur hafa þegar verið kynntar og hvað er þegar í vinnslu.

Þú getur líka nefnt mig (með því að skrifa VaskivskyiYe) í athugasemdum við rit sem þér sýnist áhugavert til rannsókna eða greiningar.

Heimild: www.habr.com

Bæta við athugasemd