Habra-detective: jo foto is ferlern

Habra-detective: jo foto is ferlern
Ha jo ea ôffrege hoefolle ynformaasje is ferlern sûnder in spoar? Ommers, ynformaasje is wêr Habr foar bestiet. Witte jo wat it meast bart mei boarnen basearre op brûkersberjochten? De auteurs foegje ôfbyldings, foto's en fideo's yn fan siden fan tredden en nei in skoft binne se net mear beskikber. Dit is wêr't it eartiids foar makke is. Habrastorage. De praktyk hat útwiisd dat nimmen (útsein redaksje en in pear leafhawwers) dêr sels bylden oplaadt. Dêrom hat de administraasje fan Habr dizze funksje op in stuit automatysk makke - elke ôfbylding dy't yn in publikaasje ferskynt wurdt automatysk opladen nei de opslach en sil dêr net ferdwine salang't Habr sels bestiet. Fansels, der binne útsûnderingen en der kin wat mis gean, mar net oer harren no.

It grutste probleem yn dit hiele skema mei it laden fan ôfbyldings yn Habrastorage barde tidens de ymplemintaasje. Guon âlde publikaasjes hiene doe al gjin tekeningen, en bleaunen dêrom sa. Hjoed sille wy besykje út te finen hoefolle grafyske ynformaasje Habr hat ferlern sûnt syn berte. Boppedat kinne wy ​​miskien wat fine dat mist? Dizze "ôfbylding kin net laden wurde" is ferfelend, is it net? It detektiveferhaal fan hjoed is wijd oan krekt dit. Litte wy begjinne!

Jo binne miskien nei dit artikel brocht troch in fermelding yn tracker? Wierskynlik ferdwûn in foto út ien fan jo âlde publikaasjes, en ik fûn it. As jo ​​​​it hiele berjocht net lêze wolle, kinne jo gewoan nei de spoiler rôlje oan 'e ein (seksje Resultaten), dy't alle fûnen publikaasjes en ôfbyldings oplist. Dankewol!

Ynlieding en metoaden

Us detectiveferhaal sil fan it begjin ôf begjinne (logysk, toch?). Fan it begjin fan Habr. Hoe earder in berjocht publisearre is, hoe grutter de kâns dat der earne yn de skiednis bylden derfan ferlern gien binne. Dêrom begjinne wy ​​fan 2006 ôf en geane wy ​​wat foarút.

Alle publikaasjes fan 40 hubs dy't op it stuit oan it begjin fan 'e ranglist steane binne opnommen yn' e konsideraasje. De folsleine list fan dizze hubs wurdt presintearre ûnder de spoiler. In protte fan harren bestienen trouwens doe net, mar doe't der nije hubs kamen, waarden publikaasjes dêrhinne oerbrocht.

List fan hubs

* nix, Algoritme, Artificial Intelligence, Astronautyk, Biotechnology, Harsens, C ++, Untwikkelingsbehear, DIY, Ekology, Spultsjeûntwikkeling, Spultsjes en spultsje konsoles, Geek sûnens, Histoarje fan IT, Ynformaasjefeiligens, IT karriêre, IT-ynfrastruktuer, IT bedriuwen, Java, JavaSkript, Wetjouwing yn IT, Lifehacks foar geeks, Masine learen, Produksje en ûntwikkeling fan elektroanika, Nginx, Iepen Boarne, Personielbehear, natuerkunde, Populêre wittenskip, Product Management, Programming, projektmanagement, Python, Lêsseal, Reverse engineering, Sosjale netwurken en mienskippen, Systeembehear, Systemanalyse en ûntwerp, De takomst is hjir, Untwikkeling fan webside

De ynformaasje waard sammele mei in set PHP-skripts. Elke publikaasje waard ynladen, de ynhâld fan 'e tag waard bepaald en kontrolearre op tags binnenkant. Foar elke ôfbylding wurde keppelings nei de ôfbyldings opslein, keppele oan de publikaasje-ID op Habré. Dizze ynformaasje wurdt fierder analysearre.

Wat is publisearre en wannear

2006

Oan it begjin fan Habr wiene der net safolle publikaasjes as no, en der stiene noch minder plaatsjes yn. Yn totaal waarden 2006 berjochten publisearre yn 'e neamde hubs yn 05.06.2006 (begjinnend fan 221/53/75). 10 fan dizze berjochten befetsje yn totaal XNUMX ôfbyldings. Maksimum fan ôfbyldings (XNUMX stikken) yn in publikaasje "Tsien gadgets dy't de wrâld feroare". 50 tekeningen steane al op Habrastorage. Noch 25 binne ferlern. Se binne allegear unyk en net werhelle.

In nijsgjirrige feit: Twa fan de bylden liede ta Habr sels, mar binne al lang net beskikber. Dit binne de ôfbyldings http://www.habrahabr.ru/tmp/sup_blogs_preview.gif en http://www.habrahabr.ru/tmp/upgrade-chart.gif.

Dus, ferlern foar 2006 33.3% ôfbyldings yn publikaasjes.

2007

Yn 2007 naam it tal publikaasjes bot ta, lykas it tal bylden - 1 berjochten waarden publisearre. 713 Berjochten befetsje 599 ôfbyldings. 1 ôfbyldings waarden oerbrocht nei Habrastorage, en 467 waarden ferlern (16.2%).

In nijsgjirrige feit: Publikaasje Top 100 Mac OS-applikaasjes befettet maksimaal 2007 ôfbyldings foar 100 en befettet gjin copyright tekst.

Derneist binne guon fan dizze ferlerne ôfbyldings duplikaten. Dus, ien fan har komt 6 kear yn ien foar publikaasjes mei mar 6 pictures. Ek wurdt de ôfbylding "Up.gif" 21 kear werhelle, "Down.gif" 16 kear, en "Same.gif" 8 kear fan ien domein. En al dizze 45 bylden fan ien post, dy't mar 47 foto's befettet.

Der binne 191 unike oer.

2008

Sûnt it tal publikaasjes oer Habré fan jier nei jier mar tanommen is, sil ús detective yn 2008 2 publikaasjes besjogge, en ek 520 bylden. Wy konstatearren dat it yn 2 wie dat it tal bylden yn publikaasjes lang om let boppe it tal publikaasjes kaam. Boppedat befetsje mar 969 berjochten foto's, en in maksimum fan 2008 eleminten fan grafyske ynformaasje wurde presintearre yn 'e publikaasje "De skiednis fan Google's Holiday Logos". 1 ôfbyldings binne al bewarre op Habrastorage, en 943 binne ferlern gien (34.6%).

In nijsgjirrige feit: It meast ûnferwachte byld (of leaver, it probleem yn it ûntwerp fan 'e publikaasje) leit hjir. As resultaat besiket Habr de ôfbylding te downloaden fia http://#/.

Habra-detective: jo foto is ferlern

Rys. 1. Algemiene statistiken fan de beskôge

Is it mooglik om op syn minst wat te herstellen?

Partial restauraasje is net dreech. Bygelyks, de luiste manier soe wêze om te brûken Internet Archive yn in besykjen om opsleine publikaasjesiden te laden. Derneist kinne jo besykje de ôfbyldings sels yn it argyf te "fine" mei direkte keppelings.

Lifehack: Jo moatte kontrolearje op de oanwêzigens fan ôfbyldings yn alle ferzjes fan 'e side yn it argyf, net allinich de âldste en nijste.

Spitigernôch, hoewol dizze metoade yn guon gefallen wurket, is it sa lestich om op syn minst de helte fan 'e foto's te herstellen. Dêrom is de folgjende stap it kontrolearjen fan cross-posting, orizjinele oersettingen en, fansels, argyfkopyen fan 'e orizjinele siden.

Derneist kinne jo besykje de winske ôfbyldings te finen mei ien fan 'e net-offisjele spegels fan Habr, dy't ienris wurke en noch wat fan' e kopieare ynformaasje opslaan.

De lêste en dreechste opsje is om sykmasines te brûken. As jo ​​​​krekt witte wat yn 'e ôfbylding moat wêze (d'r is in beskriuwing en kontekst), is d'r in kâns om bestannen te finen mei deselde namme as se ienris troch ien nei in oare boarne kopiearre binne.

Fansels fergruttet elke folgjende stap de syktiid net-lineêr.

Wat wy fûnen

Jo binne miskien net te ûnder de yndruk fan it oantal oant no ta fûnen ôfbyldings - d'r binne 300 fan har (befette yn 140 publikaasjes fan 81 auteurs). As wy rekken hâlde mei it oantal "ferlies" (1), it resultaat giet oer 24.2%. Wêrom ûntbrekke d'r minder bylden dan d'r wiene? Alle nutteloze ôfbyldings (lykas werjeftetellers) en net-besteande ôfbyldings (lykas de al neamde http://#/, lykas ek http://fig.jpg/ en sa fierder).

Hoe binne jo op sa'n rûn nûmer kommen? It feit is dat sawat 300 dagen fan sykjen einige. Earst soe ik nei 333 gean, mar 300 sjocht der aardich goed út. Boppedat, op it stuit oer 33% alle "slachtoffers fan it sykjen."

Habra-detective: jo foto is ferlern

Rys. 2. Aktuele sykresultaten

Alle fûn ôfbyldings (útsein ien .bmp, dêrmei soe it 301 wêze) wurde opladen nei hsto.org, en keppelings nei har en publikaasjes, lykas yndeksen fan ôfbyldings dêryn, wurde jûn yn 'e folgjende paragraaf.

Resultaten

Dat, ûnder de spoiler binne de mei súkses fûn ôfbyldings, lykas de id fan 'e publikaasjes, de yndeks fan' e ôfbylding yn 'e tekst fan' e publikaasje (begjinnend fan 1, net fan 0) en de skriuwer fan 'e publikaasje. As jo ​​​​de skriuwer binne fan 'e neamde publikaasje, en de fûne foto's binne korrekt, korrigearje asjebleaft jo berjochten. Dankewol!

Trouwens, guon bylden binne eins noch te besjen yn publikaasjes, mar binne net oerbrocht nei Habrastorage, en dêrom kinne se op in stuit ek net beskikber wurde.

300 foto's

skriuwer
Publikaasje ID
Yndeksen en keppelings
Foarbyld:

0x62 yts
27149
1
Habra-detective: jo foto is ferlern

0xa8
11105
1

2 min
607
1

1097
1

1106
1, 2, 3, 5, 24

13836
2

4 eaze
30820
1, 2, 3, 5
Habra-detective: jo foto is ferlern

8 ynk
41853
1

46498
1

Adam_B
12582
1

Ainu
39501
1

alardus
2628
1

Alaska
23447
1, 2
Habra-detective: jo foto is ferlern

aleks_raiden
24479
2

30594
3

39037
1

40312
1, 2, 3, 4

44152
1, 2, 3

46294
1

46741
1

47782
1, 2, 3, 4, 5

alfsoft
42782
1, 2, 3, 4, 5

alizar
37779
1, 2

altblog
44677
1

arestov
37921
1

artch
19726
1

badlittleduck
16292
1, 2, 3, 4, 5

Barkov
26335
1

BBSoD
8505
1

bO_oblik
22150
1, 2, 3, 4, 5

22186
1

22215
1

22322
1, 2, 3, 4, 5, 6

22334
1, 2

22375
1, 2, 3

22510
1, 2

22614
1

22836
1, 2

26181
1, 2, 3, 4, 6

28196
1, 2, 3, 4, 5, 6, 7, 8
Habra-detective: jo foto is ferlern

29706
1, 2, 3, 4

31490
1, 2, 3, 4

36713
1

37180
1

37249
1

37306
1, 2

38013
1

38389
1, 2

41104
1, 2

41647
1

41821
1, 2

suver_v
12783
1

chulak
45783
1, 2, 3, 4, 5, 6, 7
Habra-detective: jo foto is ferlern

Coss
31069
1

CurlyBrace
11010
1

11941
1

14157
1

37303
1

dreikanter
31320
1, 2, 4

entze
40767
1

Fenniks
20843
2

23902
1

39109
1

firstbyte
38314
1

freetonik
26593
1

frujo
40987
1

garbuz
29694
1

gorinich
12027
1

Gravity
28840
1

href
46908
1, 2
Habra-detective: jo foto is ferlern

iljava
30902
2, 3

Imposeren
26566
1

invladis
42904
1

Karlsson
8971
Down.gif, Same.gif, tpci_trends.png, Up.gif

31042
1

31050
1

31141
1, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17
Habra-detective: jo foto is ferlern

Klaus
15775
1, 2, 3, 4, 5, 6, 7, 8

Lain_13
16891
2

le0 pard
38391
1

Luka Safonov
43537
1

meako
26705
1

Midgard
31419
2, 3, 4

Mio
396
1

753
1

936
1

mozayk
744
1

Mr_Floppy
28343
1

nil
44476
1

offisier
110
1

oleg_bunin
7207
1

7226
1

8679
1

12768
1

olegafx
43934
1, 2, 3, 4, 5, 6, 7, 8-9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19

ostrovityanin
37146
2, 3
Habra-detective: jo foto is ferlern

ponomar
14141
1

porchini
21850
1, 2

Pure_BY
8416
1

RAF
851
1, 2

ramber
43693
1

roasterje
44380
1

ruskar
42578
3, 5, 8
Habra-detective: jo foto is ferlern

hillich
702
1

SamDark
30104
1

Scala
37804
4

Shapelez
23260
1

44379
1, 2

46113
1

46599
1

47536
1

slaaf
8134
1, 2

smartov
17160
3

smitana
30375
1

spanasik
44755
17

spiritus_sancti
41129
1, 2
Habra-detective: jo foto is ferlern

SummerDream
3801
1

sinnebear
31211
1, 2

Omskeakelje
9095
1

Taoorus
37507
1

Thogen
38733
1

45024
1

45170
1

tsepelev
36611
1

VadimUA
46922
1

vitol
26073
1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21
Habra-detective: jo foto is ferlern

30171
1, 2, 3

XaocCPS
40036
1

284390
1

284392
1

284394
1

284396
1

yaneblog
39007
1, 6

40621
3

Yesutin
9453
1

9645
1

31078
1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12
Habra-detective: jo foto is ferlern

yshilyaev
5556
1, 2, 3

Zada
31123
2

Zig Zag
15492
1

Yn stee fan in konklúzje

Faaks sil immen beskôgje dat it werstellen fan sokke ferâldere ynformaasje gjin sin hat. En boppedat wiene guon fan 'e fûnen bylden sinleas, sels doe't se waarden publisearre. Dit is sûnder mis wier.

Elke ynformaasje is wichtich. Alteast út it eachpunt fan histoaryske analyze. Net te hawwen oer it feit dat it yn guon auteursrjochtlik beskerme materialen in wichtige rol spilet. Ja, op it stuit is Habr noch net iens 15 jier âld en guon fan 'e boarnen binne noch beskikber, mar se wurde yn 'e rin fan' e tiid minder en minder, en dêrom is it wurdich om fan tefoaren nei te tinken oft der wat oerbliuwt foar letter, of dat sil wêze in ivige "ôfbylding net beskikber."

No, ferjit net dat plakhâlders foar ûnberikbere ôfbyldings gewoan ferfelend binne. Fansels sille in pear minsken "wat âld guod" lêze, mar d'r sille sokke minsken wêze. Dêrom, om't dizze publikaasjes noch op Habré beskikber binne, moat har ynhâld sa folslein mooglik wêze.

Spitigernôch stipet Habrastorage noch gjin direkte download foar alle ôfbyldingsformaten, mar miskien wurdt dit ienris reparearre.

It lêste probleem dat ik wol neame wolle, en dêr't jo wierskynlik oer tocht hawwe, "wat as de auteur Habr in lange tiid net hat brûkt en net ynteressearre is yn it korrigearjen fan âlde dingen?" Dizze fraach is my mear as ien kear yn 'e holle opkommen, mar de oplossing hjir is net sa dreech. Alde publikaasjes kinne altyd korrizjearre wurde UFO yn 'e persoan fan moderators (do kinst, Exosfear?) of administraasje (Boomburum kin immen in taak jaan).

Wat tinke jo, is it wurdich om te besykjen op syn minst wat te herstellen?

Dat is alles foar hjoed. Tankewol foar jo oandacht en meie al jo ôfbyldings sûnder problemen opladen wurde nei Habrastorage! Lit dit net barre

Habra-detective: jo foto is ferlern

PS As jo ​​typfouten of flaters fine yn 'e tekst, lit it my dan witte. Dit kin dien wurde troch in part fan de tekst te selektearjen en op " te drukkenCtrl / ⌘ + Enter" as jo Ctrl / ⌘ hawwe, of fia privee berjochten. As beide opsjes net beskikber binne, skriuw dan oer de flaters yn 'e kommentaren. Dankewol!

PPS Miskien binne jo ek ynteressearre yn myn oare stúdzjes fan Habr, of wolle jo jo ûnderwerp foarstelle foar de folgjende publikaasje, of miskien sels in nije syklus fan publikaasjes.

Wêr te finen de list en hoe te meitsje in oanbod

Alle ynformaasje is te finen yn in spesjale repository habr-detektive. Dêr kinne jo ek útfine hokker foarstellen al útsprutsen binne, en wat der al oan it wurk is.

Ek kinne jo my neame (troch te skriuwen VaskivskyYe) yn 'e opmerkings nei in publikaasje dy't jo ynteressant liket foar ûndersyk of analyze.

Boarne: www.habr.com

Add a comment