Flott URI breytast ekki

Höfundur: Sir Tim Berners-Lee, uppfinningamaður URI, vefslóða, HTTP, HTML og veraldarvefsins, og núverandi yfirmaður W3C. Grein skrifuð árið 1998

Hvaða URI er talið „svalt“?
Einn sem breytist ekki.
Hvernig er URI breytt?
URIs breytast ekki: fólk breytir þeim.

Í orði, það er engin ástæða fyrir fólk að breyta URI (eða hætta fylgiskjölum), en í reynd eru þær milljónir.

Fræðilega séð á nafneigandi lénsnafnarýmis í raun og veru lénsnafnarýmið og þar af leiðandi allar URIs innan þess. Fyrir utan gjaldþrot kemur ekkert í veg fyrir að eigandi lénsins haldi nafninu. Og í orði, URI rýmið undir léninu þínu er algjörlega undir þínu stjórn, svo þú getur gert það eins stöðugt og þú vilt. Nánast eina góða ástæðan fyrir því að skjal hverfur af netinu er sú að fyrirtækið sem átti lénið hefur farið á hausinn eða hefur ekki lengur efni á að halda netþjóninum gangandi. Af hverju eru þá svona margir týndir hlekkir í heiminum? Sumt af þessu er einfaldlega skortur á fyrirhyggju. Hér eru nokkrar ástæður sem þú gætir heyrt:

Við endurskipulagðum síðuna til að gera hana betri.

Heldurðu virkilega að gömlu URI-mælin geti ekki virkað lengur? Ef svo er, þá valdir þú þá mjög illa. Íhugaðu að halda þeim nýju fyrir næstu endurhönnun.

Við eigum svo mikið af dóti að við getum ekki fylgst með því hvað er úrelt, hvað er trúnaðarmál og hvað á enn við, svo okkur fannst best að slökkva bara á þessu öllu.

Ég get bara haft samúð. W3C gekk í gegnum tímabil þar sem við þurftum að sigta vandlega í gegnum skjalasafn til að gæta trúnaðar áður en það var gert opinbert. Ákvörðunina ætti að íhuga fyrirfram - vertu viss um að með hverju skjali skráir þú ásættanlegan lesendahóp, sköpunardag og helst gildistíma. Vistaðu þessi lýsigögn.

Jæja, við komumst að því að við þurfum að færa skrár...

Þetta er ein ömurlegasta afsökunin. Margir vita ekki að vefþjónar leyfa þér að stjórna tengslum milli URI hlutar og raunverulegrar staðsetningu hans í skráarkerfinu. Hugsaðu um URI rýmið sem óhlutbundið rými, fullkomlega skipulagt. Gerðu síðan kortlagningu á hvaða raunveruleika sem þú notar til að átta þig á honum. Tilkynntu síðan þetta til vefþjónsins. Þú getur jafnvel skrifað þitt eigið netþjónsbút til að fá það rétt.

John heldur ekki lengur þessari skrá, Jane gerir það núna.

Var nafn Jóhannesar í URI? Nei, var skráin bara í möppunni hans? Jæja, allt í lagi.

Áður notuðum við CGI forskrift fyrir þetta, en nú notum við tvöfalda forrit.

Það er brjáluð hugmynd að síður búnar til með forskriftum ættu að vera staðsettar á "cgibin" eða "cgi" svæðinu. Þetta afhjúpar aflfræði hvernig þú rekur vefþjóninn þinn. Þú breytir vélbúnaðinum (jafnvel á meðan þú vistar efni) og úps - allar URIs þínar breytast.

Tökum National Science Foundation (NSF) sem dæmi:

NSF netskjöl

http://www.nsf.gov/cgi-bin/pubsys/browser/odbrowse.pl

Fyrsta síðan til að byrja að skoða skjöl verður greinilega ekki sú sama eftir nokkur ár. cgi-bin, oldbrowse и pl - allt þetta gefur út bita af upplýsingum um hvernig-við-gerum-það-nú. Ef þú notar síðuna til að leita að skjali er fyrsta niðurstaðan sem þú færð jafn slæm:

Skýrsla vinnuhóps um dulmálsfræði og kóðunarfræði

http://www.nsf.gov/cgi-bin/getpub?nsf9814

fyrir skjalaskrársíðuna, þó að html skjalið sjálft líti miklu betur út:

http://www.nsf.gov/pubs/1998/nsf9814/nsf9814.htm

Hér mun pubs/1998 hausinn gefa hvers kyns skjalaþjónustu í framtíðinni góða vísbendingu um að gamla 1998 skjalaflokkunarkerfið sé í gildi. Þótt skjalanúmerin kunni að líta öðruvísi út árið 2098 myndi ég ímynda mér að þessi URI væri enn í gildi og myndi ekki trufla NSF eða önnur samtök sem myndu viðhalda skjalasafninu.

Ég hélt að vefslóðir yrðu ekki að vera viðvarandi - það voru vefslóðir.

Þetta er líklega einn versti fylgifiskur URN umræðunnar. Sumir halda að vegna rannsókna á varanlegra nafnrými gætu þeir verið kærulausir um að hanga tenglum vegna þess að "URNs laga allt þetta." Ef þú ert einn af þessum mönnum, þá leyfðu mér að valda þér vonbrigðum.

Flest URN kerfi sem ég hef séð líta út eins og heimildaauðkenni og síðan annað hvort dagsetning og strengur sem þú velur, eða bara strengur sem þú velur. Þetta er mjög svipað og HTTP URI. Með öðrum orðum, ef þú heldur að fyrirtækið þitt muni geta búið til langlífa URN, þá sannaðu það núna með því að nota þau fyrir HTTP URIs þínar. Það er ekkert í HTTP sjálfu sem gerir URI þinn óstöðugan. Aðeins stofnunin þín. Búðu til gagnagrunn sem kortleggur skjalið URN við núverandi skráarheiti og láttu vefþjóninn nota það til að endurheimta skrárnar.

Ef þú hefur náð þessum tímapunkti, ef þú hefur ekki tíma, peninga og tengingar til að þróa einhvern hugbúnað, þá geturðu tilgreint eftirfarandi afsökun:

Við vildum það en við höfum bara ekki réttu verkfærin.

En þú getur haft samúð með þessu. Ég er alveg sammála. Það sem þú þarft að gera er að þvinga vefþjóninn til að flokka samstundis viðvarandi URI og skila skránni hvar sem hún er geymd í núverandi brjálaða skráarkerfi þínu. Þú vilt geyma allar URIs í skrá sem ávísun og halda gagnagrunninum alltaf uppfærðum. Þú vilt varðveita sambandið milli mismunandi útgáfur og þýðingar á sama skjali, og einnig viðhalda sjálfstæðri eftirlitssummuskrá til að tryggja að skráin skemmist ekki vegna villu fyrir slysni. Og vefþjónar koma einfaldlega ekki upp úr kassanum með þessum eiginleikum. Þegar þú vilt búa til nýtt skjal biður ritstjórinn þig um að tilgreina URI.

Þú þarft að geta breytt eignarhaldi, skjalaaðgangi, öryggi á skjalastigi o.s.frv. í URI rýminu án þess að breyta URI.

Það er allt of slæmt. En við munum leiðrétta ástandið. Hjá W3C notum við Jigedit (Jigsaw editing server) virkni sem rekur útgáfur og við gerum tilraunir með skjalagerð forskrifta. Ef þú þróar verkfæri, netþjóna og viðskiptavini skaltu fylgjast með þessu máli!

Þessi afsökun á einnig við um margar W3C síður, þar á meðal þessa: svo gerðu eins og ég segi, ekki eins og ég geri.

Af hverju ætti mér að vera sama?

Þegar þú breytir URI á netþjóninum þínum geturðu aldrei sagt alveg hver mun hafa tengla á gamla URI. Þetta geta verið tenglar frá venjulegum vefsíðum. Bókamerktu síðuna þína. URI gæti hafa verið krotað á spássíur á bréfi til vinar.

Þegar einhver fylgir hlekk og hann er bilaður missir hann yfirleitt traust á netþjónseigandanum. Hann er líka svekktur, bæði tilfinningalega og líkamlega, yfir því að geta ekki náð markmiði sínu.

Margir kvarta alltaf yfir brotnum hlekkjum og ég vona að skaðinn sé augljós. Ég vona að orðsporsskemmdir umsjónarmanns þjónsins þar sem skjalið hvarf sé líka augljóst.

Svo hvað ætti ég að gera? URI hönnun

Það er á ábyrgð vefstjóra að úthluta URI sem hægt er að nota eftir 2 ár, eftir 20 ár, eftir 200 ár. Þetta krefst hugulsemi, skipulags og ákveðni.

URIs breytast ef einhverjar upplýsingar í þeim breytast. Hvernig þú hannar þau er mjög mikilvægt. (Hvað, URI hönnun? Þarf ég að hanna URI? Já, þú ættir að hugsa um það). Hönnun þýðir í grundvallaratriðum að sleppa öllum upplýsingum í URI.

Dagsetningin sem skjalið var búið til - dagsetningin sem URI var gefin út - er eitthvað sem mun aldrei breytast. Það er mjög gagnlegt til að aðgreina fyrirspurnir sem nota nýja kerfið frá þeim sem nota gamla kerfið. Þetta er góður staður til að byrja með URI. Ef skjal er dagsett, jafnvel þótt skjalið eigi eftir að eiga við í framtíðinni, þá er þetta góð byrjun.

Eina undantekningin er síða sem er viljandi "nýjasta" útgáfan, til dæmis fyrir alla stofnunina eða stóran hluta hennar.

http://www.pathfinder.com/money/moneydaily/latest/

Þetta er nýjasti Money Daily dálkurinn í Money tímaritinu. Aðalástæðan fyrir því að ekki er þörf á dagsetningu í þessari URI er sú að það er engin ástæða til að geyma URI sem mun lifa lengur en í skránni. Hugmyndin um Money Daily mun hverfa þegar Money hverfur. Ef þú vilt tengja við efni ættir þú að tengja það sérstaklega í skjalasafninu:

http://www.pathfinder.com/money/moneydaily/1998/981212.moneyonline.html

(Lítur vel út. Gerir ráð fyrir að "peningar" muni þýða það sama í gegnum lífið á pathfinder.com. Það er afrit "98" og óþarfa ".html", en lítur að öðru leyti út eins og sterkur URI.

Hvað á að skilja til hliðar

Allt! Burtséð frá stofnunardeginum er það að setja allar upplýsingar í URI biðja um vandræði á einn eða annan hátt.

  • Nafn höfundar. Höfundarréttur gæti breyst eftir því sem nýjar útgáfur verða fáanlegar. Fólk yfirgefur samtök og miðlar hlutum til annarra.
  • Efni. Það er mjög erfitt. Það lítur alltaf vel út í fyrstu, en breytist furðu fljótt. Ég mun tala meira um þetta hér að neðan.
  • Staða. Möppur eins og "gamalt", "uppkast" og svo framvegis, svo ekki sé minnst á "nýjasta" og "svalt", birtast í öllum skráarkerfum. Skjöl breyta stöðu - annars væri ekkert vit í að búa til drög. Nýjasta útgáfan af skjali þarf viðvarandi auðkenni, óháð stöðu þess. Haltu stöðunni utan nafnsins.
  • Aðgangur. Við hjá W3C höfum skipt síðunni í hluta fyrir starfsmenn, meðlimi og almenning. Þetta hljómar vel, en auðvitað byrja skjöl sem teymishugmyndir frá starfsfólki, ræddar við félagsmenn og verða síðan almenningi. Það væri í raun synd ef í hvert skipti sem skjal er opnað fyrir víðtækari umræðu, brotna allir gömlu krækjurnar á það! Nú förum við yfir í einfaldan dagsetningarkóða.
  • Skráarviðbót. Mjög algengur viðburður. "cgi", jafnvel ".html" mun breytast í framtíðinni. Þú gætir ekki notað HTML fyrir þessa síðu eftir 20 ár, en tenglar í dag á hana ættu samt að virka. Canonical hlekkir á W3C síðunni nota ekki viðbótina (hvernig það er gert).
  • Hugbúnaðarkerfi. Í URI, leitaðu að "cgi", "exec" og öðrum hugtökum sem öskra "sjáðu hvaða hugbúnað við erum að nota." Vill einhver eyða öllu lífi sínu í að skrifa Perl CGI forskriftir? Nei? Fjarlægðu síðan .pl endinguna. Lestu netþjónshandbókina um hvernig á að gera þetta.
  • Nafn disks. Láttu ekki svona! En ég hef séð þetta.

Svo besta dæmið frá síðunni okkar er einfaldlega

http://www.w3.org/1998/12/01/chairs

... skýrslu um fundargerð W3C formannafundar.

Efni og flokkun eftir efni

Ég mun fara nánar út í þessa hættu, þar sem hún er eitt af því sem erfiðast er að forðast. Venjulega lenda efni í URI þegar þú flokkar skjölin þín eftir vinnunni sem þau vinna. En þessi sundurliðun mun breytast með tímanum. Nöfn svæðanna munu breytast. Hjá W3C vildum við breyta MarkUP í Markup og síðan í HTML til að endurspegla raunverulegt innihald hlutans. Auk þess er oft flatt nafnrými. Ertu viss um að þú viljir ekki endurnýta neitt eftir 100 ár? Á okkar stutta ævi höfum við nú þegar viljað endurnýta „Saga“ og „Stílblöð“ til dæmis.

Það er freistandi leið til að skipuleggja vefsíðu – og sannarlega freistandi leið til að skipuleggja hvað sem er, þar með talið allan vefinn. Þetta er frábær lausn til meðallangs tíma en hefur alvarlega annmarka til lengri tíma litið.

Hluti af ástæðunni liggur í heimspeki merkingar. Hvert hugtak á tungumáli er hugsanlegt skotmark fyrir klasa og hver einstaklingur getur haft aðra hugmynd um hvað það þýðir. Þar sem tengslin milli eininga eru meira eins og vefur en tré, geta jafnvel þeir sem eru sammála vefnum valið aðra framsetningu á trénu. Þetta eru (oft endurteknar) almennar athuganir mínar um hætturnar af stigveldisflokkun sem almennri lausn.

Reyndar, þegar þú notar efnisheiti í URI, ertu að skuldbinda þig til einhvers konar flokkunar. Kannski í framtíðinni muntu kjósa annan valkost. URI verður þá viðkvæmt fyrir broti.

Ástæðan fyrir því að nota efnissvið sem hluta af URI er sú að ábyrgð á undirköflum URI rýmisins er venjulega úthlutað og þá þarf nafn skipulagsstofnunar - deildar, hóps eða hvað sem er - sem ber ábyrgð á því undirrými. Þetta er URI sem er bindandi við skipulag. Það er venjulega aðeins öruggt ef lengra (vinstri) URI er varið með dagsetningu: 1998/pics gæti þýtt fyrir netþjóninn þinn "það sem við áttum við árið 1998 með myndum" frekar en "það sem árið 1998 gerðum við með því sem við köllum núna myndir."

Ekki gleyma léninu

Mundu að þetta á ekki aðeins við um slóðina í URI, heldur einnig um nafn netþjónsins. Ef þú ert með aðskilda netþjóna fyrir mismunandi hluti, mundu að þessari skiptingu verður ómögulegt að breyta án þess að eyðileggja marga, marga tengla. Nokkrar klassískar „kíktu á hugbúnaðinn sem við notum í dag“ mistök eru lénsheiti „cgi.pathfinder.com“, „secure“, „lists.w3.org“. Þau eru hönnuð til að gera stjórnun netþjóna auðveldari. Óháð því hvort lén táknar deild í fyrirtækinu þínu, skjalastöðu, aðgangsstig eða öryggisstig, vertu mjög, mjög varkár áður en þú notar fleiri en eitt lén fyrir margar skjalagerðir. Mundu að þú getur falið marga vefþjóna inni á einum sýnilegum vefþjóni með því að nota tilvísun og umboð.

Ó, og hugsaðu líka um lénið þitt. Þú vilt ekki vera nefndur soap.com eftir að þú skiptir um vörulínur og hættir að búa til sápu (Afsakið sá sem á soap.com í augnablikinu).

Ályktun

Að varðveita URI í 2, 20, 200 eða jafnvel 2000 ár er augljóslega ekki eins auðvelt og það virðist. Hins vegar, alls staðar á netinu, eru vefstjórar að taka ákvarðanir sem gera þetta verkefni mjög erfitt fyrir sig í framtíðinni. Oft er þetta vegna þess að þeir nota verkfæri sem hafa það hlutverk að kynna bestu síðuna aðeins í augnablikinu - og enginn hefur metið hvað verður um tenglana þegar allt breytist. Hins vegar er málið hér að margt, margt getur breyst, og URIs þínar geta og ættu að vera þær sömu. Þetta er aðeins mögulegt þegar þú hugsar um hvernig þú býrð þá til.

Sjá einnig:

Viðbætur

Hvernig á að fjarlægja skráarviðbætur...

...frá URI á núverandi vefþjóni sem byggir á skrám?

Ef þú notar Apache, til dæmis, geturðu stillt það til að semja um efni. Vistaðu skráarendingu (t.d. .png) í skrá (t.d. mydog.png), en þú getur tengt við vefforrit án þess. Apache athugar síðan möppuna fyrir allar skrár með því nafni og hvaða ending sem er og getur valið þá bestu úr settinu (til dæmis GIF og PNG). Og það er engin þörf á að setja mismunandi gerðir af skrám í mismunandi möppur, í raun mun samsvörun efnis ekki virka ef þú gerir það.

  • Settu upp netþjóninn þinn til að semja um efni
  • Tengdu alltaf við URI án framlengingar

Tenglar við viðbætur munu enn virka, en koma í veg fyrir að netþjónninn þinn velji besta sniðið sem til er í augnablikinu og í framtíðinni.

(Reyndar, mydog, mydog.png и mydog.gif — gildar vefauðlindir, mydog er alhliða efnistegund, og mydog.png и mydog.gif — auðlindir af tiltekinni efnistegund).

Auðvitað, ef þú ert að skrifa þinn eigin vefþjón, er góð hugmynd að nota gagnagrunn til að binda viðvarandi auðkenni við núverandi form, þó varast ótakmarkaðan gagnagrunnsvöxt.

The Board of Shame - Saga 1: Rás 7

Árið 1999 fylgdist ég með lokunum skóla vegna snjóa á bls http://www.whdh.com/stormforce/closings.shtml. Ekki bíða eftir að upplýsingarnar birtist neðst á sjónvarpsskjánum! Ég linkaði á það af heimasíðunni minni. Fyrsti stóri snjóstormurinn 2000 kemur og ég skoða síðuna. Þar stendur skrifað:,

- Frá.
Ekkert er lokað eins og er. Vinsamlegast snúið aftur ef veðurviðvaranir koma upp.

Það getur ekki verið svona sterkur stormur. Það er fyndið að það vanti dagsetninguna. En ef þú ferð á aðalsíðu síðunnar verður stór hnappur „Lokaðir skólar“ sem leiðir á síðuna http://www.whdh.com/stormforce/ með langan lista yfir lokaða skóla.

Kannski breyttu þeir kerfinu til að fá listann - en þeir þurftu ekki að breyta URI.

Board of Shame - Saga 2: Microsoft Netmeeting

Með vaxandi ósjálfstæði á internetinu kom snjöll hugmynd að hægt væri að fella tengla á vefsíðu framleiðandans inn í forrit. Þetta hefur verið notað og misnotað mikið, en þú getur ekki breytt slóðinni. Um daginn prófaði ég tengil frá Microsoft Netmeeting 2/eitthvað biðlara í Help/Microsoft on the Web/Free stuff valmyndinni og fékk 404 villu - ekkert svar frá þjóninum fannst. Kannski er það þegar búið að laga...

© 1998 Tim BL

Söguleg athugasemd: Seint á 20. öld, þegar þetta var skrifað, var „svalt“ merki um velþóknun, sérstaklega meðal ungs fólks, sem gaf til kynna tísku, gæði eða viðeigandi. Í flýti var URI leiðin oft valin fyrir "svala" frekar en notagildi eða endingu. Þessi færsla er tilraun til að beina orkunni á bak við leitina að köldu.

Heimild: www.habr.com

Bæta við athugasemd