ForŔie URI nemainās

Autors: sers Tims Berners-LÄ«, URI, URL, HTTP, HTML un globālā tÄ«mekļa izgudrotājs un paÅ”reizējais W3C vadÄ«tājs. Raksts tapis 1998. gadā

KurŔ URI tiek uzskatīts par "forŔu"?
Tāds, kas nemainās.
Kā tiek mainīti URI?
URI nemainās: cilvēki tos maina.

Teorētiski cilvēkiem nav iemesla mainÄ«t URI (vai pārtraukt apliecinoÅ”us dokumentus), taču praksē to ir miljoniem.

Teorētiski domēna nosaukumvietas nominālajam Ä«paÅ”niekam faktiski pieder domēna nosaukumvieta un lÄ«dz ar to arÄ« visi tajā esoÅ”ie URI. Izņemot maksātnespēju, nekas neliedz domēna vārda Ä«paÅ”niekam saglabāt nosaukumu. Un teorētiski URI telpa zem jÅ«su domēna vārda ir pilnÄ«bā jÅ«su kontrolē, tāpēc varat to padarÄ«t tik stabilu, cik vēlaties. GandrÄ«z vienÄ«gais pareizais iemesls dokumenta pazuÅ”anai no interneta ir tas, ka uzņēmums, kuram piederēja domēna vārds, ir pārtraucis darbÄ«bu vai vairs nevar atļauties uzturēt serveri. Tad kāpēc pasaulē ir tik daudz trÅ«kstoÅ”o posmu? Daļa no tā ir vienkārÅ”i apdomas trÅ«kums. Å eit ir daži iemesli, ko jÅ«s varētu dzirdēt:

Mēs tikko pārkārtojām vietni, lai to uzlabotu.

Vai jÅ«s tieŔām domājat, ka vecie URI vairs nevar darboties? Ja tā, tad jÅ«s tos izvēlējāties ļoti slikti. Apsveriet iespēju paturēt jaunos nākamajai pārprojektÄ“Å”anai.

Mums ir tik daudz lietu, ka nevaram izsekot, kas ir novecojis, kas ir konfidenciāls un kas joprojām ir aktuāls, tāpēc uzskatÄ«jām, ka labāk to visu vienkārÅ”i izslēgt.

Varu tikai just lÄ«dzi. W3C piedzÄ«voja periodu, kad mums bija rÅ«pÄ«gi jāizsijā arhÄ«va materiāli, lai nodroÅ”inātu konfidencialitāti, pirms tie tika publiskoti. Lēmumu vajadzētu pārdomāt jau iepriekÅ” ā€“ pārliecinieties, ka pie katra dokumenta ierakstāt pieņemamo lasÄ«tāju loku, izveidoÅ”anas datumu un ideālā gadÄ«jumā derÄ«guma termiņu. Saglabājiet Å”os metadatus.

Nu, mēs atklājām, ka mums ir jāpārvieto faili...

Å is ir viens no nožēlojamākajiem attaisnojumiem. Daudzi cilvēki nezina, ka tÄ«mekļa serveri ļauj kontrolēt attiecÄ«bas starp objekta URI un tā faktisko atraÅ”anās vietu failu sistēmā. Uztveriet URI telpu kā abstraktu telpu, kas ir lieliski sakārtota. Pēc tam izveidojiet kartÄ“Å”anu jebkurai realitātei, kuru faktiski izmantojat, lai to realizētu. Pēc tam ziņojiet par to tÄ«mekļa serverim. Varat pat uzrakstÄ«t savu servera fragmentu, lai tas bÅ«tu pareizi.

Džons vairs neuztur Ŕo failu, tagad to dara Džeina.

Vai Jāņa vārds bija URI? Nē, vai fails bija tikai viņa direktorijā? Nu labi.

IepriekÅ” Å”im nolÅ«kam izmantojām CGI skriptu, bet tagad mēs izmantojam bināro programmu.

Ir traka ideja, ka ar skriptiem veidotām lapām jāatrodas "cgibin" vai "cgi" zonā. Tas atklāj tīmekļa servera darbības mehānismus. Jūs maināt mehānismu (pat saglabājot saturu), un ak, visi jūsu URI mainās.

Ņemiet, piemēram, Nacionālo zinātnes fondu (NSF):

NSF tieŔsaistes dokumenti

http://www.nsf.gov/cgi-bin/pubsys/browser/odbrowse.pl

Pirmā lapa, kurā sākt skatÄ«t dokumentus, noteikti nepaliks tā pati pēc dažiem gadiem. cgi-bin, oldbrowse Šø pl - tas viss sniedz informāciju par to, kā mēs to darām tagad. Ja izmantojat lapu, lai meklētu dokumentu, pirmais iegÅ«tais rezultāts ir tikpat slikts:

KriptoloÄ£ijas un kodÄ“Å”anas teorijas darba grupas ziņojums

http://www.nsf.gov/cgi-bin/getpub?nsf9814

dokumenta rādītāja lapai, lai gan pats html dokuments izskatās daudz labāk:

http://www.nsf.gov/pubs/1998/nsf9814/nsf9814.htm

Å eit pubs/1998 galvene sniegs jebkuram turpmākam arhÄ«va dienestam labu nojausmu, ka ir spēkā vecā 1998. gada dokumentu klasifikācijas shēma. Lai gan 2098. gadā dokumentu numuri var izskatÄ«ties citādi, es varētu iedomāties, ka Å”is URI joprojām bÅ«tu derÄ«gs un netraucēs NSF vai kādai citai organizācijai, kas uzturētu arhÄ«vu.

Es nedomāju, ka vietrāžiem URL ir jābÅ«t pastāvÄ«giem ā€” bija URN.

Å Ä«, iespējams, ir viena no URN debaÅ”u sliktākajām blakusparādÄ«bām. Daži cilvēki domā, ka pastāvÄ«gākas nosaukumvietas izpētes dēļ viņi varētu bÅ«t neuzmanÄ«gi pret saitēm, jo ā€‹ā€‹"URN to visu novērsÄ«s". Ja jÅ«s esat viens no Å”iem cilvēkiem, ļaujiet man jÅ«s pievilt.

Lielākā daļa URN shēmu, ko esmu redzējis, izskatās kā autoritātes identifikators, kam seko datums un jÅ«su atlasÄ«tā virkne vai tikai jÅ«su atlasÄ«tā virkne. Tas ir ļoti lÄ«dzÄ«gs HTTP URI. Citiem vārdiem sakot, ja domājat, ka jÅ«su organizācija spēs izveidot ilgstoÅ”us URN, pierādiet to tÅ«lÄ«t, izmantojot tos saviem HTTP URI. PaŔā HTTP nav nekā tāda, kas padarÄ«tu jÅ«su URI nestabilu. Tikai jÅ«su organizācija. Izveidojiet datu bāzi, kas kartē dokumenta URN ar paÅ”reizējo faila nosaukumu, un ļaujiet tÄ«mekļa serverim to izmantot, lai faktiski izgÅ«tu failus.

Ja esat sasniedzis Ŕo punktu, ja jums nav laika, naudas un savienojumu, lai izstrādātu kādu programmatūru, varat norādīt Ŕādu attaisnojumu:

Mēs gribējām, bet mums vienkārÅ”i nav pareizo instrumentu.

Bet jÅ«s varat just lÄ«dzi Å”im. PilnÄ«gi piekrÄ«tu. Jums ir jāpiespiež tÄ«mekļa serveris nekavējoties parsēt pastāvÄ«go URI un atgriezt failu jebkurā vietā, kur tas paÅ”laik tiek glabāts jÅ«su paÅ”reizējā trakajā failu sistēmā. JÅ«s vēlaties saglabāt visus URI failā kā čeku un pastāvÄ«gi atjaunināt datubāzi. JÅ«s vēlaties saglabāt attiecÄ«bas starp viena un tā paÅ”a dokumenta dažādām versijām un tulkojumiem, kā arÄ« uzturēt neatkarÄ«gu kontrolsummas ierakstu, lai nodroÅ”inātu, ka fails nav bojāts nejauÅ”as kļūdas dēļ. Un tÄ«mekļa serveri vienkārÅ”i neizdodas ar Ŕīm funkcijām. Kad vēlaties izveidot jaunu dokumentu, redaktors lÅ«dz norādÄ«t URI.

Jums ir jābÅ«t iespējai mainÄ«t Ä«paÅ”umtiesÄ«bas, piekļuvi dokumentiem, arhÄ«va lÄ«meņa droŔību utt. URI telpā, nemainot URI.

Tas viss ir pārāk slikti. Bet mēs situāciju labosim. W3C mēs izmantojam Jigedit (finierzāģa rediģēŔanas servera) funkcionalitāti, kas izseko versijas, un mēs eksperimentējam ar dokumentu Ä£enerÄ“Å”anas skriptiem. Ja izstrādājat rÄ«kus, serverus un klientus, pievērsiet uzmanÄ«bu Å”ai problēmai!

Šis attaisnojums attiecas arī uz daudzām W3C lapām, tostarp Ŕo: dariet, kā es saku, nevis kā es.

Kāpēc man tas būtu jārūpējas?

Mainot URI savā serverī, jūs nekad nevarēsit pilnībā noteikt, kam būs saites uz veco URI. Tās var būt saites no parastajām tīmekļa lapām. Atzīmējiet savu lapu ar grāmatzīmi. Iespējams, ka URI ir uzrakstīts draugam adresētas vēstules malās.

Ja kāds seko saitei un tā tiek bojāta, viņŔ parasti zaudē uzticÄ«bu servera Ä«paÅ”niekam. ViņŔ ir arÄ« neapmierināts gan emocionāli, gan fiziski, jo nespēj sasniegt savu mērÄ·i.

Daudzi cilvēki visu laiku sūdzas par bojātām saitēm, un es ceru, ka kaitējums ir acīmredzams. Ceru, ka arī tā servera uzturētāja reputācijas kaitējums, kurā pazuda dokuments, ir acīmredzams.

Tātad, kas man jādara? URI dizains

TÄ«mekļa pārziņa pienākums ir pieŔķirt URI, ko var izmantot 2 gados, 20 gados, 200 gados. Tas prasa pārdomātÄ«bu, organizētÄ«bu un apņēmÄ«bu.

URI mainās, ja mainās kāda informācija tajos. Ir ļoti svarÄ«gi, kā jÅ«s tos izstrādājat. (Kas, URI dizains? Vai man ir jāveido URI? Jā, jums par to vajadzētu padomāt). Dizains bÅ«tÄ«bā nozÄ«mē jebkādas informācijas izslēgÅ”anu URI.

Dokumenta izveides datums ā€” URI izdoÅ”anas datums ā€” tas nekad nemainÄ«sies. Tas ir ļoti noderÄ«gi, lai atdalÄ«tu vaicājumus, kas izmanto jauno sistēmu, no tiem, kas izmanto veco sistēmu. Å Ä« ir laba vieta, kur sākt ar URI. Ja dokuments ir datēts, pat ja dokuments bÅ«s aktuāls nākotnē, tas ir labs sākums.

Vienīgais izņēmums ir lapa, kas apzināti ir "jaunākā" versija, piemēram, visai organizācijai vai lielai tās daļai.

http://www.pathfinder.com/money/moneydaily/latest/

Å Ä« ir jaunākā Money Daily sleja žurnālā Money. Galvenais iemesls, kāpēc Å”ajā URI nav nepiecieÅ”ams datums, ir tas, ka nav iemesla saglabāt URI, kas pārsniegs žurnāla darbÄ«bu. Money Daily jēdziens pazudÄ«s, kad pazudÄ«s nauda. Ja vēlaties izveidot saiti uz saturu, izveidojiet saiti uz to atseviŔķi arhÄ«vā:

http://www.pathfinder.com/money/moneydaily/1998/981212.moneyonline.html

(Izskatās labi. Pieņem, ka "nauda" nozÄ«mēs vienu un to paÅ”u visā pathfinder.com darbÄ«bas laikā. Ir dublikāts "98" un nevajadzÄ«gs ".html", bet citādi izskatās pēc spēcÄ«ga URI.

Ko atstāt malā

Visi! NeatkarÄ«gi no izveides datuma jebkuras informācijas ievietoÅ”ana URI vienā vai otrā veidā rada problēmas.

  • Autora vārds. AutorÄ«ba var mainÄ«ties, tiklÄ«dz bÅ«s pieejamas jaunas versijas. Cilvēki pamet organizācijas un nodod lietas citiem.
  • PriekÅ”mets. Tas ir ļoti grÅ«ti. Sākumā tas vienmēr izskatās labi, bet pārsteidzoÅ”i ātri mainās. Es par to vairāk pastāstÄ«Å”u tālāk.
  • Status. Katalogi, piemēram, "vecais", "melnraksts" un tā tālāk, nemaz nerunājot par "jaunāko" un "atdzist", parādās visās failu sistēmās. Dokumentiem mainās statuss ā€“ citādi nebÅ«tu jēgas veidot melnrakstus. Jaunākajā dokumenta versijā ir nepiecieÅ”ams pastāvÄ«gs identifikators neatkarÄ«gi no tā statusa. Neizmantojiet statusu nosaukumā.
  • Piekļuve. W3C mēs esam sadalÄ«juÅ”i vietni sadaļās darbiniekiem, dalÄ«bniekiem un sabiedrÄ«bai. Tas izklausās labi, taču, protams, dokumenti sākas kā darbinieku komandas idejas, tiek apspriesti ar dalÄ«bniekiem un pēc tam kļūst publiski zināmi. TieŔām bÅ«tu žēl, ja katru reizi, kad kāds dokuments tiek atvērts plaŔākai diskusijai, visas vecās saites uz to tiek pārrautas! Tagad mēs pārejam pie vienkārÅ”a datuma koda.
  • Faila paplaÅ”inājums. Ä»oti izplatÄ«ta parādÄ«ba. "cgi", pat ".html" nākotnē mainÄ«sies. Iespējams, ka Å”ajā lapā neizmantosiet HTML 20 gadus, taču Å”odienas saitēm uz to joprojām vajadzētu darboties. Kanoniskās saites W3C vietnē neizmanto paplaÅ”inājumu (kā tas tiek darÄ«ts).
  • ProgrammatÅ«ras mehānismi. URI meklējiet "cgi", "exec" un citus terminus, kas kliedz "paskatieties, kādu programmatÅ«ru mēs izmantojam." Vai kāds vēlas pavadÄ«t visu savu dzÄ«vi, rakstot Perl CGI skriptus? Nē? Pēc tam noņemiet paplaÅ”inājumu .pl. Izlasiet servera rokasgrāmatu, kā to izdarÄ«t.
  • Diska nosaukums. Aiziet! Bet es esmu redzējis Å”o.

Tāpēc labākais piemērs no mÅ«su vietnes ir vienkārÅ”i

http://www.w3.org/1998/12/01/chairs

... ziņot par W3C priekÅ”sēdētāju sanāksmes protokolu.

Tēmas un klasifikācija pa tēmām

Es runāŔu sÄ«kāk par Ŕīm briesmām, jo ā€‹ā€‹tā ir viena no tām lietām, no kurām ir visgrÅ«tāk izvairÄ«ties. Parasti tēmas nonāk URI, kad klasificējat dokumentus pēc to veiktā darba. Bet Å”is sadalÄ«jums laika gaitā mainÄ«sies. Apgabalu nosaukumi mainÄ«sies. W3C mēs vēlējāmies mainÄ«t MarkUP uz Markup un pēc tam uz HTML, lai atspoguļotu sadaļas faktisko saturu. Turklāt bieži vien ir plakana nosaukumu telpa. Vai esat pārliecināts, ka pēc 100 gadiem neko nevēlēsities izmantot atkārtoti? MÅ«su Ä«sajā mūžā mēs jau esam vēlējuÅ”ies atkārtoti izmantot, piemēram, "Vēsturi" un "Stila lapas".

Tas ir vilinoÅ”s veids, kā organizēt vietni, un patiesi vilinoÅ”s veids, kā sakārtot jebko, tostarp visu tÄ«mekli. Tas ir lielisks vidēja termiņa risinājums, taču ilgtermiņā tam ir nopietni trÅ«kumi.

Daļa iemesla slēpjas jēgas filozofijā. Katrs termins valodā ir potenciāls klasteru veidoÅ”anas mērÄ·is, un katrai personai var bÅ«t atŔķirÄ«gs priekÅ”stats par to, ko tas nozÄ«mē. Tā kā attiecÄ«bas starp entÄ«tijām ir vairāk kā tÄ«meklis, nevis koks, pat tie, kas piekrÄ«t tÄ«meklim, var izvēlēties citu koka attēlojumu. Å ie ir mani (bieži atkārtoti) vispārÄ«gie novērojumi par hierarhiskas klasifikācijas kā vispārēja risinājuma briesmām.

Faktiski, izmantojot tēmas nosaukumu URI, jÅ«s veicat sava veida klasifikāciju. Iespējams, nākotnē jÅ«s dosiet priekÅ”roku citai iespējai. Pēc tam URI var tikt pārkāpts.

Tēmas apgabala izmantoÅ”anas iemesls kā daļa no URI ir tāds, ka parasti tiek deleģēta atbildÄ«ba par URI telpas apakÅ”sadaļām, un pēc tam jums ir nepiecieÅ”ams tās organizatoriskās struktÅ«ras nosaukums ā€” nodaļa, grupa vai kāds cits ā€”, kas ir atbildÄ«ga par Å”o apakÅ”telpu. Å is ir URI, kas ir saistÄ«ts ar organizatorisko struktÅ«ru. Parasti tas ir droÅ”i tikai tad, ja tālākais (kreisais) URI ir aizsargāts ar datumu: 1998/pics jÅ«su serverim var nozÄ«mēt "to, ko mēs domājām 1998. gadā ar attēliem", nevis "ko mēs darÄ«jām 1998. gadā ar to, ko mēs tagad saucam par attēliem".

Neaizmirstiet domēna nosaukumu

Atcerieties, ka tas attiecas ne tikai uz ceļu URI, bet arÄ« uz servera nosaukumu. Ja jums ir atseviŔķi serveri dažādām lietām, atcerieties, ka Å”o sadalÄ«jumu nebÅ«s iespējams mainÄ«t, neiznÄ«cinot daudzas jo daudzas saites. Dažas klasiskās kļūdas "skatieties uz programmatÅ«ru, ko mēs izmantojam Å”odien" ir domēna nosaukumi "cgi.pathfinder.com", "secure", "lists.w3.org". Tie ir paredzēti, lai atvieglotu servera administrÄ“Å”anu. NeatkarÄ«gi no tā, vai domēns apzÄ«mē jÅ«su uzņēmuma nodaļu, dokumenta statusu, piekļuves lÄ«meni vai droŔības lÄ«meni, esiet ļoti, ļoti uzmanÄ«gs, pirms vairākiem dokumentu veidiem izmantojat vairāk nekā vienu domēna nosaukumu. Atcerieties, ka vienā redzamā tÄ«mekļa serverÄ« varat paslēpt vairākus tÄ«mekļa serverus, izmantojot novirzÄ«Å”anu un starpniekserveri.

Ak, un padomājiet arÄ« par savu domēna nosaukumu. JÅ«s nevēlaties, lai jÅ«s sauktu par vietni soap.com pēc tam, kad esat mainÄ«jis produktu lÄ«nijas un pārtraucis gatavot ziepes (atvainojiet tiem, kam Å”obrÄ«d pieder vietne soap.com).

Secinājums

Saglabāt URI 2, 20, 200 vai pat 2000 gadus acÄ«mredzot nav tik vienkārÅ”i, kā Ŕķiet. Tomēr visā internetā tÄ«mekļa pārziņi pieņem lēmumus, kas viņiem nākotnē patieŔām apgrÅ«tina Å”o uzdevumu. Bieži vien tas notiek tāpēc, ka viņi izmanto rÄ«kus, kuru uzdevums ir prezentēt tikai Å”obrÄ«d labāko vietni ā€“ un neviens nav novērtējis, kas notiks ar saitēm, kad viss mainÄ«sies. Tomēr Å”eit ir runa par to, ka daudzas jo daudzas lietas var mainÄ«ties, un jÅ«su URI var un tiem ir jāpaliek nemainÄ«giem. Tas ir iespējams tikai tad, ja domājat par to, kā jÅ«s tos izveidojat.

Skatiet arī:

Papildinājumi

Kā noņemt failu paplaÅ”inājumus...

...no URI paÅ”reizējā faila tÄ«mekļa serverÄ«?

Piemēram, ja izmantojat Apache, varat to konfigurēt, lai apspriestu saturu. Saglabājiet faila paplaÅ”inājumu (piem., .png) failā (piem. mydog.png), taču varat izveidot saiti uz tÄ«mekļa resursu arÄ« bez tā. Pēc tam Apache pārbauda direktoriju visiem failiem ar Ŕādu nosaukumu un jebkuru paplaÅ”inājumu un var izvēlēties labāko no kopas (piemēram, GIF un PNG). Un nav nepiecieÅ”ams ievietot dažāda veida failus dažādos direktorijos, patiesÄ«bā satura saskaņoÅ”ana nedarbosies, ja to darÄ«sit.

  • Iestatiet serveri, lai apspriestu saturu
  • Vienmēr saite uz URI bez paplaÅ”inājuma

Saites ar paplaÅ”inājumiem joprojām darbosies, taču neļaus jÅ«su serverim izvēlēties labāko paÅ”laik un turpmāk pieejamo formātu.

(PatiesÄ«bā, mydog, mydog.png Šø mydog.gif ā€” derÄ«gi tÄ«mekļa resursi, mydog ir universāls satura tipa resurss, un mydog.png Šø mydog.gif ā€” noteikta satura veida resursi).

Protams, ja rakstāt savu tÄ«mekļa serveri, ieteicams izmantot datu bāzi, lai saistÄ«tu pastāvÄ«gos identifikatorus ar to paÅ”reizējo formu, lai gan uzmanieties no neierobežotas datu bāzes pieauguma.

Kauna dēlis ā€” 1. stāsts: 7. kanāls

1999. gadā es lapā izsekoju skolu slēgÅ”anai sniega dēļ http://www.whdh.com/stormforce/closings.shtml. Negaidiet, kad informācija parādÄ«sies televizora ekrāna apakŔā! Es saiti uz to no savas mājas lapas. Pienāk pirmā lielā sniega vētra 2000 un es pārbaudu lapu. Tur rakstÄ«ts:,

- No plkst.
PaÅ”laik nekas nav slēgts. LÅ«dzu, atgriezieties laikapstākļu brÄ«dinājumu gadÄ«jumā.

Tā nevar bÅ«t tik spēcÄ«ga vētra. SmieklÄ«gi, ka trÅ«kst datuma. Bet, ja dodaties uz vietnes galveno lapu, tur bÅ«s liela poga ā€œSlēgtās skolasā€, kas ved uz lapu http://www.whdh.com/stormforce/ ar garu slēgto skolu sarakstu.

VarbÅ«t viņi mainÄ«ja sistēmu saraksta iegÅ«Å”anai, taču viņiem nebija jāmaina URI.

Kauna dēlis ā€” 2. stāsts: Microsoft Netmeeting

Pieaugot atkarÄ«bai no interneta, radās gudra ideja, ka lietojumprogrammās varētu iegult saites uz ražotāja vietni. Tas ir daudz izmantots un ļaunprātÄ«gi izmantots, taču jÅ«s nevarat mainÄ«t URL. Tikko citu dienu es izmēģināju saiti no Microsoft Netmeeting 2/something klienta izvēlnē Help/Microsoft on the Web/Free stuff un saņēmu kļūdu 404 ā€” atbilde no servera netika atrasta. VarbÅ«t tas jau ir izlabots...

Ā© 1998 Tims BL

Vēsturiska piezÄ«me: 20. gadsimta beigās, kad tas tika uzrakstÄ«ts, "vēss" bija apstiprinājuma epitets, Ä«paÅ”i jaunieÅ”u vidÅ«, norādot uz modernitāti, kvalitāti vai piemērotÄ«bu. Steidzoties, URI ceļŔ bieži tika izvēlēts "vēsuma" dēļ, nevis lietderÄ«bas vai izturÄ«bas dēļ. Å is ieraksts ir mēģinājums novirzÄ«t enerÄ£iju, kas slēpjas vēsuma meklējumos.

Avots: www.habr.com

Pievieno komentāru