Cool URIs änneren net

Auteur: Sir Tim Berners-Lee, Erfinder vun URIs, URLen, HTTP, HTML an de World Wide Web, an aktuelle Chef vun der W3C. Artikel geschriwwen am Joer 1998

Wéi eng URI gëtt als "cool" ugesinn?
Een deen net ännert.
Wéi ginn URIs geännert?
URIs änneren net: d'Leit änneren se.

An der Theorie gëtt et kee Grond fir d'Leit URIs z'änneren (oder ophalen Dokumenter z'ënnerstëtzen), awer an der Praxis ginn et Millioune vun hinnen.

An der Theorie besëtzt den nominelle Besëtzer vun engem Domain Nummraum tatsächlech den Domain Nummraum an dofir all d'URIs dobannen. Ausser Insolvenz verhënnert näischt dem Besëtzer vun engem Domain Numm den Numm ze halen. An an der Theorie ass den URI Raum ënner Ärem Domain Numm ganz ënner Ärer Kontroll, sou datt Dir et esou stabil maache kënnt wéi Dir wëllt. Zimlech deen eenzege gudde Grond fir en Dokument vum Internet ze verschwannen ass datt d'Firma, déi den Domain Numm gehéiert, aus dem Geschäft gaang ass oder sech net méi leeschte kann de Server lafend ze halen. Da firwat ginn et sou vill vermësst Linken op der Welt? E puer vun dësem ass einfach e Manktem u Viraussoen. Hei sinn e puer Grënn déi Dir héiert:

Mir hunn de Site just nei organiséiert fir et besser ze maachen.

Denkt Dir wierklech datt déi al URIs net méi funktionnéiere kënnen? Wann jo, dann hutt Dir se ganz schlecht gewielt. Betruecht déi nei ze halen fir déi nächst Redesign.

Mir hunn esou vill Saachen, datt mir net kënne verfollegen wat net aktuell ass, wat vertraulech ass, a wat nach relevant ass, also hu mir et am beschten geduecht dat alles auszeschalten.

Ech kann nëmme sympathiséieren. W3C ass duerch eng Period gaang wou mir suergfälteg duerch d'Archivmaterial fir Vertraulechkeet hu misse siche ier se ëffentlech gemaach goufen. D'Decisioun soll am Viraus geduecht ginn - sécherstellen, datt mat all Dokument Dir eng akzeptabel Lieserbréiwer Rekord, Kreatioun Datum an, Idealfall, Verfallsdatum. Späichert dës Metadaten.

Gutt, mir hunn entdeckt datt mir Dateie musse réckelen ...

Dëst ass eng vun de patheteschsten Ausried. Vill Leit wëssen net datt Webserver Iech erlaabt d'Relatioun tëscht der URI vun engem Objet a senger aktueller Plaz am Dateiesystem ze kontrolléieren. Denkt un den URI Raum als en abstrakte Raum, perfekt organiséiert. Da maacht eng Mapping op egal wéi eng Realitéit Dir benotzt fir se ze realiséieren. Da mellt dëst un de Webserver. Dir kënnt souguer Ären eegene Server Snippet schreiwen fir et richteg ze kréien.

John ënnerhält dëse Fichier net méi, Jane elo.

War dem John säin Numm an der URI? Nee, war de Fichier just a sengem Dossier? Gutt, okay.

Virdrun hu mir e CGI Skript fir dëst benotzt, awer elo benotze mir e binäre Programm.

Et gëtt eng verréckt Iddi datt Säiten erstallt vu Skripte sollen am "cgibin" oder "cgi" Beräich sinn. Dëst weist d'Mechanik vun wéi Dir Äre Webserver leeft. Dir ännert de Mechanismus (och wann Dir Inhalt späichert), an Oops - all Är URIs änneren.

Huelt d'National Science Foundation (NSF) zum Beispill:

NSF Online Dokumenter

http://www.nsf.gov/cgi-bin/pubsys/browser/odbrowse.pl

Déi éischt Säit fir d'Dokumenter ze kucken wäert kloer an e puer Joer net d'selwecht bleiwen. cgi-bin, oldbrowse и pl - all dëst gëtt Bits vun Informatioun iwwer wéi-mir-et-elo. Wann Dir d'Säit benotzt fir no engem Dokument ze sichen, ass dat éischt Resultat dat Dir kritt gläich schlecht:

Bericht vum Aarbechtsgrupp iwwer Kryptologie a Kodéierungstheorie

http://www.nsf.gov/cgi-bin/getpub?nsf9814

fir d'Dokument Index Säit, obwuel d'html Dokument selwer vill besser ausgesäit:

http://www.nsf.gov/pubs/1998/nsf9814/nsf9814.htm

Hei gëtt de Pubs/1998 Header all zukünfteg Archivservice e gudden Hiweis ginn, datt déi al 1998 Dokument Klassifikatioun Schema a Kraaft ass. Och wann d'Dokumentnummeren am Joer 2098 anescht ausgesinn, géif ech mir virstellen datt dës URI nach ëmmer gëlteg wier an net mat NSF oder all aner Organisatioun stéiert, déi den Archiv erhalen.

Ech hunn net geduecht datt URLen persistent musse sinn - et goufen URNen.

Dëst ass wahrscheinlech ee vun de schlëmmste Nebenwirkungen vun der URN Debatt. E puer Leit mengen datt wéinst der Fuerschung an e méi permanenten Nummraum si vläicht suergfälteg iwwer d'Dangling Links sinn, well "URNs dat alles fixéieren." Wann Dir ee vun dëse Leit sidd, da loosst mech Iech enttäuschen.

Déi meescht URN Schemaen déi ech gesinn hunn ausgesinn wéi en Autoritéitsidentifizéierer gefollegt vun entweder engem Datum an enger String déi Dir gewielt hutt, oder just e String deen Dir wielt. Dëst ass ganz ähnlech wéi eng HTTP URI. An anere Wierder, wann Dir mengt datt Är Organisatioun fäeg ass laanglieweg URNs ze kreéieren, da beweist et elo andeems Dir se fir Är HTTP URIs benotzt. Et gëtt näischt an HTTP selwer wat Är URI onbestänneg mécht. Nëmmen Är Organisatioun. Erstellt eng Datebank déi d'Dokument URN op den aktuellen Dateinumm mapt, a léisst de Webserver se benotze fir d'Dateien tatsächlech zréckzekommen.

Wann Dir dëse Punkt erreecht hutt, wann Dir net d'Zäit, d'Suen an d'Verbindungen hutt fir Software z'entwéckelen, da kënnt Dir déi folgend Excuse soen:

Mir wollten, awer mir hu just net déi richteg Tools.

Mee Dir kënnt mat dëser sympathiséieren. Ech ganz averstanen. Wat Dir maache musst ass de Webserver ze zwéngen fir direkt déi persistent URI ze analyséieren an d'Datei zréckzeginn egal wou se am Moment op Ärem aktuellen verréckten Dateiesystem gespäichert ass. Dir wëllt all URIs an enger Datei als Scheck späicheren an d'Datebank zu all Moment um lafenden halen. Dir wëllt d'Relatioun tëscht verschiddene Versiounen an Iwwersetzunge vum selwechten Dokument erhalen, an och en onofhängege Checksum-Rekord erhalen fir sécherzestellen datt d'Datei net vun engem zoufällege Feeler korrupt ass. A Webserver kommen einfach net aus der Këscht mat dëse Funktiounen. Wann Dir en neit Dokument wëllt erstellen, freet Äre Redakter Iech eng URI ze spezifizéieren.

Dir musst fäeg sinn Eegentum, Dokumentzougang, Archivniveau Sécherheet, etc. am URI Raum z'änneren ouni d'URI z'änneren.

Et ass alles ze schlecht. Awer mir korrigéieren d'Situatioun. Bei W3C benotze mir d'Jigedit (Jigsaw Editing Server) Funktionalitéit déi Versioune verfollegt, a mir experimentéieren mat Dokument Generatioun Scripten. Wann Dir Tools, Serveren a Clienten entwéckelt, oppassen op dëst Thema!

Dës Excuse gëllt och fir vill W3C Säiten, och dës: Also maacht wéi ech soen, net wéi ech maachen.

Firwat soll ech egal?

Wann Dir den URI op Ärem Server ännert, kënnt Dir ni komplett soen wien Linken op déi al URI hunn. Dëst kënne Linke vu reguläre Websäite sinn. Bookmark Är Säit. D'URI kéint an de Rand vun engem Bréif un e Frënd geschrauft ginn.

Wann iergendeen e Link verfollegt an et gebrach ass, verléieren se normalerweis Vertrauen an de Serverbesëtzer. Hien ass och frustréiert, souwuel emotional wéi kierperlech, andeems hien säin Zil net erreechen kann.

Vill Leit beschwéieren ëmmer iwwer futtis Linken, an ech hoffen, datt de Schued offensichtlech ass. Ech hoffen, datt de Reputatiounsschued fir den Ënnerhalter vum Server, wou d'Dokument verschwonnen ass, och offensichtlech ass.

Also wat soll ech maachen? URI Design

Et ass d'Verantwortung vum Webmaster fir URIs ze verdeelen déi an 2 Joer, an 20 Joer, an 200 Joer benotzt kënne ginn. Dëst erfuerdert Duerchduechte, Organisatioun an Determinatioun.

URIs änneren wann all Informatioun an hinnen ännert. Wéi Dir se designt ass ganz wichteg. (Wat, URI Design? Muss ech den URI designen? Jo, Dir sollt doriwwer denken). Design bedeit am Fong all Informatioun an der URI eraus ze loossen.

Den Datum wou d'Dokument erstallt gouf - den Datum wou d'URI ausgestallt gouf - ass eppes wat ni wäert änneren. Et ass ganz nëtzlech fir Ufroen ze trennen déi den neie System benotzen vun deenen déi den alen System benotzen. Dëst ass eng gutt Plaz fir mat engem URI unzefänken. Wann en Dokument datéiert ass, och wann d'Dokument an Zukunft relevant ass, dann ass dat e gudde Start.

Déi eenzeg Ausnam ass eng Säit déi bewosst déi "läscht" Versioun ass, zum Beispill fir déi ganz Organisatioun oder en groussen Deel dovun.

http://www.pathfinder.com/money/moneydaily/latest/

Dëst ass déi lescht Money Daily Kolonn am Money Magazin. Den Haaptgrond datt et kee Besoin fir en Datum an dëser URI ass, ass datt et kee Grond ass d'URI ze späicheren, déi de Logbicher iwwerlieft. D'Konzept vun Money Daily wäert verschwannen wann Geld verschwënnt. Wann Dir op Inhalter verlinke wëllt, sollt Dir se separat an den Archiven verlinken:

http://www.pathfinder.com/money/moneydaily/1998/981212.moneyonline.html

(Gesäit gutt aus. Unzehuelen, datt "Suen" déi selwecht Saach am ganze Liewen vun pathfinder.com bedeit wäert. Et gëtt eng Duplikat "98" an en onnéideg ".html", mee soss gesäit wéi eng staark URI.

Wat ze verloossen

Alles! Nieft dem Erstellungsdatum, all Informatioun an der URI ze setzen freet no Ierger op eng oder aner Manéier.

  • Numm vum Auteur. Autoritéit kann änneren wéi nei Versioune verfügbar sinn. D'Leit verloossen Organisatiounen a ginn Saachen un anerer weider.
  • Sujet. Et ass ganz schwéier. Et gesäit am Ufank ëmmer gutt aus, awer ännert sech iwwerraschend séier. Ech wäert méi iwwer dëst ënnert schwätzen.
  • Zoustand. Verzeichnisser wéi "al", "Entworf" an sou weider, fir net ze soen "läscht" an "cool", erschéngen an all Dateiesystemer. Dokumenter änneren Status - soss wier et kee Sënn fir Entworf ze kreéieren. Déi lescht Versioun vun engem Dokument brauch e persistent Identifizéierer, onofhängeg vu sengem Status. Halt de Status aus dem Numm.
  • Zougang. Um W3C hu mir de Site an Sektiounen opgedeelt fir Personal, Memberen an de Public. Dëst kléngt gutt, awer natierlech fänken d'Dokumenter als Team Iddie vu Mataarbechter un, gi mat Memberen diskutéiert, a ginn dann ëffentlech Wëssen. Et wier wierklech schued wann all Kéier wann en Dokument fir méi breet Diskussioun opgemaach gëtt, all déi al Linken dorop futti ginn! Elo plënnere mir op en einfachen Datum Code.
  • Dateierweiterung. E ganz gemeinsame Phänomen. "cgi", och ".html" wäert an Zukunft änneren. Dir benotzt vläicht net HTML fir dës Säit an 20 Joer, awer d'Links vun haut sollen nach funktionnéieren. Canonical Links op der W3C Site benotzen d'Extensioun net (wéi et gemaach gëtt).
  • Software Mechanismen. An der URI, kuckt no "cgi", "exec" an aner Begrëffer déi jäizen "kuckt wéi eng Software mir benotzen." Wëllt iergendeen säi ganzt Liewen verbréngen fir Perl CGI Scripten ze schreiwen? Nee? Dann ewechzehuelen der .pl Extensioun. Liest d'Serverhandbuch wéi Dir dëst maacht.
  • Disk Numm. Komm! Mee ech hunn dat gesinn.

Also dat bescht Beispill vun eisem Site ass einfach

http://www.w3.org/1998/12/01/chairs

... Rapport iwwert d'Protokoll vun der W3C Chairs Sëtzung.

Themen a Klassifikatioun no Thema

Ech wäert méi detailléiert iwwer dës Gefor goen, well et eng vun deene Saachen ass, déi am meeschte schwéier ze vermeiden ass. Typesch kommen Themen an URIs op wann Dir Är Dokumenter kategoriséiert no der Aarbecht déi se maachen. Awer dësen Decompte wäert sech mat der Zäit änneren. D'Nimm vun de Beräicher wäert änneren. Bei W3C wollte mir MarkUP op Markup änneren an dann op HTML fir den aktuellen Inhalt vun der Sektioun ze reflektéieren. Ausserdeem gëtt et dacks e flaach Nummraum. Sidd Dir sécher an 100 Joer, datt Dir näischt wëllt weiderbenotzen? An eisem kuerze Liewen wollte mir zum Beispill "Geschicht" an "Style Sheets" nei benotzen.

Et ass e verlockende Wee fir eng Websäit ze organiséieren - an e wierklech verlockende Wee fir alles ze organiséieren, och de ganze Web. Dëst ass eng super mëttelfristeg Léisung awer huet op laang Siicht schlëmm Defiziter.

En Deel vum Grond läit an der Philosophie vun der Bedeitung. All Begrëff an enger Sprooch ass e potenziell Zil fir Clustering, an all Persoun kann eng aner Iddi hunn wat et heescht. Zënter Bezéiungen tëscht Entitéite si méi wéi e Web wéi e Bam, och déi, déi mam Web averstane sinn, kënnen eng aner Duerstellung vum Bam wielen. Dëst sinn meng (oft widderholl) allgemeng Beobachtungen iwwer d'Gefore vun der hierarchescher Klassifikatioun als allgemeng Léisung.

Tatsächlech, wann Dir en Thema Numm an enger URI benotzt, engagéiert Dir Iech fir eng Zort Klassifikatioun. Vläicht wäert Dir an Zukunft eng aner Optioun léiwer maachen. D'URI ass dann ufälleg fir Violatioun.

De Grond fir e Fachberäich als Deel vun enger URI ze benotzen ass datt d'Verantwortung fir Ënnersektioune vum URI Raum normalerweis delegéiert ass, an da brauch Dir den Numm vum organisatoresche Kierper - Departement, Grupp oder wat och ëmmer - dat fir deen Ënnerraum verantwortlech ass. Dëst ass eng URI, déi un eng Organisatiounsstruktur bindend ass. Et ass normalerweis nëmme sécher wann déi weider (lénks) URI vun engem Datum geschützt ass: 1998 / Biller kéint Äre Server bedeiten "wat mir 1998 mat Biller gemengt hunn" anstatt "wat 1998 mir gemaach hunn mat deem wat mir elo Fotoen nennen."

Vergiesst net den Domain Numm

Denkt drun datt dëst net nëmme fir de Wee an der URI gëllt, awer och fir de Servernumm. Wann Dir separat Serveren fir verschidde Saachen hutt, erënnert datt dës Divisioun onméiglech ass ze änneren ouni vill, vill Linken ze zerstéieren. E puer klassesch "kuckt d'Software déi mir haut benotzen" Feeler sinn Domain Nimm "cgi.pathfinder.com", "secure", "lists.w3.org". Si sinn entwéckelt fir Serververwaltung méi einfach ze maachen. Egal ob en Domain eng Divisioun an Ärer Firma duerstellt, en Dokumentstatus, en Zougangsniveau oder e Sécherheetsniveau, sidd ganz, ganz virsiichteg ier Dir méi wéi een Domain Numm fir verschidde Dokumentaarten benotzt. Denkt drun datt Dir verschidde Webserver an engem eenzege sichtbare Webserver verstoppe kënnt andeems Dir Viruleedung a Proxying benotzt.

Oh, an denkt och un Ären Domain Numm. Dir wëllt net als soap.com bezeechent ginn nodeems Dir Produktlinnen geännert hutt an ophalen Seef ze maachen (Entschëllegt wien soap.com am Moment besëtzt).

Konklusioun

En URI fir 2, 20, 200 oder souguer 2000 Joer ze konservéieren ass offensichtlech net sou einfach wéi et schéngt. Wéi och ëmmer, iwwerall am Internet maachen Webmasteren Entscheedungen déi dës Aufgab fir sech selwer an Zukunft wierklech schwéier maachen. Dacks ass dat well se Tools benotzen deenen hir Aufgab ass de beschte Site nëmmen am Moment ze presentéieren - a keen huet bewäert wat mat de Linken geschitt wann alles ännert. Wéi och ëmmer, de Punkt hei ass datt vill, vill Saache kënne änneren, an Är URIs kënnen a sollen d'selwecht bleiwen. Dëst ass nëmme méiglech wann Dir denkt wéi Dir se erstellt.

Kuckt och:

Zousätzlech

Wéi läschen Dateierweiterungen ...

... vun engem URI am aktuellen Datei-baséierten Webserver?

Wann Dir Apache benotzt, zum Beispill, kënnt Dir et konfiguréieren fir Inhalt ze verhandelen. Späichert d'Dateierweiterung (z.B. .png) op eng Datei (z.B. mydog.png), awer Dir kënnt op eng Webressource verlinken ouni et. Apache kontrolléiert dann den Dossier fir all Dateie mat deem Numm an all Extensioun, a kann dee beschten aus dem Set wielen (zum Beispill GIF a PNG). An et ass net néideg verschidden Zorte vu Fichieren a verschiddene Verzeechnes ze setzen, tatsächlech Inhalt Matching funktionnéiert net wann Dir dat maacht.

  • Ariichten Äre Server fir Inhalt ze verhandelen
  • Ëmmer Link op URIs ouni Extensioun

Linke mat Extensiounen funktionnéieren nach ëmmer, awer verhënnert datt Äre Server dee beschten verfügbare Format am Moment an an Zukunft auswielt.

(Tatsächlech, mydog, mydog.png и mydog.gif - valabel Webressourcen, mydog ass eng universell Inhaltstyp Ressource, an mydog.png и mydog.gif - Ressourcen vun engem spezifeschen Inhaltstyp).

Natierlech, wann Dir Ären eegene Webserver schreift, ass et eng gutt Iddi eng Datebank ze benotzen fir persistent Identifizéierer un hir aktuell Form ze binden, obwuel oppassen fir onlimitéiert Datebankwachstum.

De Board of Shame - Geschicht 1: Kanal 7

Während 1999, Ech verfollegen Schoul Zoumaache wéinst Schnéi op Säit http://www.whdh.com/stormforce/closings.shtml. Waart net bis d'Informatioun um Enn vum Fernsehbildschierm erschéngt! Ech verlinkt et vu menger Homepage. Den éischte grousse Schnéi Stuerm vun 2000 kënnt an ech kontrolléieren d'Säit. Do steet geschriwwen:,

- Vun.
Näischt ass momentan zou. Weg zréck am Fall vun Wiederwarnungen.

Et kann net esou e staarke Stuerm sinn. Et ass witzeg datt den Datum fehlt. Awer wann Dir op d'Haaptsäit vum Site gitt, gëtt et e grousse Knäppchen "Closed Schools", deen op d'Säit féiert http://www.whdh.com/stormforce/ mat enger laanger Lëscht vun zougemaach Schoulen.

Vläicht hu se de System geännert fir d'Lëscht ze kréien - awer si brauche net d'URI z'änneren.

Board of Shame - Geschicht 2: Microsoft Netmeeting

Mat der wuessender Ofhängegkeet vum Internet ass eng clever Iddi komm datt Linken op d'Websäit vum Hiersteller an Uwendungen agebonne kënne ginn. Dëst gouf vill benotzt a mëssbraucht, awer Dir kënnt d'URL net änneren. Just den aneren Dag hunn ech e Link vum Microsoft Netmeeting 2/eppes Client am Help/Microsoft on the Web/Free Stuff Menü probéiert a krut e 404 Feeler - keng Äntwert vum Server gouf fonnt. Vläicht hu se et scho fixéiert ...

© 1998 Tim BL

Historesch Notiz: Am spéiden 20. Joerhonnert, wann dëst geschriwwe gouf, war "cool" en Epithet vun der Genehmegung, besonnesch bei jonke Leit, wat d'Moudeschkeet, d'Qualitéit oder d'Appropriatioun ugeet. A presséiert gouf den URI Wee dacks fir "Coolness" gewielt anstatt Nëtzlechkeet oder Haltbarkeet. Dëse Post ass e Versuch d'Energie hannert der Sich no Cool ze redirectéieren.

Source: will.com

Setzt e Commentaire