Auteur: Sir Tim Berners-Lee, Erfinder vun URIs, URLen, HTTP, HTML an de World Wide Web, an aktuelle Chef vun der W3C. Artikel geschriwwen am Joer 1998
Wéi eng URI gëtt als "cool" ugesinn?
Een deen net Ànnert.
Wéi ginn URIs geÀnnert?
URIs Ànneren net: d'Leit Ànneren se.
An der Theorie gëtt et kee Grond fir d'Leit URIs z'Ànneren (oder ophalen Dokumenter z'ënnerstëtzen), awer an der Praxis ginn et Millioune vun hinnen.
An der Theorie besĂ«tzt den nominelle BesĂ«tzer vun engem Domain Nummraum tatsĂ€chlech den Domain Nummraum an dofir all d'URIs dobannen. Ausser Insolvenz verhĂ«nnert nĂ€ischt dem BesĂ«tzer vun engem Domain Numm den Numm ze halen. An an der Theorie ass den URI Raum Ă«nner Ărem Domain Numm ganz Ă«nner Ărer Kontroll, sou datt Dir et esou stabil maache kĂ«nnt wĂ©i Dir wĂ«llt. Zimlech deen eenzege gudde Grond fir en Dokument vum Internet ze verschwannen ass datt d'Firma, dĂ©i den Domain Numm gehĂ©iert, aus dem GeschĂ€ft gaang ass oder sech net mĂ©i leeschte kann de Server lafend ze halen. Da firwat ginn et sou vill vermĂ«sst Linken op der Welt? E puer vun dĂ«sem ass einfach e Manktem u Viraussoen. Hei sinn e puer GrĂ«nn dĂ©i Dir hĂ©iert:
Mir hunn de Site just nei organiséiert fir et besser ze maachen.
Denkt Dir wierklech datt déi al URIs net méi funktionnéiere kënnen? Wann jo, dann hutt Dir se ganz schlecht gewielt. Betruecht déi nei ze halen fir déi nÀchst Redesign.
Mir hunn esou vill Saachen, datt mir net kënne verfollegen wat net aktuell ass, wat vertraulech ass, a wat nach relevant ass, also hu mir et am beschten geduecht dat alles auszeschalten.
Ech kann nëmme sympathiséieren. W3C ass duerch eng Period gaang wou mir suergfÀlteg duerch d'Archivmaterial fir Vertraulechkeet hu misse siche ier se ëffentlech gemaach goufen. D'Decisioun soll am Viraus geduecht ginn - sécherstellen, datt mat all Dokument Dir eng akzeptabel Lieserbréiwer Rekord, Kreatioun Datum an, Idealfall, Verfallsdatum. SpÀichert dës Metadaten.
Gutt, mir hunn entdeckt datt mir Dateie musse réckelen ...
DĂ«st ass eng vun de patheteschsten Ausried. Vill Leit wĂ«ssen net datt Webserver Iech erlaabt d'Relatioun tĂ«scht der URI vun engem Objet a senger aktueller Plaz am Dateiesystem ze kontrollĂ©ieren. Denkt un den URI Raum als en abstrakte Raum, perfekt organisĂ©iert. Da maacht eng Mapping op egal wĂ©i eng RealitĂ©it Dir benotzt fir se ze realisĂ©ieren. Da mellt dĂ«st un de Webserver. Dir kĂ«nnt souguer Ăren eegene Server Snippet schreiwen fir et richteg ze krĂ©ien.
John ënnerhÀlt dëse Fichier net méi, Jane elo.
War dem John sÀin Numm an der URI? Nee, war de Fichier just a sengem Dossier? Gutt, okay.
Virdrun hu mir e CGI Skript fir dëst benotzt, awer elo benotze mir e binÀre Programm.
Et gĂ«tt eng verrĂ©ckt Iddi datt SĂ€iten erstallt vu Skripte sollen am "cgibin" oder "cgi" BerĂ€ich sinn. DĂ«st weist d'Mechanik vun wĂ©i Dir Ăre Webserver leeft. Dir Ă€nnert de Mechanismus (och wann Dir Inhalt spĂ€ichert), an Oops - all Ăr URIs Ă€nneren.
Huelt d'National Science Foundation (NSF) zum Beispill:
NSF Online Dokumenter
http://www.nsf.gov/cgi-bin/pubsys/browser/odbrowse.pl
Déi éischt SÀit fir d'Dokumenter ze kucken wÀert kloer an e puer Joer net d'selwecht bleiwen. cgi-bin, oldbrowse О pl - all dëst gëtt Bits vun Informatioun iwwer wéi-mir-et-elo. Wann Dir d'SÀit benotzt fir no engem Dokument ze sichen, ass dat éischt Resultat dat Dir kritt glÀich schlecht:
Bericht vum Aarbechtsgrupp iwwer Kryptologie a Kodéierungstheorie
http://www.nsf.gov/cgi-bin/getpub?nsf9814
fir d'Dokument Index SÀit, obwuel d'html Dokument selwer vill besser ausgesÀit:
http://www.nsf.gov/pubs/1998/nsf9814/nsf9814.htm
Hei gĂ«tt de Pubs/1998 Header all zukĂŒnfteg Archivservice e gudden Hiweis ginn, datt dĂ©i al 1998 Dokument Klassifikatioun Schema a Kraaft ass. Och wann d'Dokumentnummeren am Joer 2098 anescht ausgesinn, gĂ©if ech mir virstellen datt dĂ«s URI nach Ă«mmer gĂ«lteg wier an net mat NSF oder all aner Organisatioun stĂ©iert, dĂ©i den Archiv erhalen.
Ech hunn net geduecht datt URLen persistent musse sinn - et goufen URNen.
Dëst ass wahrscheinlech ee vun de schlëmmste Nebenwirkungen vun der URN Debatt. E puer Leit mengen datt wéinst der Fuerschung an e méi permanenten Nummraum si vlÀicht suergfÀlteg iwwer d'Dangling Links sinn, well "URNs dat alles fixéieren." Wann Dir ee vun dëse Leit sidd, da loosst mech Iech enttÀuschen.
DĂ©i meescht URN Schemaen dĂ©i ech gesinn hunn ausgesinn wĂ©i en AutoritĂ©itsidentifizĂ©ierer gefollegt vun entweder engem Datum an enger String dĂ©i Dir gewielt hutt, oder just e String deen Dir wielt. DĂ«st ass ganz Ă€hnlech wĂ©i eng HTTP URI. An anere Wierder, wann Dir mengt datt Ăr Organisatioun fĂ€eg ass laanglieweg URNs ze kreĂ©ieren, da beweist et elo andeems Dir se fir Ăr HTTP URIs benotzt. Et gĂ«tt nĂ€ischt an HTTP selwer wat Ăr URI onbestĂ€nneg mĂ©cht. NĂ«mmen Ăr Organisatioun. Erstellt eng Datebank dĂ©i d'Dokument URN op den aktuellen Dateinumm mapt, a lĂ©isst de Webserver se benotze fir d'Dateien tatsĂ€chlech zrĂ©ckzekommen.
Wann Dir dëse Punkt erreecht hutt, wann Dir net d'ZÀit, d'Suen an d'Verbindungen hutt fir Software z'entwéckelen, da kënnt Dir déi folgend Excuse soen:
Mir wollten, awer mir hu just net déi richteg Tools.
Mee Dir kĂ«nnt mat dĂ«ser sympathisĂ©ieren. Ech ganz averstanen. Wat Dir maache musst ass de Webserver ze zwĂ©ngen fir direkt dĂ©i persistent URI ze analysĂ©ieren an d'Datei zrĂ©ckzeginn egal wou se am Moment op Ărem aktuellen verrĂ©ckten Dateiesystem gespĂ€ichert ass. Dir wĂ«llt all URIs an enger Datei als Scheck spĂ€icheren an d'Datebank zu all Moment um lafenden halen. Dir wĂ«llt d'Relatioun tĂ«scht verschiddene Versiounen an Iwwersetzunge vum selwechten Dokument erhalen, an och en onofhĂ€ngege Checksum-Rekord erhalen fir sĂ©cherzestellen datt d'Datei net vun engem zoufĂ€llege Feeler korrupt ass. A Webserver kommen einfach net aus der KĂ«scht mat dĂ«se Funktiounen. Wann Dir en neit Dokument wĂ«llt erstellen, freet Ăre Redakter Iech eng URI ze spezifizĂ©ieren.
Dir musst fÀeg sinn Eegentum, Dokumentzougang, Archivniveau Sécherheet, etc. am URI Raum z'Ànneren ouni d'URI z'Ànneren.
Et ass alles ze schlecht. Awer mir korrigéieren d'Situatioun. Bei W3C benotze mir d'Jigedit (Jigsaw Editing Server) Funktionalitéit déi Versioune verfollegt, a mir experimentéieren mat Dokument Generatioun Scripten. Wann Dir Tools, Serveren a Clienten entwéckelt, oppassen op dëst Thema!
Dës Excuse gëllt och fir vill W3C SÀiten, och dës: Also maacht wéi ech soen, net wéi ech maachen.
Firwat soll ech egal?
Wann Dir den URI op Ărem Server Ă€nnert, kĂ«nnt Dir ni komplett soen wien Linken op dĂ©i al URI hunn. DĂ«st kĂ«nne Linke vu regulĂ€re WebsĂ€ite sinn. Bookmark Ăr SĂ€it. D'URI kĂ©int an de Rand vun engem BrĂ©if un e FrĂ«nd geschrauft ginn.
Wann iergendeen e Link verfollegt an et gebrach ass, verléieren se normalerweis Vertrauen an de Serverbesëtzer. Hien ass och frustréiert, souwuel emotional wéi kierperlech, andeems hien sÀin Zil net erreechen kann.
Vill Leit beschwĂ©ieren Ă«mmer iwwer futtis Linken, an ech hoffen, datt de Schued offensichtlech ass. Ech hoffen, datt de Reputatiounsschued fir den Ănnerhalter vum Server, wou d'Dokument verschwonnen ass, och offensichtlech ass.
Also wat soll ech maachen? URI Design
Et ass d'Verantwortung vum Webmaster fir URIs ze verdeelen déi an 2 Joer, an 20 Joer, an 200 Joer benotzt kënne ginn. Dëst erfuerdert Duerchduechte, Organisatioun an Determinatioun.
URIs Ànneren wann all Informatioun an hinnen Ànnert. Wéi Dir se designt ass ganz wichteg. (Wat, URI Design? Muss ech den URI designen? Jo, Dir sollt doriwwer denken). Design bedeit am Fong all Informatioun an der URI eraus ze loossen.
Den Datum wou d'Dokument erstallt gouf - den Datum wou d'URI ausgestallt gouf - ass eppes wat ni wÀert Ànneren. Et ass ganz nëtzlech fir Ufroen ze trennen déi den neie System benotzen vun deenen déi den alen System benotzen. Dëst ass eng gutt Plaz fir mat engem URI unzefÀnken. Wann en Dokument datéiert ass, och wann d'Dokument an Zukunft relevant ass, dann ass dat e gudde Start.
Déi eenzeg Ausnam ass eng SÀit déi bewosst déi "lÀscht" Versioun ass, zum Beispill fir déi ganz Organisatioun oder en groussen Deel dovun.
http://www.pathfinder.com/money/moneydaily/latest/
Dëst ass déi lescht Money Daily Kolonn am Money Magazin. Den Haaptgrond datt et kee Besoin fir en Datum an dëser URI ass, ass datt et kee Grond ass d'URI ze spÀicheren, déi de Logbicher iwwerlieft. D'Konzept vun Money Daily wÀert verschwannen wann Geld verschwënnt. Wann Dir op Inhalter verlinke wëllt, sollt Dir se separat an den Archiven verlinken:
http://www.pathfinder.com/money/moneydaily/1998/981212.moneyonline.html
(GesÀit gutt aus. Unzehuelen, datt "Suen" déi selwecht Saach am ganze Liewen vun pathfinder.com bedeit wÀert. Et gëtt eng Duplikat "98" an en onnéideg ".html", mee soss gesÀit wéi eng staark URI.
Wat ze verloossen
Alles! Nieft dem Erstellungsdatum, all Informatioun an der URI ze setzen freet no Ierger op eng oder aner Manéier.
- Numm vum Auteur. AutoritĂ©it kann Ă€nneren wĂ©i nei Versioune verfĂŒgbar sinn. D'Leit verloossen Organisatiounen a ginn Saachen un anerer weider.
- Sujet. Et ass ganz schwéier. Et gesÀit am Ufank ëmmer gutt aus, awer Ànnert sech iwwerraschend séier. Ech wÀert méi iwwer dëst ënnert schwÀtzen.
- Zoustand. Verzeichnisser wéi "al", "Entworf" an sou weider, fir net ze soen "lÀscht" an "cool", erschéngen an all Dateiesystemer. Dokumenter Ànneren Status - soss wier et kee Sënn fir Entworf ze kreéieren. Déi lescht Versioun vun engem Dokument brauch e persistent Identifizéierer, onofhÀngeg vu sengem Status. Halt de Status aus dem Numm.
- Zougang. Um W3C hu mir de Site an Sektiounen opgedeelt fir Personal, Memberen an de Public. Dëst kléngt gutt, awer natierlech fÀnken d'Dokumenter als Team Iddie vu Mataarbechter un, gi mat Memberen diskutéiert, a ginn dann ëffentlech Wëssen. Et wier wierklech schued wann all Kéier wann en Dokument fir méi breet Diskussioun opgemaach gëtt, all déi al Linken dorop futti ginn! Elo plënnere mir op en einfachen Datum Code.
- Dateierweiterung. E ganz gemeinsame PhÀnomen. "cgi", och ".html" wÀert an Zukunft Ànneren. Dir benotzt vlÀicht net HTML fir dës SÀit an 20 Joer, awer d'Links vun haut sollen nach funktionnéieren. Canonical Links op der W3C Site benotzen d'Extensioun net ().
- Software Mechanismen. An der URI, kuckt no "cgi", "exec" an aner Begrëffer déi jÀizen "kuckt wéi eng Software mir benotzen." Wëllt iergendeen sÀi ganzt Liewen verbréngen fir Perl CGI Scripten ze schreiwen? Nee? Dann ewechzehuelen der .pl Extensioun. Liest d'Serverhandbuch wéi Dir dëst maacht.
- Disk Numm. Komm! Mee ech hunn dat gesinn.
Also dat bescht Beispill vun eisem Site ass einfach
http://www.w3.org/1998/12/01/chairs
... Rapport iwwert d'Protokoll vun der W3C Chairs Sëtzung.
Themen a Klassifikatioun no Thema
Ech wĂ€ert mĂ©i detaillĂ©iert iwwer dĂ«s Gefor goen, well et eng vun deene Saachen ass, dĂ©i am meeschte schwĂ©ier ze vermeiden ass. Typesch kommen Themen an URIs op wann Dir Ăr Dokumenter kategorisĂ©iert no der Aarbecht dĂ©i se maachen. Awer dĂ«sen Decompte wĂ€ert sech mat der ZĂ€it Ă€nneren. D'Nimm vun de BerĂ€icher wĂ€ert Ă€nneren. Bei W3C wollte mir MarkUP op Markup Ă€nneren an dann op HTML fir den aktuellen Inhalt vun der Sektioun ze reflektĂ©ieren. Ausserdeem gĂ«tt et dacks e flaach Nummraum. Sidd Dir sĂ©cher an 100 Joer, datt Dir nĂ€ischt wĂ«llt weiderbenotzen? An eisem kuerze Liewen wollte mir zum Beispill "Geschicht" an "Style Sheets" nei benotzen.
Et ass e verlockende Wee fir eng WebsÀit ze organiséieren - an e wierklech verlockende Wee fir alles ze organiséieren, och de ganze Web. Dëst ass eng super mëttelfristeg Léisung awer huet op laang Siicht schlëmm Defiziter.
En Deel vum Grond lÀit an der Philosophie vun der Bedeitung. All Begrëff an enger Sprooch ass e potenziell Zil fir Clustering, an all Persoun kann eng aner Iddi hunn wat et heescht. Zënter Bezéiungen tëscht Entitéite si méi wéi e Web wéi e Bam, och déi, déi mam Web averstane sinn, kënnen eng aner Duerstellung vum Bam wielen. Dëst sinn meng (oft widderholl) allgemeng Beobachtungen iwwer d'Gefore vun der hierarchescher Klassifikatioun als allgemeng Léisung.
TatsÀchlech, wann Dir en Thema Numm an enger URI benotzt, engagéiert Dir Iech fir eng Zort Klassifikatioun. VlÀicht wÀert Dir an Zukunft eng aner Optioun léiwer maachen. D'URI ass dann ufÀlleg fir Violatioun.
De Grond fir e FachberĂ€ich als Deel vun enger URI ze benotzen ass datt d'Verantwortung fir Ănnersektioune vum URI Raum normalerweis delegĂ©iert ass, an da brauch Dir den Numm vum organisatoresche Kierper - Departement, Grupp oder wat och Ă«mmer - dat fir deen Ănnerraum verantwortlech ass. DĂ«st ass eng URI, dĂ©i un eng Organisatiounsstruktur bindend ass. Et ass normalerweis nĂ«mme sĂ©cher wann dĂ©i weider (lĂ©nks) URI vun engem Datum geschĂŒtzt ass: 1998 / Biller kĂ©int Ăre Server bedeiten "wat mir 1998 mat Biller gemengt hunn" anstatt "wat 1998 mir gemaach hunn mat deem wat mir elo Fotoen nennen."
Vergiesst net den Domain Numm
Denkt drun datt dĂ«st net nĂ«mme fir de Wee an der URI gĂ«llt, awer och fir de Servernumm. Wann Dir separat Serveren fir verschidde Saachen hutt, erĂ«nnert datt dĂ«s Divisioun onmĂ©iglech ass ze Ă€nneren ouni vill, vill Linken ze zerstĂ©ieren. E puer klassesch "kuckt d'Software dĂ©i mir haut benotzen" Feeler sinn Domain Nimm "cgi.pathfinder.com", "secure", "lists.w3.org". Si sinn entwĂ©ckelt fir Serververwaltung mĂ©i einfach ze maachen. Egal ob en Domain eng Divisioun an Ărer Firma duerstellt, en Dokumentstatus, en Zougangsniveau oder e SĂ©cherheetsniveau, sidd ganz, ganz virsiichteg ier Dir mĂ©i wĂ©i een Domain Numm fir verschidde Dokumentaarten benotzt. Denkt drun datt Dir verschidde Webserver an engem eenzege sichtbare Webserver verstoppe kĂ«nnt andeems Dir Viruleedung a Proxying benotzt.
Oh, an denkt och un Ăren Domain Numm. Dir wĂ«llt net als soap.com bezeechent ginn nodeems Dir Produktlinnen geĂ€nnert hutt an ophalen Seef ze maachen (EntschĂ«llegt wien soap.com am Moment besĂ«tzt).
Konklusioun
En URI fir 2, 20, 200 oder souguer 2000 Joer ze konservĂ©ieren ass offensichtlech net sou einfach wĂ©i et schĂ©ngt. WĂ©i och Ă«mmer, iwwerall am Internet maachen Webmasteren Entscheedungen dĂ©i dĂ«s Aufgab fir sech selwer an Zukunft wierklech schwĂ©ier maachen. Dacks ass dat well se Tools benotzen deenen hir Aufgab ass de beschte Site nĂ«mmen am Moment ze presentĂ©ieren - a keen huet bewĂ€ert wat mat de Linken geschitt wann alles Ă€nnert. WĂ©i och Ă«mmer, de Punkt hei ass datt vill, vill Saache kĂ«nne Ă€nneren, an Ăr URIs kĂ«nnen a sollen d'selwecht bleiwen. DĂ«st ass nĂ«mme mĂ©iglech wann Dir denkt wĂ©i Dir se erstellt.
Kuckt och:
ZousÀtzlech
Wéi lÀschen Dateierweiterungen ...
... vun engem URI am aktuellen Datei-baséierten Webserver?
Wann Dir Apache benotzt, zum Beispill, kënnt Dir et konfiguréieren fir Inhalt ze verhandelen. SpÀichert d'Dateierweiterung (z.B. .png) op eng Datei (z.B. mydog.png), awer Dir kënnt op eng Webressource verlinken ouni et. Apache kontrolléiert dann den Dossier fir all Dateie mat deem Numm an all Extensioun, a kann dee beschten aus dem Set wielen (zum Beispill GIF a PNG). An et ass net néideg verschidden Zorte vu Fichieren a verschiddene Verzeechnes ze setzen, tatsÀchlech Inhalt Matching funktionnéiert net wann Dir dat maacht.
- Ariichten Ăre Server fir Inhalt ze verhandelen
- Ămmer Link op URIs ouni Extensioun
Linke mat Extensiounen funktionnĂ©ieren nach Ă«mmer, awer verhĂ«nnert datt Ăre Server dee beschten verfĂŒgbare Format am Moment an an Zukunft auswielt.
(TatsÀchlech, mydog, mydog.png О mydog.gif - valabel Webressourcen, mydog ass eng universell Inhaltstyp Ressource, an mydog.png О mydog.gif - Ressourcen vun engem spezifeschen Inhaltstyp).
Natierlech, wann Dir Ăren eegene Webserver schreift, ass et eng gutt Iddi eng Datebank ze benotzen fir persistent IdentifizĂ©ierer un hir aktuell Form ze binden, obwuel oppassen fir onlimitĂ©iert Datebankwachstum.
De Board of Shame - Geschicht 1: Kanal 7
WÀhrend 1999, Ech verfollegen Schoul Zoumaache wéinst Schnéi op SÀit http://www.whdh.com/stormforce/closings.shtml. Waart net bis d'Informatioun um Enn vum Fernsehbildschierm erschéngt! Ech verlinkt et vu menger Homepage. Den éischte grousse Schnéi Stuerm vun 2000 kënnt an ech kontrolléieren d'SÀit. Do steet geschriwwen:,
- Vun.
NÀischt ass momentan zou. Weg zréck am Fall vun Wiederwarnungen.
Et kann net esou e staarke Stuerm sinn. Et ass witzeg datt den Datum fehlt. Awer wann Dir op d'HaaptsÀit vum Site gitt, gëtt et e grousse KnÀppchen "Closed Schools", deen op d'SÀit féiert http://www.whdh.com/stormforce/ mat enger laanger Lëscht vun zougemaach Schoulen.
VlÀicht hu se de System geÀnnert fir d'Lëscht ze kréien - awer si brauche net d'URI z'Ànneren.
Board of Shame - Geschicht 2: Microsoft Netmeeting
Mat der wuessender OfhĂ€ngegkeet vum Internet ass eng clever Iddi komm datt Linken op d'WebsĂ€it vum Hiersteller an Uwendungen agebonne kĂ«nne ginn. DĂ«st gouf vill benotzt a mĂ«ssbraucht, awer Dir kĂ«nnt d'URL net Ă€nneren. Just den aneren Dag hunn ech e Link vum Microsoft Netmeeting 2/eppes Client am Help/Microsoft on the Web/Free Stuff MenĂŒ probĂ©iert a krut e 404 Feeler - keng Ăntwert vum Server gouf fonnt. VlĂ€icht hu se et scho fixĂ©iert ...
© 1998
Historesch Notiz: Am spéiden 20. Joerhonnert, wann dëst geschriwwe gouf, war "cool" en Epithet vun der Genehmegung, besonnesch bei jonke Leit, wat d'Moudeschkeet, d'Qualitéit oder d'Appropriatioun ugeet. A presséiert gouf den URI Wee dacks fir "Coolness" gewielt anstatt Nëtzlechkeet oder Haltbarkeet. Dëse Post ass e Versuch d'Energie hannert der Sich no Cool ze redirectéieren.
Source: will.com
