URIs tiis teu robah

Panulis: Sir Tim Berners-Lee, panemu URI, URL, HTTP, HTML sareng World Wide Web, sareng kapala W3C ayeuna. Artikel ditulis taun 1998

Naon URI anu dianggap "cool"?
Hiji nu teu robah.
Kumaha URIs dirobah?
URI henteu robih: jalma ngarobih aranjeunna.

Dina tiori, taya alesan pikeun jalma pikeun ngarobah URIs (atawa eureun ngarojong dokumén), tapi dina praktekna aya jutaan di antarana.

Dina tiori, nu boga nominal of a namespace domain sabenerna owns nu namespace domain sahingga sakabéh URIs di jerona. Sajaba ti insolvency, euweuh nyegah nu boga ngaran domain ti ngajaga ngaran. Sarta dina tiori, spasi URI handapeun ngaran domain anjeun sagemblengna dina kontrol anjeun, jadi anjeun bisa nyieun salaku stabil sakumaha anjeun resep. Lumayan ngan hiji-hijina alesan anu hadé pikeun dokumén ngaleungit tina internét nyaéta perusahaan anu gaduh nami domain parantos kaluar tina bisnis atanapi henteu tiasa deui mampuh tetep ngajalankeun server. Lajeng naha aya kitu loba Tumbu leungit di dunya? Sababaraha ieu ngan saukur kurangna forethought. Ieu sababaraha alesan anjeun tiasa ngadangu:

Kami ngan ukur nyusun ulang situs supados langkung saé.

Naha anjeun leres-leres mikir yén URI lami teu tiasa dianggo deui? Upami kitu, teras anjeun milih aranjeunna kirang pisan. Mertimbangkeun ngajaga nu anyar pikeun redesign salajengna.

Kami gaduh seueur barang anu teu tiasa ngalacak naon anu katinggaleun jaman, naon anu rahasia, sareng naon anu masih relevan, janten panginten langkung saé pikeun mareuman sadayana.

Kuring ukur bisa simpati. W3C ngaliwat jaman dimana urang kedah taliti ngayak bahan arsip pikeun karusiahan sateuacan ngajantenkeun umum. Kaputusan kedah dipikirkeun sateuacanna - pastikeun yén unggal dokumén anjeun ngarékam pamiarsa anu ditampi, tanggal nyiptakeun sareng, idéal, tanggal béakna. Simpen metadata ieu.

Nya, urang mendakan yén urang kedah mindahkeun file ...

Ieu salah sahiji alesan paling pathetic. Seueur jalma henteu terang yén pangladén wéb ngamungkinkeun anjeun pikeun ngontrol hubungan antara URI hiji obyék sareng lokasi saleresna dina sistem file. Pikir spasi URI salaku spasi abstrak, sampurna diatur. Teras ngadamel pemetaan kana kanyataan naon waé anu anjeun anggo pikeun ngawujudkeunana. Teras laporkeun ieu ka pangladén wéb. Anjeun malah tiasa nyerat snippet server anjeun nyalira pikeun leres.

John euweuh ngajaga file ieu, Jane ayeuna teu.

Naha nami John di URI? Henteu, éta file ngan dina diréktori na? Muhun, oke.

Saméméhna kami nganggo skrip CGI pikeun ieu, tapi ayeuna kami nganggo program binér.

Aya ide gila yén halaman anu diciptakeun ku skrip kedah aya di daérah "cgibin" atanapi "cgi". Ieu ngungkabkeun mékanika kumaha anjeun ngajalankeun server wéb anjeun. Anjeun ngarobah mékanisme (sanajan bari nyimpen eusi), sarta aduh - sagala URIs Anjeun robah.

Candak National Science Foundation (NSF) contona:

Dokumén Online NSF

http://www.nsf.gov/cgi-bin/pubsys/browser/odbrowse.pl

Halaman munggaran pikeun ngamimitian ningali dokumén jelas moal tetep sami dina sababaraha taun. cgi-bin, oldbrowse и pl - sadayana ieu masihan sakedik inpormasi ngeunaan kumaha-urang-ngalakukeun-ayeuna. Upami anjeun nganggo halaman pikeun milarian dokumén, hasil anu munggaran anjeun kéngingkeun sami-sami goréng:

Laporan Kelompok Kerja ngeunaan Kriptologi sareng Téori Coding

http://www.nsf.gov/cgi-bin/getpub?nsf9814

pikeun kaca indéks dokumen, sanajan dokumen html sorangan Sigana leuwih hadé:

http://www.nsf.gov/pubs/1998/nsf9814/nsf9814.htm

Di dieu lulugu pubs / 1998 bakal masihan sagala jasa arsip hareup clue alus yén skéma klasifikasi dokumen heubeul 1998 aya dina pangaruh. Sanajan jumlah dokumen bisa kasampak béda dina 2098, abdi bakal ngabayangkeun yén URI ieu masih bakal valid tur moal ngaganggu NSF atawa organisasi lianna nu bakal ngajaga arsip.

Ku teu sangka URL kedah pengkuh - aya URNs.

Ieu meureun salah sahiji efek samping awon tina debat URN. Sababaraha urang mikir yén kusabab panalungtikan kana ngaranspasi leuwih permanén, maranéhna bisa jadi cuek ngeunaan dangling Tumbu sabab "URNs bakal ngalereskeun sadayana éta." Mun anjeun salah sahiji jalma ieu, teras hayu atuh nguciwakeun anjeun.

Seuseueurna skéma URN anu kuring tingali sapertos identifier otoritas anu dituturkeun ku tanggal sareng senar anu anjeun pilih, atanapi ngan ukur senar anu anjeun pilih. Ieu pisan sarupa hiji URI HTTP. Dina basa sejen, lamun pikir organisasi anjeun bakal sanggup nyieun URNs lila-cicing, teras buktikeun ayeuna ku ngagunakeun aranjeunna keur HTTP URIs Anjeun. Aya nanaon di HTTP sorangan nu ngajadikeun URI Anjeun teu stabil. Ngan organisasi anjeun. Jieun database anu peta URN dokumén kana ngaran file ayeuna, sarta ngantep web server ngagunakeun eta pikeun sabenerna nimba file.

Upami anjeun parantos ngahontal titik ieu, upami anjeun henteu gaduh waktos, artos sareng sambungan pikeun ngembangkeun sababaraha parangkat lunak, maka anjeun tiasa nyatakeun alesan ieu:

Urang hayang, tapi urang ngan teu boga parabot katuhu.

Tapi anjeun tiasa simpati sareng ieu. Abdi satuju pisan. Anu anjeun kedah laksanakeun nyaéta maksakeun pangladén wéb pikeun langsung nga-parse URI anu pengkuh sareng ngabalikeun file dimana waé ayeuna disimpen dina sistem file gélo anjeun ayeuna. Anjeun hoyong nyimpen sadaya URIs dina file salaku cek sareng ngajaga pangkalan data dugi ka sadaya waktos. Rék ngawétkeun hubungan antara versi béda jeung tarjamahan tina dokumen sarua, sarta ogé ngajaga rékaman checksum bebas pikeun mastikeun yén file teu ruksak ku kasalahan teu kahaja. Sareng server wéb ngan saukur henteu kaluar tina kotak kalayan fitur-fitur ieu. Nalika anjeun badé nyiptakeun dokumén énggal, pangropéa anjeun naroskeun anjeun netepkeun URI.

Anjeun kudu bisa ngarobah kapamilikan, aksés dokumén, kaamanan tingkat arsip, jsb dina spasi URI tanpa ngarobah URI.

Ieu kabeh teuing goréng. Tapi kami bakal ngabenerkeun kaayaan. Di W3C, kami nganggo fungsionalitas Jigedit (Server éditan Jigsaw) anu ngalacak vérsi, sareng kami ékspérimén sareng naskah nyiptakeun dokumén. Upami anjeun ngembangkeun alat, server, sareng klien, perhatosan masalah ieu!

Alesan ieu ogé manglaku ka seueur halaman W3C, kalebet ieu: janten lakukeun sakumaha anu kuring nyarios, sanés sapertos anu kuring lakukeun.

Naha kuring kudu paduli?

Nalika anjeun ngarobih URI dina server anjeun, anjeun moal pernah tiasa nyarioskeun saha waé anu gaduh tautan kana URI anu lami. Ieu tiasa janten tautan tina halaman wéb biasa. Bookmark halaman anjeun. The URI bisa geus scrawled dina margins surat ka babaturan.

Nalika aya anu nuturkeun tautan sareng rusak, aranjeunna biasana kaleungitan kapercayaan ka anu gaduh server. Anjeunna ogé frustasi, boh émosional sareng fisik, ku henteu tiasa ngahontal tujuanana.

A loba jalma ngawadul ngeunaan Tumbu rusak sadaya waktu, sarta kuring miharep karuksakan atra. Kuring miharep éta ruksakna reputational ka maintainer tina server mana dokumen nu ngiles oge atra.

Janten naon anu kuring kedah laksanakeun? Desain URI

Tanggung jawab webmaster pikeun nyayogikeun URI anu tiasa dianggo dina 2 taun, dina 20 taun, dina 200 taun. Ieu merlukeun thoughtfulness, organisasi jeung tekad.

URIs robah lamun sagala informasi di antarana robah. Kumaha anjeun ngarancang aranjeunna penting pisan. (Naon, desain URI? Naha kuring kedah ngarancang URI? Sumuhun, anjeun kedah mikirkeun éta). Desain dasarna hartina ninggalkeun kaluar informasi wae dina URI.

Tanggal dokumén dijieun - tanggal URI ieu dikaluarkeun - mangrupa hal anu moal robah. Hal ieu kacida mangpaatna pikeun misahkeun queries nu make sistem anyar jeung nu make sistem heubeul. Ieu mangrupikeun tempat anu saé pikeun ngamimitian ku URI. Upami dokumenna aya tanggalna, sanaos dokumenna bakal relevan di hareup, maka ieu mangrupikeun awal anu saé.

Hiji-hijina pengecualian nyaéta halaman anu ngahaja mangrupikeun versi "panganyarna", contona pikeun sakabéh organisasi atanapi sabagian ageung.

http://www.pathfinder.com/money/moneydaily/latest/

Ieu kolom Money Daily panganyarna dina majalah Money. Alesan utama henteu peryogi tanggal dina URI ieu nyaéta teu aya alesan pikeun nyimpen URI anu bakal langkung lami log. Konsep Duit Daily bakal ngaleungit nalika Duit ngaleungit. Upami anjeun hoyong numbu ka eusi, anjeun kedah numbukeunana nyalira dina arsip:

http://www.pathfinder.com/money/moneydaily/1998/981212.moneyonline.html

(Sigana alus. Anggap yén "duit" bakal hartosna hal anu sarua sapanjang hirup pathfinder.com. Aya duplikat "98" sarta teu perlu ".html", tapi disebutkeun Sigana mah a URI kuat.

Naon ninggalkeun kumisan

Sadayana! Salian ti tanggal nyiptakeun, nempatkeun inpormasi dina URI naroskeun kasulitan dina hiji cara atanapi anu sanés.

  • Ngaran pangarang. Pangarang tiasa robih nalika versi énggal sayogi. Jalma ninggalkeun organisasi jeung ngalirkeun hal ka batur.
  • Judulna. Hese pisan. Ieu salawasna kasampak alus dina mimitina, tapi robah heran gancang. Kuring bakal ngobrol langkung seueur ngeunaan ieu di handap.
  • Status. Diréktori kawas "heubeul", "draf" jeung saterusna, teu nyebut "panganyarna" jeung "cool", muncul dina sakabéh sistem file. Dokumén robih status - upami henteu, moal aya gunana pikeun nyiptakeun draf. Versi panganyarna tina dokumen peryogi identifier pengkuh, paduli status na. Tetep status kaluar tina ngaran.
  • Aksés. Di W3C, kami parantos ngabagi situs kana sababaraha bagian pikeun karyawan, anggota, sareng masarakat. Ieu disada alus, tapi tangtu, dokumén dimimitian salaku gagasan tim ti staf, dibahas kalawan anggota, lajeng jadi pangaweruh umum. Éta bakal éra upami unggal waktos dokumen dibuka pikeun diskusi anu langkung lega, sadaya tautan lami ka dinya rusak! Ayeuna urang ngaléngkah ka kode tanggal basajan.
  • Ékstensi file. Fenomena anu umum pisan. "cgi", malah ".html" bakal robah dina mangsa nu bakal datang. Anjeun panginten henteu nganggo HTML pikeun halaman ieu salami 20 taun, tapi tautan ayeuna ka éta kedah tetep jalan. Tautan kanonik dina situs W3C henteu nganggo ekstensi (kumaha eta rengse).
  • Mékanisme software. Dina URI, milarian "cgi", "exec" sareng istilah sanésna anu ngajerit "tingali parangkat lunak naon anu kami anggo." Naha aya anu hoyong nyéépkeun kahirupan pikeun nyerat skrip Perl CGI? Henteu? Teras cabut extension .pl. Baca manual server ngeunaan cara ngalakukeun ieu.
  • Ngaran disk. Kadieu! Tapi kuring geus katempo ieu.

Jadi conto pangalusna tina situs urang téh saukur

http://www.w3.org/1998/12/01/chairs

... ngalaporkeun dina risalah rapat Kursi W3C.

Jejer jeung klasifikasi dumasar jejer

Abdi badé langkung rinci ngeunaan bahaya ieu, sabab éta mangrupikeun salah sahiji hal anu paling hese dihindari. Ilaharna, jejer mungkas nepi di URIs mun anjeun ngagolongkeun dokumén anjeun ku karya maranéhna ngalakukeun. Tapi ngarecahna ieu bakal robah kana waktu. Ngaran wewengkon bakal robah. Di W3C kami hoyong ngarobih MarkUP ka Markup teras ka HTML pikeun ngagambarkeun eusi bagian anu saleresna. Sajaba ti éta, mindeng aya spasi ngaran datar. Dina 100 taun, anjeun yakin yén anjeun moal hoyong nganggo deui nanaon? Dina kahirupan pondok urang, urang parantos hoyong nganggo deui "Sajarah" sareng "Style Sheets" contona.

Ieu mangrupikeun cara anu pikabitaeun pikeun ngatur halaman wéb-sareng cara anu leres-leres pikabitaeun pikeun ngatur naon waé, kalebet sadayana wéb. Ieu mangrupikeun solusi jangka sedeng anu saé tapi ngagaduhan kakurangan serius dina jangka panjang.

Bagian tina alesan perenahna di filsafat harti. Unggal istilah dina basa mangrupakeun udagan poténsial pikeun clustering, sarta unggal jalma bisa boga gagasan béda ngeunaan naon hartina. Kusabab hubungan antara éntitas langkung sapertos wéb tibatan tangkal, bahkan anu satuju sareng wéb tiasa milih perwakilan anu béda tina tangkal. Ieu mangrupikeun observasi umum kuring (sering diulang) ngeunaan bahaya klasifikasi hirarki salaku solusi umum.

Kanyataanna, mun anjeun migunakeun ngaran topik dina URI a, anjeun committing diri kana sababaraha jenis klasifikasi. Panginten ka hareup anjeun bakal resep pilihan anu béda. The URI lajeng bakal susceptible kana palanggaran.

Alesan pikeun ngagunakeun wewengkon subjék salaku bagian tina URI éta tanggung jawab subsections tina spasi URI biasana delegated, lajeng nu peryogi nami awak organisasi - departemén, grup, atawa naon bae - nu jawab subspace éta. Ieu mangrupikeun URI anu ngariung kana struktur organisasi. Biasana ngan ukur aman upami URI salajengna (kénca) ditangtayungan ku tanggal: 1998/pics tiasa hartosna ka server anjeun "naon anu kami maksud dina 1998 sareng pics" tinimbang "naon anu urang lakukeun dina taun 1998 sareng anu ayeuna urang sebut pics."

Ulah hilap nami domain

Inget yen ieu manglaku teu ukur keur jalur di URI, tapi ogé pikeun ngaran server. Upami Anjeun gaduh server misah pikeun hal béda, inget yen division ieu moal mungkin pikeun ngarobah tanpa ngaruksak loba, loba Tumbu. Sababaraha kasalahan klasik "tingali software anu kami anggo ayeuna" nyaéta nami domain "cgi.pathfinder.com", "aman", "lists.w3.org". Éta dirancang pikeun ngagampangkeun administrasi server. Henteu paduli naha domain ngagambarkeun divisi di perusahaan anjeun, status dokumen, tingkat aksés, atanapi tingkat kaamanan, ati-ati pisan sateuacan nganggo langkung ti hiji ngaran domain pikeun sababaraha jinis dokumén. Émut yén anjeun tiasa nyumputkeun sababaraha pangladén wéb dina hiji pangladén wéb anu katingali ku ngagunakeun alihan sareng proxy.

Oh, sarta ogé pikir ngeunaan ngaran domain Anjeun. Anjeun teu hoyong disebut soap.com saatos anjeun ngarobih lini produk sareng ngeureunkeun ngadamel sabun (Hapunten ka anu gaduh soap.com ayeuna).

kacindekan

Ngawétkeun URI salami 2, 20, 200, atanapi bahkan 2000 taun écés henteu sagampil sigana. Sanajan kitu, sakuliah Internet, webmasters keur nyieun kaputusan anu nyieun tugas ieu bener hésé pikeun dirina dina mangsa nu bakal datang. Seringna ieu kusabab aranjeunna ngagunakeun alat anu tugasna pikeun nampilkeun situs anu pangsaéna dina waktos ayeuna - sareng teu aya anu ngira-ngira naon anu bakal kajadian ka tautan nalika sadayana robih. Sanajan kitu, titik di dieu nyaeta yen loba, loba hal bisa ngarobah, sarta URIs Anjeun bisa jeung kudu tetep sarua. Ieu ngan mungkin mun anjeun mikir ngeunaan kumaha anjeun nyieun eta.

Baca ogé:

suplemén

Kumaha mupus ekstensi file ...

...ti URI dina pangladén wéb dumasar-file ayeuna?

Upami anjeun nganggo Apache, contona, anjeun tiasa ngonpigurasikeunana pikeun negotiate eusi. Simpen ekstensi file (misalna .png) kana file (misalna. mydog.png), tapi anjeun tiasa numbu ka sumber wéb tanpa éta. Apache teras pariksa diréktori pikeun sadaya file anu nami sareng ekstensi naon waé, sareng tiasa milih anu pangsaéna tina set (contona, GIF sareng PNG). Sareng teu kedah nempatkeun sababaraha jinis file dina diréktori anu béda, kanyataanna cocog sareng eusi moal jalan upami anjeun ngalakukeun éta.

  • Nyetél server anjeun pikeun negotiate eusi
  • Salawasna numbu ka URIs tanpa extension

Tautan sareng ekstensi masih tiasa dianggo, tapi bakal nyegah server anjeun milih format pangsaéna anu sayogi ayeuna sareng ka hareup.

(Kanyataanna, mydog, mydog.png и mydog.gif - sumber wéb anu sah, mydog mangrupakeun sumberdaya tipe eusi universal, jeung mydog.png и mydog.gif - sumberdaya tina tipe eusi husus).

Tangtosna, upami anjeun nyerat pangladén wéb anjeun nyalira, langkung saé ngagunakeun pangkalan data pikeun ngabeungkeut identifier anu terus-terusan kana bentuk ayeuna, sanaos waspada kana kamekaran database anu henteu terbatas.

Dewan Éra - Carita 1: Saluran 7

Dina taun 1999, kuring ngalacak penutupan sakola kusabab salju dina halaman http://www.whdh.com/stormforce/closings.shtml. Tong ngadagoan inpormasi muncul di handapeun layar TV! Kuring numbu ka eta tina kaca imah kuring. Badai salju badag mimiti 2000 datang sarta kuring pariksa kaca. Di situ tertulis:,

- Salaku ti.
Henteu aya anu ditutup ayeuna. Punten uih deui upami aya peringatan cuaca.

Éta moal tiasa janten badai anu kuat. Lucuna tanggalna leungit. Tapi upami anjeun angkat ka halaman utama situs, bakal aya tombol ageung "Sekolah Tertutup", anu nuju ka halaman éta. http://www.whdh.com/stormforce/ kalawan daptar panjang sakola ditutup.

Panginten aranjeunna ngarobih sistem pikeun kéngingkeun daptar - tapi aranjeunna henteu kedah ngarobih URI.

Déwan Éra - Carita 2: Microsoft Netmeeting

Kalayan gumantungna kana Internét, ideu pinter muncul yén tautan ka halaman wéb produsén tiasa dipasang dina aplikasi. Ieu geus dipaké sarta abused pisan, tapi anjeun teu bisa ngarobah URL. Ngan dinten séjén kuring diusahakeun link ti Microsoft Netmeeting 2 / hal klien dina Pitulung / Microsoft dina Web / menu barang Free sarta narima kasalahan 404 - euweuh respon ti server kapanggih. Meureun éta geus dibereskeun ...

© 1998 Tim BL

Catetan sajarah: Dina ahir abad ka-20, nalika ieu ditulis, "cool" mangrupakeun epithet of persetujuan, utamana di kalangan nonoman, nunjukkeun fashionability, kualitas, atawa appropriateness. Buru-buru, jalur URI sering dipilih pikeun "kesejukan" tinimbang mangpaat atanapi daya tahan. Tulisan ieu mangrupikeun usaha pikeun ngalihkeun énergi anu aya dina milarian tiis.

sumber: www.habr.com

Tambahkeun komentar