Persekitaran maklumat berdasarkan prinsip Data Terbuka

Persekitaran maklumat berdasarkan prinsip Data Terbuka

Persekitaran maklumat yang dicadangkan ialah sejenis rangkaian sosial yang terdesentralisasi. Tetapi tidak seperti kebanyakan penyelesaian sedia ada, persekitaran ini mempunyai beberapa sifat berguna sebagai tambahan kepada desentralisasi dan dicipta berdasarkan penyelesaian teknikal yang agak mudah dan standard (e-mel, json, fail teks dan sedikit blok). Ini membolehkan sesiapa sahaja yang mempunyai pengetahuan pengaturcaraan asas untuk mencipta perkhidmatan mereka sendiri untuk persekitaran ini.

ID Universal

Dalam mana-mana persekitaran dalam talian, pengecam pengguna dan objek adalah salah satu elemen utama sistem.

Dalam kes ini, pengecam pengguna ialah e-mel, yang sebenarnya telah menjadi pengecam yang diterima umum untuk kebenaran di tapak web dan perkhidmatan lain (jaber, openId).

Sebenarnya, pengecam pengguna dalam persekitaran dalam talian tertentu ialah pasangan log masuk+domain, yang untuk kemudahan ditulis dalam bentuk yang biasa kepada kebanyakan orang. Pada masa yang sama, untuk desentralisasi yang lebih besar, adalah dinasihatkan untuk setiap pengguna mempunyai domain mereka sendiri. Yang hampir dengan prinsip indieweb, di mana domain digunakan sebagai pengecam pengguna. Dalam kes kami, pengguna menambah nama panggilan pada domainnya, yang membolehkannya membuat beberapa akaun pada satu domain (untuk rakan, contohnya) dan menjadikan sistem pengalamatan lebih fleksibel.

Format ID pengguna ini tidak terikat dengan mana-mana rangkaian. Jika pengguna meletakkan datanya pada rangkaian TOR, maka dia boleh menggunakan domain dalam zon .onion, jika ini adalah rangkaian dengan sistem DNS pada rantaian blok, maka domain dalam zon .bit. Akibatnya, format untuk menangani pengguna dan data mereka tidak bergantung pada rangkaian yang melaluinya mereka dihantar (gabungan log masuk+domain digunakan di mana-mana). Bagi mereka yang ingin menggunakan alamat bitcoin/ethereum sebagai pengecam, anda boleh mengubah suai sistem untuk menggunakan alamat e-mel pseudo borang [email protected]

Menangani objek

Persekitaran dalam talian ini sebenarnya adalah satu set objek yang diterangkan dalam bentuk berstruktur, boleh dibaca mesin, merujuk kepada objek lain dan terikat kepada pengguna tertentu (e-mel) atau projek/organisasi (domain).

urns dalam ruang nama urn:opendata digunakan sebagai pengecam objek. Sebagai contoh, profil pengguna mempunyai alamat seperti:

urn:opendata:profile:[email protected]

Komen pengguna mempunyai alamat seperti:

urn:opendata:comment:[email protected]:08adbed93413782682fd25da77bd93c99dfd0548

di mana 08adbed93413782682fd25da77bd93c99dfd0548 ialah cincangan sha-1 rawak yang bertindak sebagai id objek, dan [e-mel dilindungi] β€” pemilik objek ini.

Prinsip penerbitan data pengguna

Mempunyai domain anda sendiri di bawah kawalan, pengguna boleh menerbitkan data dan kandungannya dengan mudah. Dan tidak seperti indiebeb, ini tidak memerlukan membuat tapak web dengan halaman html dengan data semantik terbina dalam.

Sebagai contoh, maklumat asas tentang pengguna terdapat dalam fail datarobots.txt, yang terletak di alamat seperti

http://55334.ru/[email protected]/datarobots.txt

Dan ia mempunyai kandungan seperti ini:

Object: user
Services-Enabled: 55334.ru,newethnos.ru
Ethnos: newethnos
Delegate-Tokens: http://55334.ru/[email protected]/delegete.txt

Iaitu, sebenarnya, ia adalah satu set rentetan dengan data nilai kunci->bentuk, menghurai yang merupakan tugas mudah untuk sesiapa sahaja yang mempunyai pengetahuan pengaturcaraan asas. Dan anda boleh mengedit data jika anda mahu menggunakan pad nota biasa.

Data yang lebih kompleks (profil, ulasan, siaran, dll.), yang mempunyai urn sendiri, dihantar sebagai objek JSON menggunakan API standard (http://opendatahub.org/api_1.0?lang=ru), yang boleh ditempatkan seperti pada domain pengguna dan pada tapak pihak ketiga yang mana pengguna telah mewakilkan penyimpanan, penerbitan dan pengeditan datanya (dalam baris Didayakan Perkhidmatan bagi fail datarobots.txt). Perkhidmatan pihak ketiga tersebut diterangkan di bawah.

Ontologi mudah dan JSON

Ontologi persekitaran komunikasi agak mudah berbanding dengan ontologi pangkalan pengetahuan industri. Oleh kerana dalam persekitaran komunikasi terdapat set objek standard yang agak kecil (siaran, ulasan, suka, profil, ulasan) dengan set sifat yang agak kecil.

Oleh itu, untuk menerangkan objek dalam persekitaran sedemikian, cukup untuk menggunakan JSON dan bukannya XML, yang lebih kompleks dalam struktur dan penghuraian (penting untuk tidak melupakan keperluan untuk ambang kemasukan dan skalabiliti yang rendah).

Untuk mendapatkan objek dengan urn yang diketahui, kami perlu menghubungi domain pengguna, atau perkhidmatan pihak ketiga yang pengguna telah mewakilkan pengurusan datanya.

Dalam persekitaran dalam talian ini, setiap domain di mana perkhidmatan dalam talian wujud juga mempunyai datarobots.txt sendiri yang terletak di alamat seperti example.com/datarobots.txt dengan kandungan yang serupa:

Object: service
Api: http://newethnos.ru/api
Api-Version: http://opendatahub.org/api_1.0

Dari mana kita boleh belajar bahawa kita boleh mendapatkan data tentang objek di alamat seperti:

http://newethnos.ru/api?urn=urn:opendata:profile:[e-mel dilindungi]

Objek JSON mempunyai struktur berikut:

{
    "urn": "urn:opendata:profile:[email protected]",
    "status": 1,
    "message": "Ok",
    "timestamp": 1596429631,
    "service": "example.com",
    "data": {
        "name": "John",
        "surname": "Gald",
        "gender": "male",
        "city": "Moscow",
        "img": "http://domain.com/image.jpg",
        "birthtime": 332467200,
        "community_friends": {
            "[email protected]": "1",
            "[email protected]": "0.5",
            "[email protected]": "0.7"
        },
        "interests_tags": "cars,cats,cinema",
        "mental_cards": {
            "no_alcohol@main": 8,
            "data_accumulation@main": 8,
            "open_data@main": 8
        }
    }
}

Seni bina perkhidmatan

Perkhidmatan pihak ketiga diperlukan untuk memudahkan proses penerbitan dan mencari data untuk pengguna akhir.

Disebutkan di atas adalah salah satu jenis perkhidmatan yang membantu pengguna menerbitkan datanya pada rangkaian. Mungkin terdapat banyak perkhidmatan yang serupa, setiap satunya menyediakan pengguna dengan antara muka yang mudah untuk mengedit salah satu jenis data (forum, blog, soal jawab, dll.). Jika pengguna tidak mempercayai perkhidmatan pihak ketiga, maka dia boleh memasang skrip perkhidmatan data pada domainnya atau membangunkannya sendiri.

Selain perkhidmatan yang membolehkan pengguna menerbitkan/mengedit data, persekitaran dalam talian menyediakan beberapa perkhidmatan lain yang melaksanakan tugas yang agak kompleks yang agak bermasalah untuk dilaksanakan pada nod pengguna akhir.

Satu jenis perkhidmatan tersebut ialah hab data ( opendatahub.org/ms - contoh), bertindak sebagai sejenis arkib web yang mengumpul semua data pengguna yang boleh dibaca mesin awam dan menyediakan akses kepadanya melalui API.

Kehadiran perkhidmatan dalam persekitaran dalam talian yang terbuka dan terdesentralisasi dengan ketara mengurangkan halangan kemasukan untuk pengguna, kerana tidak perlu memasang dan mengkonfigurasi nod mereka sendiri. Pada masa yang sama, pengguna kekal mengawal datanya (pada bila-bila masa dia boleh menukar perkhidmatan yang mana penerbitan data diwakilkan atau mencipta nodnya sendiri).

Jika pengguna tidak berminat untuk memiliki datanya dan tidak mempunyai domain sendiri atau seseorang yang biasa dengan domain tersebut, maka secara lalai datanya diuruskan oleh opendatatahub.org.

Atas perbelanjaan siapa semua ini?

Mungkin masalah utama hampir semua projek terdesentralisasi tersebut ialah ketidakupayaan untuk mengewangkannya pada tahap yang mencukupi untuk pembangunan dan sokongan yang stabil.

Derma + token digunakan untuk menampung kos pembangunan dan pemasaran dalam persekitaran dalam talian ini.

Semua derma yang pengguna berikan kepada projek/perkhidmatan dalaman tersedia untuk umum, boleh dibaca mesin dan dipautkan ke e-mel. Ini membolehkan mereka diambil kira, sebagai contoh, apabila mengira penarafan sosial dalam talian dan diterbitkan pada halaman pengguna. Apabila derma tidak lagi menjadi tanpa nama, maka sebenarnya pengguna tidak menderma, tetapi "masuk" untuk menyokong persekitaran maklumat umum. Sama seperti orang ramai menyerbu untuk membaiki kawasan umum dengan sikap yang sesuai terhadap orang yang enggan masuk.

Sebagai tambahan kepada derma, untuk mengumpul dana, token yang dikeluarkan dalam kuantiti terhad (400.000) digunakan, yang diberikan kepada semua orang yang membuat sumbangan kepada dana utama (etnogenesis).

Ciri token tambahan

Setiap token ialah "kunci" untuk akses kepada persekitaran dalam talian ini. Iaitu, anda boleh menggunakan perkhidmatan dan menjadi sebahagian daripada persekitaran dalam talian hanya jika anda mempunyai sekurang-kurangnya 1 token yang terikat pada e-mel.

Token ialah penapis spam yang baik kerana sifatnya yang terhad. Lebih ramai pengguna terdapat dalam sistem, lebih sukar untuk mendapatkan token dan lebih mahal untuk mencipta bot.

Orang, data dan hubungan sosial mereka lebih penting daripada teknologi

Persekitaran dalam talian yang diterangkan secara teknikal adalah penyelesaian yang agak primitif. Tetapi perkara yang lebih penting di dalamnya bukanlah teknologi seperti manusia dan hubungan sosial dan data (kandungan) yang dicipta dalam persekitaran.

Komuniti sosial yang dicipta, yang ahlinya mempunyai pengecam universal mereka sendiri (e-mel dan domain mereka sendiri) dan data berstruktur (dengan alamat URN, ontologi dan objek JSON), apabila penyelesaian teknikal yang lebih baik muncul, boleh memindahkan semua data ini ke persekitaran dalam talian yang lain, sambil mengekalkan sambungan yang terbentuk (penilaian, penilaian) dan kandungan.

Siaran ini menerangkan salah satu elemen rangkaian komuniti yang diatur sendiri, yang, sebagai tambahan kepada persekitaran dalam talian terpencar, termasuk beberapa kawasan luar talian yang meningkatkan faedah persekitaran dalam talian dan merupakan "pelanggan" yang sebahagian besarnya menentukan kefungsiannya. Tetapi ini adalah topik untuk artikel lain yang tidak berkaitan langsung dengan IT dan teknologi.

Sumber: www.habr.com

Tambah komen