Lingkungan informasi berdasarkan prinsip Data Terbuka

Lingkungan informasi berdasarkan prinsip Data Terbuka

Lingkungan informasi yang diusulkan adalah semacam jaringan sosial yang terdesentralisasi. Namun tidak seperti banyak solusi yang ada, lingkungan ini memiliki sejumlah properti yang berguna selain desentralisasi dan dibuat berdasarkan solusi teknis yang cukup sederhana dan standar (email, json, file teks, dan sedikit blockchain). Hal ini memungkinkan siapa pun yang memiliki pengetahuan pemrograman dasar untuk membuat layanan mereka sendiri untuk lingkungan ini.

tanda pengenal universal

Dalam lingkungan online mana pun, pengidentifikasi pengguna dan objek adalah salah satu elemen kunci sistem.

Dalam hal ini, pengidentifikasi pengguna adalah email, yang sebenarnya telah menjadi pengidentifikasi yang diterima secara umum untuk otorisasi di situs web dan layanan lainnya (jaber, openId).

Faktanya, pengidentifikasi pengguna di lingkungan online tertentu adalah pasangan login+domain, yang untuk kenyamanan ditulis dalam bentuk yang paling familiar bagi kebanyakan orang. Pada saat yang sama, untuk desentralisasi yang lebih baik, disarankan bagi setiap pengguna untuk memiliki domain sendiri. Yang dekat dengan prinsip indieweb, dimana domain digunakan sebagai pengenal pengguna. Dalam kasus kami, pengguna menambahkan nama panggilan ke domainnya, yang memungkinkan dia membuat beberapa akun di satu domain (untuk teman, misalnya) dan membuat sistem pengalamatan lebih fleksibel.

Format ID pengguna ini tidak terikat pada jaringan mana pun. Jika pengguna menempatkan datanya di jaringan TOR, maka ia dapat menggunakan domain di zona .onion; jika ini adalah jaringan dengan sistem DNS di blockchain, maka domain di zona .bit. Akibatnya, format pengalamatan pengguna dan data mereka tidak bergantung pada jaringan yang digunakan untuk mengirimkannya (kombinasi login+domain digunakan di mana-mana). Bagi yang ingin menggunakan alamat bitcoin/ethereum sebagai pengenal, Anda dapat memodifikasi sistem untuk menggunakan alamat email semu berupa [email protected]

Mengatasi objek

Lingkungan online ini sebenarnya adalah sekumpulan objek yang dideskripsikan dalam bentuk terstruktur dan dapat dibaca mesin, merujuk ke objek lain dan terikat pada pengguna tertentu (email) atau proyek/organisasi (domain).

guci di namespace urn:opendata digunakan sebagai pengidentifikasi objek. Misalnya, profil pengguna memiliki alamat seperti:

urn:opendata:profile:[email protected]

Komentar pengguna memiliki alamat seperti:

urn:opendata:comment:[email protected]:08adbed93413782682fd25da77bd93c99dfd0548

di mana 08adbed93413782682fd25da77bd93c99dfd0548 adalah hash sha-1 acak yang bertindak sebagai id objek, dan [email dilindungi] - pemilik objek ini.

Prinsip mempublikasikan data pengguna

Dengan mengontrol domainnya sendiri, pengguna dapat dengan mudah mempublikasikan data dan kontennya. Dan tidak seperti indiebeb, ini tidak memerlukan pembuatan situs web dengan halaman html dengan data semantik bawaan.

Misalnya, informasi dasar tentang pengguna terletak di file datarobots.txt, yang terletak di alamat seperti

http://55334.ru/[email protected]/datarobots.txt

Dan isinya seperti ini:

Object: user
Services-Enabled: 55334.ru,newethnos.ru
Ethnos: newethnos
Delegate-Tokens: http://55334.ru/[email protected]/delegete.txt

Faktanya, ini adalah sekumpulan string dengan data dalam bentuk key->value, penguraian yang merupakan tugas sederhana bagi siapa saja yang memiliki pengetahuan pemrograman dasar. Dan Anda dapat mengedit datanya jika ingin menggunakan notepad biasa.

Data yang lebih kompleks (profil, komentar, postingan, dll.), yang memiliki guci sendiri, dikirim sebagai objek JSON menggunakan API standar (http://opendatahub.org/api_1.0?lang=ru), yang dapat ditempatkan baik di domain pengguna maupun di situs pihak ketiga tempat pengguna mendelegasikan penyimpanan, publikasi, dan pengeditan datanya (di baris Layanan yang Diaktifkan pada file datarobots.txt). Layanan pihak ketiga tersebut dijelaskan di bawah.

Ontologi sederhana dan JSON

Ontologi lingkungan komunikasi relatif sederhana dibandingkan dengan ontologi basis pengetahuan industri. Karena dalam lingkungan komunikasi terdapat sekumpulan objek standar yang relatif kecil (posting, komentar, suka, profil, ulasan) dengan kumpulan properti yang relatif kecil.

Oleh karena itu, untuk mendeskripsikan objek dalam lingkungan seperti itu, cukup menggunakan JSON daripada XML, yang lebih kompleks dalam struktur dan penguraiannya (penting untuk tidak melupakan perlunya ambang masuk dan skalabilitas yang rendah).

Untuk mendapatkan objek dengan guci yang diketahui, kita perlu menghubungi domain pengguna, atau layanan pihak ketiga yang mana pengguna telah mendelegasikan pengelolaan datanya.

Dalam lingkungan online ini, setiap domain tempat layanan online berada juga memiliki datarobots.txt sendiri yang terletak di alamat seperti example.com/datarobots.txt dengan konten serupa:

Object: service
Api: http://newethnos.ru/api
Api-Version: http://opendatahub.org/api_1.0

Dari situ kita dapat mengetahui bahwa kita dapat memperoleh data tentang suatu objek pada alamat seperti:

http://newethnos.ru/api?urn=urn:opendata:profile:[email dilindungi]

Objek JSON memiliki struktur berikut:

{
    "urn": "urn:opendata:profile:[email protected]",
    "status": 1,
    "message": "Ok",
    "timestamp": 1596429631,
    "service": "example.com",
    "data": {
        "name": "John",
        "surname": "Gald",
        "gender": "male",
        "city": "Moscow",
        "img": "http://domain.com/image.jpg",
        "birthtime": 332467200,
        "community_friends": {
            "[email protected]": "1",
            "[email protected]": "0.5",
            "[email protected]": "0.7"
        },
        "interests_tags": "cars,cats,cinema",
        "mental_cards": {
            "no_alcohol@main": 8,
            "data_accumulation@main": 8,
            "open_data@main": 8
        }
    }
}

Arsitektur layanan

Layanan pihak ketiga diperlukan untuk menyederhanakan proses penerbitan dan pencarian data bagi pengguna akhir.

Yang disebutkan di atas adalah salah satu jenis layanan yang membantu pengguna mempublikasikan datanya di jaringan. Mungkin ada banyak layanan serupa, yang masing-masing menyediakan antarmuka yang nyaman bagi pengguna untuk mengedit salah satu jenis data (forum, blog, tanya jawab, dll.). Jika pengguna tidak mempercayai layanan pihak ketiga, maka ia dapat menginstal skrip layanan data di domainnya atau mengembangkannya sendiri.

Selain layanan yang memungkinkan pengguna untuk mempublikasikan/mengedit data, lingkungan online menyediakan sejumlah layanan lain yang melakukan tugas yang relatif kompleks yang cukup bermasalah untuk diterapkan pada node pengguna akhir.

Salah satu jenis layanan tersebut adalah hub data ( opendatahub.org/en - contoh), bertindak sebagai semacam arsip web yang mengumpulkan semua data pengguna publik yang dapat dibaca mesin dan menyediakan akses ke sana melalui API.

Kehadiran layanan dalam lingkungan online yang terbuka dan terdesentralisasi secara signifikan mengurangi hambatan masuk bagi pengguna, karena tidak perlu menginstal dan mengkonfigurasi node mereka sendiri. Pada saat yang sama, pengguna tetap mengendalikan datanya (kapan saja ia dapat mengubah layanan yang didelegasikan publikasi datanya atau membuat simpulnya sendiri).

Jika pengguna sama sekali tidak tertarik untuk memiliki datanya dan tidak memiliki domain sendiri atau seseorang yang familiar dengan domain tersebut, maka secara default datanya dikelola oleh opendatahub.org.

Semua ini atas biaya siapa?

Mungkin masalah utama dari hampir semua proyek yang didesentralisasi adalah ketidakmampuan untuk menghasilkan uang pada tingkat yang cukup untuk pembangunan dan dukungan yang stabil.

Donasi + token digunakan untuk menutupi biaya pengembangan dan pemasaran di lingkungan online ini.

Semua donasi yang diberikan pengguna untuk proyek/layanan internal tersedia untuk umum, dapat dibaca mesin, dan ditautkan ke email. Hal ini memungkinkan mereka untuk diperhitungkan, misalnya, ketika menghitung peringkat sosial online dan dipublikasikan di halaman pengguna. Ketika donasi tidak lagi bersifat anonim, maka sebenarnya pengguna tidak menyumbang, namun β€œmenyumbang” untuk mendukung lingkungan informasi umum. Sama seperti orang-orang yang ikut serta untuk memperbaiki area umum dengan sikap yang pantas terhadap orang-orang yang menolak untuk ikut serta.

Selain donasi, untuk mengumpulkan dana, token yang diterbitkan dalam jumlah terbatas (400.000) digunakan, yang diberikan kepada setiap orang yang memberikan donasi ke dana utama (etnogenesis).

Fitur token tambahan

Setiap token adalah β€œkunci” untuk akses ke lingkungan online ini. Artinya, Anda dapat menggunakan layanan dan menjadi bagian dari lingkungan online hanya jika Anda memiliki setidaknya 1 token yang terikat pada email.

Token adalah filter spam yang baik karena sifatnya yang terbatas. Semakin banyak pengguna dalam sistem, semakin sulit mendapatkan token dan semakin mahal biaya pembuatan bot.

Manusia, data, dan koneksi sosial mereka lebih penting daripada teknologi

Lingkungan online yang dijelaskan secara teknis merupakan solusi yang relatif primitif. Namun hal yang lebih penting di dalamnya bukanlah teknologi melainkan manusia dan hubungan sosial serta data (konten) yang tercipta dalam lingkungan.

Komunitas sosial yang dibuat, yang anggotanya memiliki pengidentifikasi universal mereka sendiri (email dan domain mereka sendiri) dan data terstruktur (dengan alamat URN, ontologi, dan objek JSON), ketika solusi teknis yang lebih baik muncul, dapat mentransfer semua data ini ke lingkungan online lain, dengan tetap menjaga koneksi yang terbentuk (rating, rating) dan konten.

Posting ini menjelaskan salah satu elemen komunitas jaringan yang terorganisir sendiri, yang, selain lingkungan online yang terdesentralisasi, mencakup sejumlah area offline yang meningkatkan manfaat lingkungan online dan merupakan β€œpelanggan” yang sangat menentukan fungsinya. Namun ini adalah topik untuk artikel lain yang tidak berhubungan langsung dengan IT dan teknologi.

Sumber: www.habr.com

Tambah komentar