Informačné prostredie založené na princípoch Open Data

Informačné prostredie založené na princípoch Open Data

Navrhované informačné prostredie je akousi decentralizovanou sociálnou sieťou. Ale na rozdiel od mnohých existujúcich riešení má toto prostredie okrem decentralizácie množstvo užitočných vlastností a je vytvorené na základe pomerne jednoduchých a štandardných technických riešení (e-mail, json, textové súbory a trochu blockchainu). To umožňuje každému so základnými znalosťami programovania vytvárať vlastné služby pre toto prostredie.

Univerzálne ID

V akomkoľvek online prostredí sú identifikátory používateľov a objektov jedným z kľúčových prvkov systému.

V tomto prípade je identifikátorom užívateľa email, ktorý sa v skutočnosti stal všeobecne akceptovaným identifikátorom pre autorizáciu na webových stránkach a iných službách (jaber, openId).

V skutočnosti je identifikátorom používateľa v danom online prostredí pár login+doména, ktorý je pre pohodlie napísaný vo forme, ktorú pozná väčšina. Zároveň je pre väčšiu decentralizáciu vhodné, aby mal každý používateľ svoju doménu. Čo je blízke princípom indiewebu, kde sa ako identifikátor používateľa používa doména. V našom prípade si používateľ pridá na svoju doménu prezývku, ktorá mu umožní vytvoriť si na jednej doméne viacero účtov (napríklad pre priateľov) a systém adresovania je flexibilnejší.

Tento formát ID používateľa nie je viazaný na žiadnu sieť. Ak používateľ umiestni svoje dáta do siete TOR, tak môže využívať domény v zóne .onion, ak ide o sieť so systémom DNS na blockchaine, tak domény v zóne .bit. Výsledkom je, že formát oslovovania používateľov a ich údajov nezávisí od siete, cez ktorú sa prenášajú (všade sa používa kombinácia login+doména). Pre tých, ktorí chcú použiť bitcoinovú/ethereovú adresu ako identifikátor, môžete upraviť systém tak, aby používal pseudo e-mailové adresy formulára [email protected]

Adresovanie objektov

Toto online prostredie je vlastne súbor objektov, ktoré sú popísané v štruktúrovanej, strojovo čitateľnej forme, odkazujú na iné objekty a sú viazané na konkrétneho používateľa (e-mail) alebo projekt/organizáciu (doménu).

urny v mennom priestore urn:opendata sa používajú ako identifikátory objektov. Napríklad používateľský profil má adresu ako:

urn:opendata:profile:[email protected]

Komentár používateľa má adresu ako:

urn:opendata:comment:[email protected]:08adbed93413782682fd25da77bd93c99dfd0548

kde 08adbed93413782682fd25da77bd93c99dfd0548 je náhodný hash sha-1 fungujúci ako ID objektu a [chránené e-mailom] — vlastník tohto objektu.

Princíp zverejňovania užívateľských údajov

S vlastnou doménou pod kontrolou môže používateľ jednoducho publikovať svoje údaje a obsah. A na rozdiel od indiebeb to nevyžaduje vytvorenie webovej stránky s html stránkami so vstavanými sémantickými údajmi.

Napríklad základné informácie o používateľovi sa nachádzajú v súbore datarobots.txt, ktorý sa nachádza na adrese ako

http://55334.ru/[email protected]/datarobots.txt

A má takýto obsah:

Object: user
Services-Enabled: 55334.ru,newethnos.ru
Ethnos: newethnos
Delegate-Tokens: http://55334.ru/[email protected]/delegete.txt

To znamená, že ide v skutočnosti o množinu reťazcov s údajmi vo forme kľúč->hodnota, čo je jednoduchá úloha pre každého, kto má základné znalosti programovania. Ak chcete, môžete údaje upravovať pomocou bežného poznámkového bloku.

Komplexnejšie dáta (profil, komentár, príspevok atď.), ktoré majú vlastnú urnu, sa odosielajú ako objekt JSON pomocou štandardného API (http://opendatahub.org/api_1.0?lang=ru), ktoré dokáže byť umiestnené ako na doméne používateľa a na stránke tretej strany, na ktorú používateľ delegoval ukladanie, zverejňovanie a úpravu svojich údajov (v riadku Services-Enabled súboru datarobots.txt). Takéto služby tretích strán sú opísané nižšie.

Jednoduchá ontológia a JSON

Ontológia komunikačného prostredia je relatívne jednoduchá v porovnaní s ontológiami priemyselných znalostných báz. Keďže v komunikačnom prostredí existuje relatívne malá množina štandardných objektov (príspevok, komentár, lajk, profil, recenzia) s relatívne malým súborom vlastností.

Na popis objektov v takomto prostredí teda stačí použiť JSON namiesto XML, ktorý je štruktúrou a parsovaním zložitejší (je dôležité nezabúdať na potrebu nízkeho vstupného prahu a škálovateľnosti).

Na získanie predmetu so známou urnou potrebujeme kontaktovať doménu používateľa alebo služby tretích strán, ktorým používateľ delegoval správu svojich údajov.

V tomto online prostredí má každá doména, na ktorej existuje služba online, aj vlastný súbor datarobots.txt umiestnený na adrese example.com/datarobots.txt s podobným obsahom:

Object: service
Api: http://newethnos.ru/api
Api-Version: http://opendatahub.org/api_1.0

Z čoho sa môžeme dozvedieť, že môžeme získať údaje o objekte na adrese ako:

http://newethnos.ru/api?urn=urn:opendata:profile:[chránené e-mailom]

Objekt JSON má nasledujúcu štruktúru:

{
    "urn": "urn:opendata:profile:[email protected]",
    "status": 1,
    "message": "Ok",
    "timestamp": 1596429631,
    "service": "example.com",
    "data": {
        "name": "John",
        "surname": "Gald",
        "gender": "male",
        "city": "Moscow",
        "img": "http://domain.com/image.jpg",
        "birthtime": 332467200,
        "community_friends": {
            "[email protected]": "1",
            "[email protected]": "0.5",
            "[email protected]": "0.7"
        },
        "interests_tags": "cars,cats,cinema",
        "mental_cards": {
            "no_alcohol@main": 8,
            "data_accumulation@main": 8,
            "open_data@main": 8
        }
    }
}

Architektúra služby

Služby tretích strán sú potrebné na zjednodušenie procesu zverejňovania a vyhľadávania údajov pre koncových používateľov.

Vyššie spomenutý je jedným z typov služieb, ktoré pomáhajú používateľovi publikovať jeho údaje v sieti. Môže existovať veľa podobných služieb, z ktorých každá poskytuje používateľovi pohodlné rozhranie na úpravu jedného z typov údajov (fórum, blog, otázka-odpoveď atď.). Ak používateľ nedôveruje službám tretích strán, potom si môže skript dátovej služby nainštalovať na svoju doménu alebo si ho sám vyvinúť.

Okrem služieb, ktoré umožňujú používateľom publikovať/upravovať údaje, poskytuje online prostredie množstvo ďalších služieb, ktoré vykonávajú pomerne zložité úlohy, ktoré je dosť problematické implementovať na uzloch koncových používateľov.

Jedným typom takejto služby sú dátové uzly ( opendatahub.org/en - príklad), ktorý funguje ako druh webového archívu, ktorý zhromažďuje všetky verejné strojovo čitateľné používateľské údaje a poskytuje k nim prístup cez API.

Prítomnosť služieb v takomto otvorenom, decentralizovanom online prostredí výrazne znižuje vstupnú bariéru pre používateľov, pretože nie je potrebné inštalovať a konfigurovať vlastný uzol. Používateľ zároveň zostáva pod kontrolou nad svojimi údajmi (kedykoľvek môže zmeniť službu, na ktorú je zverejnenie údajov delegované alebo si vytvoriť vlastný uzol).

Ak používateľ vôbec nemá záujem vlastniť svoje údaje a nemá vlastnú doménu alebo niekoho, kto je s doménou oboznámený, potom jeho údaje štandardne spravuje opendatahub.org.

Na koho úkor je to všetko?

Snáď hlavným problémom takmer všetkých takýchto decentralizovaných projektov je neschopnosť speňažiť ich na úrovni postačujúcej na stabilný rozvoj a podporu.

Darovať + tokeny sa používajú na pokrytie nákladov na vývoj a marketing v tomto online prostredí.

Všetky dary, ktoré používatelia poskytujú interným projektom/službám, sú verejne dostupné, strojovo čitateľné a prepojené s e-mailom. To umožňuje ich zohľadnenie napríklad pri výpočte online sociálneho hodnotenia a zverejnení na stránkach používateľov. Keď dary prestanú byť anonymné, potom používatelia v skutočnosti neprispievajú, ale „čipujú“ na podporu všeobecného informačného prostredia. Tak ako ľudia čipujú pri oprave spoločných priestorov s primeraným prístupom k tým ľuďom, ktorí čipovať odmietli.

Okrem darov sa na získavanie prostriedkov používajú žetóny vydané v obmedzenom množstve (400.000 XNUMX), ktoré získa každý, kto daruje hlavnému fondu (etnogenéza).

Ďalšie funkcie tokenu

Každý token je „kľúčom“ pre prístup do tohto online prostredia. To znamená, že môžete využívať služby a byť súčasťou online prostredia, len ak máte aspoň 1 token, ktorý je viazaný na email.

Tokeny sú dobrým spamovým filtrom kvôli ich obmedzenej povahe. Čím viac používateľov je v systéme, tým ťažšie je získať token a tým drahšie je vytvárať roboty.

Ľudia, ich údaje a sociálne prepojenia sú dôležitejšie ako technológie

Popísané online prostredie je technicky pomerne primitívne riešenie. Ale dôležitejšie v ňom nie sú ani tak technológie, ako ľudia a sociálne prepojenia a dáta (obsah) vytvorené v prostredí.

Vytvorená sociálna komunita, ktorej členovia majú svoje univerzálne identifikátory (e-mail a vlastnú doménu) a štruktúrované dáta (s URN adresami, ontológiou a objektmi JSON), keď sa objaví lepšie technické riešenie, môže všetky tieto dáta preniesť do iného online prostredia, pri zachovaní vytvorených spojení (hodnotenia, hodnotenia) a obsahu.

Tento príspevok popisuje jeden z prvkov sieťovej samoorganizovanej komunity, ktorá okrem decentralizovaného online prostredia zahŕňa množstvo offline oblastí, ktoré zvyšujú výhody online prostredia a sú to „zákazníci“, ktorí do veľkej miery určujú jeho funkčnosť. Ale to sú témy na iné články, ktoré priamo nesúvisia s IT a technológiami.

Zdroj: hab.com

Pridať komentár