Informationsmiljø baseret på Open Data principper

Informationsmiljø baseret på Open Data principper

Det foreslåede informationsmiljø er en slags decentraliseret socialt netværk. Men i modsætning til mange eksisterende løsninger har dette miljø en række nyttige egenskaber udover decentralisering og er skabt på basis af ret simple og standard tekniske løsninger (email, json, tekstfiler og lidt blockchain). Dette giver alle med grundlæggende programmeringsviden mulighed for at skabe deres egne tjenester til dette miljø.

Universelt ID

I ethvert online miljø er bruger- og objektidentifikatorer et af nøgleelementerne i systemet.

I dette tilfælde er brugeridentifikationen e-mail, som faktisk er blevet en generelt accepteret identifikator til autorisation på websteder og andre tjenester (jaber, openId).

Faktisk er brugeridentifikationen i et givet online miljø login+domæneparret, som for nemheds skyld er skrevet i den form, de fleste kender. Samtidig er det for større decentralisering tilrådeligt, at hver bruger har sit eget domæne. Hvilket er tæt på principperne for indieweb, hvor et domæne bruges som brugeridentifikator. I vores tilfælde tilføjer brugeren et kaldenavn til sit domæne, som giver ham mulighed for at oprette flere konti på et domæne (for venner, for eksempel) og gør adresseringssystemet mere fleksibelt.

Dette bruger-id-format er ikke bundet til noget netværk. Hvis en bruger placerer sine data på TOR-netværket, så kan han bruge domæner i .onion-zonen, hvis dette er et netværk med et DNS-system på blockchain, så domæner i .bit-zonen. Som følge heraf afhænger formatet til adressering af brugere og deres data ikke af det netværk, som de transmitteres igennem (login+domænekombinationen bruges overalt). For dem, der ønsker at bruge en bitcoin/ethereum-adresse som en identifikator, kan du ændre systemet til at bruge formens pseudo-e-mailadresser [email protected]

Adressering af objekter

Dette online miljø er faktisk et sæt af objekter, der er beskrevet i en struktureret, maskinlæsbar form, henviser til andre objekter og er knyttet til en bestemt bruger (e-mail) eller projekt/organisation (domæne).

urner i urn:opendata navneområdet bruges som objektidentifikatorer. For eksempel har en brugerprofil en adresse som:

urn:opendata:profile:[email protected]

Brugerkommentaren har en adresse som:

urn:opendata:comment:[email protected]:08adbed93413782682fd25da77bd93c99dfd0548

hvor 08adbed93413782682fd25da77bd93c99dfd0548 er en tilfældig sha-1 hash, der fungerer som objekt-id, og [e-mail beskyttet] — ejeren af ​​denne genstand.

Princip for publicering af brugerdata

Med dit eget domæne under kontrol, kan brugeren nemt publicere sine data og indhold. Og i modsætning til indiebeb, kræver dette ikke, at der skal oprettes en hjemmeside med html-sider med indbygget semantisk data.

For eksempel findes grundlæggende oplysninger om brugeren i filen datarobots.txt, som er placeret på en adresse som f.eks

http://55334.ru/[email protected]/datarobots.txt

Og den har indhold som dette:

Object: user
Services-Enabled: 55334.ru,newethnos.ru
Ethnos: newethnos
Delegate-Tokens: http://55334.ru/[email protected]/delegete.txt

Det vil sige, at det faktisk er et sæt strenge med data af formen key->value, parsing, hvilket er en simpel opgave for alle med grundlæggende programmeringsviden. Og du kan redigere dataene, hvis du ønsker det ved hjælp af en almindelig notesblok.

Mere komplekse data (profil, kommentar, indlæg osv.), som har sin egen urne, sendes som et JSON-objekt ved hjælp af standard-API'en (http://opendatahub.org/api_1.0?lang=ru), som kan være placeret som på brugerens domæne og på et tredjepartswebsted, hvortil brugeren har uddelegeret lagring, offentliggørelse og redigering af sine data (i Services-Enabled-linjen i datarobots.txt-filen). Sådanne tredjepartstjenester er beskrevet nedenfor.

Simpel ontologi og JSON

Kommunikationsmiljøets ontologi er relativt enkel sammenlignet med ontologier i industriens vidensbaser. Da der i kommunikationsmiljøet er et relativt lille sæt standardobjekter (post, kommentar, like, profil, anmeldelse) med et relativt lille sæt egenskaber.

For at beskrive objekter i et sådant miljø er det derfor nok at bruge JSON i stedet for XML, som er mere kompleks i struktur og parsing (det er vigtigt ikke at glemme behovet for en lav indgangstærskel og skalerbarhed).

For at få fat i et objekt med en kendt urne, skal vi kontakte brugerens domæne eller tredjepartstjenester, som brugeren har uddelegeret administration af sine data til.

I dette onlinemiljø har hvert domæne, hvor der findes en onlinetjeneste, også sin egen datarobots.txt placeret på en adresse som eksempel.com/datarobots.txt med lignende indhold:

Object: service
Api: http://newethnos.ru/api
Api-Version: http://opendatahub.org/api_1.0

Hvorfra vi kan lære, at vi kan få data om et objekt på en adresse som:

http://newethnos.ru/api?urn=urn:opendata:profile:[e-mail beskyttet]

JSON-objektet har følgende struktur:

{
    "urn": "urn:opendata:profile:[email protected]",
    "status": 1,
    "message": "Ok",
    "timestamp": 1596429631,
    "service": "example.com",
    "data": {
        "name": "John",
        "surname": "Gald",
        "gender": "male",
        "city": "Moscow",
        "img": "http://domain.com/image.jpg",
        "birthtime": 332467200,
        "community_friends": {
            "[email protected]": "1",
            "[email protected]": "0.5",
            "[email protected]": "0.7"
        },
        "interests_tags": "cars,cats,cinema",
        "mental_cards": {
            "no_alcohol@main": 8,
            "data_accumulation@main": 8,
            "open_data@main": 8
        }
    }
}

Service arkitektur

Tredjepartstjenester er nødvendige for at forenkle processen med at publicere og søge data for slutbrugere.

Ovennævnte er en af ​​de typer tjenester, der hjælper brugeren med at offentliggøre sine data på netværket. Der kan være mange lignende tjenester, som hver især giver brugeren en praktisk grænseflade til at redigere en af ​​datatyperne (forum, blog, spørgsmål-svar osv.). Hvis brugeren ikke har tillid til tredjepartstjenester, kan han installere et dataservicescript på sit domæne eller selv udvikle det.

Ud over tjenester, der giver brugerne mulighed for at publicere/redigere data, tilbyder online-miljøet en række andre tjenester, der udfører relativt komplekse opgaver, som er ret problematiske at implementere på slutbruger-knudepunkter.

En type af en sådan tjeneste er datahubs ( opendatahub.org/ru - eksempel), fungerer som en slags webarkiv, der samler alle offentlige maskinlæsbare brugerdata og giver adgang til dem via API.

Tilstedeværelsen af ​​tjenester i et så åbent, decentraliseret onlinemiljø reducerer adgangsbarrieren for brugere betydeligt, da der ikke er behov for at installere og konfigurere deres egen node. Samtidig forbliver brugeren i kontrol over sine data (han kan til enhver tid ændre den tjeneste, som offentliggørelsen af ​​data er delegeret til eller oprette sin egen node).

Hvis brugeren slet ikke er interesseret i at eje sine data og ikke har sit eget domæne eller nogen, der er bekendt med domænet, så administreres hans data som standard af opendatahub.org.

På hvis bekostning er alt dette?

Måske er hovedproblemet ved næsten alle sådanne decentraliserede projekter manglende evne til at tjene penge på dem på et niveau, der er tilstrækkeligt til stabil udvikling og støtte.

Doner + tokens bruges til at dække udviklings- og marketingomkostninger i dette online miljø.

Alle donationer, som brugere giver til interne projekter/tjenester, er offentligt tilgængelige, maskinlæsbare og linket til e-mail. Dette gør det muligt at tage hensyn til dem, for eksempel ved beregning af den online sociale vurdering og publiceret på brugersider. Når donationer ophører med at være anonyme, donerer brugerne faktisk ikke, men "chipper" ind for at understøtte det generelle informationsmiljø. Ligesom folk chip ind for at reparere fællesarealer med en passende holdning til de mennesker, der nægtede at chip ind.

Foruden donationer bruges poletter udstedt i et begrænset antal (400.000), for at indsamle midler, som uddeles til alle, der giver donationer til hovedfonden (etnogenese).

Yderligere token-funktioner

Hvert token er en "nøgle" for adgang til dette online miljø. Det vil sige, at du kun kan bruge tjenester og være en del af onlinemiljøet, hvis du har mindst 1 token, der er knyttet til en e-mail.

Tokens er et godt spamfilter på grund af deres begrænsede karakter. Jo flere brugere der er i systemet, jo sværere er det at få et token, og jo dyrere er det at oprette bots.

Mennesker, deres data og sociale forbindelser er vigtigere end teknologi

Det beskrevne online miljø er teknisk set en relativt primitiv løsning. Men det vigtigere i det er ikke så meget teknologi som mennesker og de sociale forbindelser og data (indhold), der skabes i miljøet.

Det skabte sociale fællesskab, hvis medlemmer har deres egne universelle identifikatorer (e-mail og deres eget domæne) og strukturerede data (med URN-adresser, ontologi og JSON-objekter), når en bedre teknisk løsning dukker op, kan overføre alle disse data til et andet online miljø, samtidig med at de dannede forbindelser (vurderinger, vurderinger) og indhold bevares.

Dette indlæg beskriver et af elementerne i et netværk selvorganiseret fællesskab, som udover det decentraliserede online miljø omfatter en række offline områder, der øger fordelene ved online miljøet og er "kunder", der i høj grad bestemmer dets funktionalitet. Men det er emner for andre artikler, som ikke er direkte relateret til it og teknologi.

Kilde: www.habr.com

Tilføj en kommentar