Entorn d'informació basat en els principis de dades obertes

Entorn d'informació basat en els principis de dades obertes

L'entorn d'informació proposat és una mena de xarxa social descentralitzada. Però a diferència de moltes solucions existents, aquest entorn té una sèrie de propietats útils a més de la descentralització i es crea sobre la base de solucions tècniques bastant senzilles i estàndard (correu electrònic, json, fitxers de text i una mica de blockchain). Això permet que qualsevol persona amb coneixements bàsics de programació pugui crear els seus propis serveis per a aquest entorn.

ID universal

En qualsevol entorn en línia, els identificadors d'usuari i d'objecte són un dels elements clau del sistema.

En aquest cas, l'identificador d'usuari és el correu electrònic, que en realitat s'ha convertit en un identificador generalment acceptat per a l'autorització en llocs web i altres serveis (jaber, openId).

De fet, l'identificador d'usuari en un entorn en línia determinat és el parell inici de sessió+domini, que per comoditat s'escriu de la forma que coneixen la majoria. Al mateix temps, per a una major descentralització, és aconsellable que cada usuari tingui el seu propi domini. El que s'acosta als principis d'indieweb, on s'utilitza un domini com a identificador d'usuari. En el nostre cas, l'usuari afegeix un sobrenom al seu domini, que li permet crear diversos comptes en un mateix domini (per als amics, per exemple) i fa que el sistema d'adreçament sigui més flexible.

Aquest format d'ID d'usuari no està vinculat a cap xarxa. Si un usuari col·loca les seves dades a la xarxa TOR, pot utilitzar dominis a la zona .onion; si es tracta d'una xarxa amb un sistema DNS a la cadena de blocs, llavors dominis a la zona .bit. Com a resultat, el format d'adreçament als usuaris i les seves dades no depèn de la xarxa a través de la qual es transmeten (la combinació inici de sessió+domini s'utilitza a tot arreu). Per a aquells que vulguin utilitzar una adreça de bitcoin/ethereum com a identificador, podeu modificar el sistema per utilitzar pseudo-adreces de correu electrònic del formulari [email protected]

Adreçar objectes

Aquest entorn en línia és en realitat un conjunt d'objectes que es descriuen en una forma estructurada i llegible per màquina, fan referència a altres objectes i estan vinculats a un usuari (correu electrònic) o projecte/organització (domini) específics.

les urnes de l'espai de noms urn:opendata s'utilitzen com a identificadors d'objecte. Per exemple, un perfil d'usuari té una adreça com:

urn:opendata:profile:[email protected]

El comentari de l'usuari té una adreça com:

urn:opendata:comment:[email protected]:08adbed93413782682fd25da77bd93c99dfd0548

on 08adbed93413782682fd25da77bd93c99dfd0548 és un hash aleatori sha-1 que actua com a identificador d'objecte i [protegit per correu electrònic] — el propietari d'aquest objecte.

Principi de publicació de dades d'usuari

Tenint el teu propi domini sota control, l'usuari pot publicar fàcilment les seves dades i contingut. I a diferència d'indiebeb, això no requereix la creació d'un lloc web amb pàgines HTML amb dades semàntiques incorporades.

Per exemple, la informació bàsica sobre l'usuari es troba al fitxer datarobots.txt, que es troba en una adreça com ara

http://55334.ru/[email protected]/datarobots.txt

I té un contingut com aquest:

Object: user
Services-Enabled: 55334.ru,newethnos.ru
Ethnos: newethnos
Delegate-Tokens: http://55334.ru/[email protected]/delegete.txt

És a dir, de fet, és un conjunt de cadenes amb dades de la forma clau->valor, anàlisi que és una tasca senzilla per a qualsevol persona amb coneixements bàsics de programació. I podeu editar les dades si ho voleu amb un bloc de notes normal.

Les dades més complexes (perfil, comentari, publicació, etc.), que tenen la seva pròpia urna, s'envien com a objecte JSON mitjançant l'API estàndard (http://opendatahub.org/api_1.0?lang=ru), que pot estar ubicat com al domini de l'usuari, i en un lloc de tercers en el qual l'usuari hagi delegat l'emmagatzematge, la publicació i l'edició de les seves dades (a la línia Serveis Habilitats del fitxer datarobots.txt). Aquests serveis de tercers es descriuen a continuació.

Ontologia simple i JSON

L'ontologia de l'entorn de comunicació és relativament simple en comparació amb les ontologies de les bases de coneixement de la indústria. Atès que a l'entorn de comunicació hi ha un conjunt relativament petit d'objectes estàndard (publicació, comentari, m'agrada, perfil, ressenya) amb un conjunt de propietats relativament petit.

Per tant, per descriure objectes en aquest entorn, n'hi ha prou amb utilitzar JSON en comptes d'XML, que és més complex en estructura i anàlisi (és important no oblidar-se de la necessitat d'un llindar d'entrada i escalabilitat baix).

Per obtenir un objecte amb una urna coneguda, hem de contactar amb el domini de l'usuari, o amb serveis de tercers en els quals l'usuari té delegada la gestió de les seves dades.

En aquest entorn en línia, cada domini on existeix un servei en línia també té el seu propi datarobots.txt situat en una adreça com example.com/datarobots.txt amb contingut similar:

Object: service
Api: http://newethnos.ru/api
Api-Version: http://opendatahub.org/api_1.0

De la qual podem aprendre que podem obtenir dades sobre un objecte en una adreça com:

http://newethnos.ru/api?urn=urn:opendata:profile:[protegit per correu electrònic]

L'objecte JSON té l'estructura següent:

{
    "urn": "urn:opendata:profile:[email protected]",
    "status": 1,
    "message": "Ok",
    "timestamp": 1596429631,
    "service": "example.com",
    "data": {
        "name": "John",
        "surname": "Gald",
        "gender": "male",
        "city": "Moscow",
        "img": "http://domain.com/image.jpg",
        "birthtime": 332467200,
        "community_friends": {
            "[email protected]": "1",
            "[email protected]": "0.5",
            "[email protected]": "0.7"
        },
        "interests_tags": "cars,cats,cinema",
        "mental_cards": {
            "no_alcohol@main": 8,
            "data_accumulation@main": 8,
            "open_data@main": 8
        }
    }
}

Arquitectura de serveis

Els serveis de tercers són necessaris per simplificar el procés de publicació i cerca de dades per als usuaris finals.

Esmentat anteriorment és un dels tipus de serveis que ajuden l'usuari a publicar les seves dades a la xarxa. Hi pot haver molts serveis similars, cadascun dels quals proporciona a l'usuari una interfície còmoda per editar un dels tipus de dades (fòrum, bloc, pregunta-resposta, etc.). Si l'usuari no confia en serveis de tercers, pot instal·lar un script de servei de dades al seu domini o desenvolupar-lo ell mateix.

A més dels serveis que permeten als usuaris publicar/editar dades, l'entorn en línia ofereix una sèrie d'altres serveis que realitzen tasques relativament complexes que són força problemàtiques d'implementar als nodes d'usuari final.

Un tipus d'aquest servei són els concentradors de dades ( opendatahub.org/en - exemple), actuant com una mena d'arxiu web que recull totes les dades públiques d'usuari llegibles per màquina i ofereix accés a ella mitjançant API.

La presència de serveis en un entorn en línia tan obert i descentralitzat redueix significativament la barrera d'entrada dels usuaris, ja que no cal instal·lar i configurar el seu propi node. Al mateix temps, l'usuari manté el control de les seves dades (en qualsevol moment pot canviar el servei al qual es delega la publicació de dades o crear el seu propi node).

Si l'usuari no està gens interessat a ser propietari de les seves dades i no té el seu propi domini o algú que conegui el domini, aleshores, per defecte, les seves dades les gestiona opendatahub.org.

Tot això a costa de qui?

Potser el principal problema de gairebé tots aquests projectes descentralitzats és la incapacitat de monetitzar-los a un nivell suficient per a un desenvolupament i un suport estables.

Donar + fitxes s'utilitzen per cobrir els costos de desenvolupament i màrqueting en aquest entorn en línia.

Totes les donacions que els usuaris fan a projectes/serveis interns estan disponibles públicament, llegibles per màquina i enllaçades al correu electrònic. Això permet tenir-los en compte, per exemple, a l'hora de calcular la valoració social en línia i publicar-los a les pàgines d'usuari. Quan les donacions deixen de ser anònimes, de fet, els usuaris no donen, sinó que "entren" per donar suport a l'entorn d'informació general. De la mateixa manera que les persones intervenen per reparar les zones comunes amb una actitud adequada cap a aquelles persones que es van negar a fer-ho.

A més de les donacions, per recaptar fons, s'utilitzen fitxes emeses en quantitat limitada (400.000) que s'atorguen a tothom que faci donacions al fons principal (etnogènesi).

Funcions addicionals de testimoni

Cada testimoni és una "clau" per accedir a aquest entorn en línia. És a dir, només podeu utilitzar serveis i formar part de l'entorn en línia si teniu almenys 1 testimoni vinculat a un correu electrònic.

Els fitxes són un bon filtre de correu brossa a causa de la seva naturalesa limitada. Com més usuaris hi hagi al sistema, més difícil és obtenir un token i més car és crear bots.

Les persones, les seves dades i connexions socials són més importants que la tecnologia

L'entorn en línia descrit és tècnicament una solució relativament primitiva. Però el més important no és tant la tecnologia com les persones i les connexions socials i les dades (continguts) creades a l'entorn.

La comunitat social creada, els membres de la qual tenen els seus propis identificadors universals (correu electrònic i domini propi) i dades estructurades (amb adreces URN, ontologia i objectes JSON), quan apareix una solució tècnica millor, pot transferir totes aquestes dades a un altre entorn en línia, mantenint les connexions formades (valoracions, valoracions) i el contingut.

Aquest post descriu un dels elements d'una comunitat autoorganitzada en xarxa, que, a més de l'entorn en línia descentralitzat, inclou una sèrie d'àrees fora de línia que augmenten els beneficis de l'entorn en línia i són "clients" que en determinen en gran mesura la funcionalitat. Però aquests són temes per a altres articles que no estan directament relacionats amb TI i tecnologia.

Font: www.habr.com

Afegeix comentari