Ang proyekto Debian nagsugod sa usa ka kinatibuk-ang boto sa mga criteria alang sa pagkabukas sa mga modelo sa AI

Ang proyekto Debian nagpahibalo og boto sa kinatibuk-ang resolusyon (GR) taliwala sa mga developer sa proyekto aron aprobahan ang mga criteria sa pagdawat sa mga modelo sa machine learning ngadto sa pangunang repository sa proyekto. Nagsugod na ang hugna sa diskusyon, human niini magsugod na ang pagkolekta sa mga boto (wala pa matino ang petsa sa pagsugod sa boto). Gibana-bana nga 1,000 ka mga developer nga nalambigit sa pagmentinar sa mga pakete ug imprastraktura ang kwalipikado nga mobotar. Debian.

Ang mga modelo sa AI nga giapod-apod ubos sa mga bukas nga lisensya, apan wala maghatag og tinubdan nga materyal ug mga himan alang sa pagbansay sa modelo, gisugyot nga mailhan nga dili uyon sa mga sukdanan. Debian, paghubit sa libreng software (DFSG, Debian Giya sa Libre nga Software). Kon maaprobahan ang proposal, ang maong mga modelo dili maapil sa pangunang repositoryo sa proyekto. Ang posibilidad sa pagsumite sa maong mga modelo ngadto sa mga dili libre nga repositoryo wala gikonsiderar sa kasamtangang proseso sa pagboto.

Lakip sa mga problema nga motumaw kung ang datos nawala gikan sa pagbansay, ang mosunod gihisgutan:

  • Ang kakulang sa tinubdan sa datos o mga programa nga gigamit alang sa pagbansay-bansay naglimite sa abilidad sa pag-usab sa kasamtangang mga modelo sa AI. Bisan tuod gitugotan ang mga pagbag-o sa lisensya, ang maong mga pagbag-o lisod sa praktis. Ang mga pagbag-o mahimong gikinahanglan, pananglitan, aron ilisan ang tokenizer nga gikinahanglan aron makadugang og suporta alang sa mga bag-ong pinulongan.
  • Ang datos nga gigamit para sa pagbansay mahimong isipon nga "source code" sa modelo, ug ang nahuman nga modelo isip resulta sa pagproseso niining "source code" gamit ang mga himan sa pagbansay. Busa, aron hingpit nga mausab ang modelo, kinahanglan nga posible nga mausab ang tinubdan nga datos ug ang mga himan.
  • Ang kawalay katakos sa pagkopya sa trabaho nga gihimo aron mahimo ang modelo nga wala’y access sa orihinal nga datos ug mga himan.
  • Mga isyu sa seguridad ug etikal. Kung walay source data ug mga himan, ang abilidad sa pag-ayo sa mga kahuyangan sa mga modelo limitado lamang sa pag-apply sa binary patches o hingpit nga pag-ilis sa modelo. Ang maong mga patch mahimo lamang nga andamon sa tagsulat sa modelo, nga magbilin sa mga konsumidor nga hingpit nga nagsalig kanila. Dugang pa, walay bisan kinsa, lakip ang mga tagsulat sa modelo, ang makasabot sa kinaiya sa gisugyot nga mga pagbag-o. Ang kakulang sa source data nagpalisud usab sa pag-ila sa mga backdoor sa mga modelo sa machine learning.
  • Mga Restriksyon sa pag-analisar. Kung wala ang tinubdan nga datos, imposible nga kumpirmahon nga ang modelo gibansay sa datos nga adunay lisensya ubos sa mga lisensya nga nagtugot sa maong paggamit, o aron isalikway ang posibilidad nga ang ilegal nga nakuha nga datos gigamit atol sa pagbansay. Dugang pa, kung ang pagbansay gihimo gamit ang datos nga adunay lisensya sa GPL, mahimong kinahanglan nga analisahon ang output sa modelo alang sa mga tipik nga adunay mga kopya niini nga datos, nga nanginahanglan og attribution ug lisensya. Ang usa ka developer mahimong maglakip sa code/content nga gihimo sa modelo sa ilang proyekto ug wala tuyoa nga nakalapas sa lisensya alang sa pipila sa tinubdan nga datos.

Niadtong miaging Oktubre, ang Open Source Initiative (OSI) nagpatik ug depinisyon sa usa ka open AI system (Open Source AI). Ang usa ka open AI system kinahanglan maghatag sa mosunod: paggamit alang sa bisan unsang katuyoan nga dili magkinahanglan ug lahi nga pagtugot; pagtuon sa operasyon sa sistema ug pag-inspeksyon sa mga sangkap niini; pag-usab alang sa bisan unsang katuyoan; ug pagpaambit sa orihinal ug giusab nga mga bersyon sa uban, nga walay mga pagdili sa paggamit. Ang usa ka open AI system kinahanglan maglakip sa detalyado nga impormasyon bahin sa arkitektura sa modelo, ang datos nga gigamit alang sa pagbansay, ug ang pamaagi sa pagbansay, ingon man ang source code alang sa pagpadagan ug pagbansay sa AI system. Kini nga impormasyon kinahanglan igo aron ang usa ka propesyonal nga developer makahimo pag-usab sa usa ka katumbas nga AI system gamit ang parehas o susamang datos alang sa pagbansay.

Gikritika sa Software Freedom Conservancy (SFC) kini nga depinisyon. Ang ilang kawalay katagbawan naggikan sa kamatuoran nga ang mga criteria kulang sa kinahanglanon sa paghatag sa datos nga gigamit sa pagbansay sa modelo. Ang depinisyon sa OSI nagkinahanglan lamang og detalyado nga impormasyon bahin sa datos sa pagbansay, dili ang datos mismo. Ang gisagop nga depinisyon naggarantiya lamang sa duha sa upat ka giingon nga mga kagawasan sa open source—ang katungod sa paggamit ug ang katungod sa pag-apod-apod—samtang dili hingpit nga naggarantiya sa mga katungod sa pag-usab ug pagtuon.

Ang desisyon sa OSI gibase sa kamatuoran nga ang pagmantala sa source data kasagaran imposible tungod sa mga hinungdan nga dili makontrol sa AI model developer, sama sa panginahanglan sa pagmintinar sa confidentiality, paggamit sa copyrighted materials, paglilisensya sa data gikan sa third-party providers, ug uban pa. Kon idugang ang usa ka data provision requirement, walay usa sa kasamtangang dagkong language models ang isipon nga open source, ug ang depinisyon mismo mahimong usa ka dili makab-ot nga utopia.

Source: opennet.ru

Pagpalit kasaligan nga pag-host alang sa mga site nga adunay proteksyon sa DDoS, mga server sa VPS VDS 🔥 Pagpalit og kasaligang website hosting nga adunay proteksyon sa DDoS, VPS VDS servers | ProHoster