Heus Habr!
Non saepe statuimus translationes textuum hic biennium sine codice et plane naturae academicae ponere - sed hodie exceptionem faciemus. Speramus dilemma in titulo articuli sollicitudines multas legentium positas, et iam legis praecipuum opus in rationibus evolutionis, cum quibus haec tabella in originali disputat vel nunc legetur. Welcome to felis!
Mense Martio MMXVII, OpenAI fluctus in alta societate discendi fecit cum charta "
Strategies Evolutionary
Praecipua propositio chartarum OpenAI erat quod, pro supplemento studiorum cum tradito backpropagatione coniuncto, reticulum neurale ad solvendum implicatas difficultates utentes quod "consilium evolutionis" (ES" appellaverunt, feliciter instituerunt. Accessus hic ES constat ponere retis amplitudinem ponderum, quae multiplices agentium in parallelis laborantibus ac parametris ex hac distributione delectis utitur. Unumquodque agens in suo ambitu operatur, et expleto certo numero episodium vel stadium eventus, algorithmus reddit praemium cumulativum, expressum ut score congruens. Hoc valore ratione habita, distributio parametri in agentia feliciora transferri potest, minus prosperos privans. Milia temporum iterando talem operationem, centenis agentium participatione, movere potest distributio ponderum ad spatium, quod procuratores permittit edicere praecipuum quale consilium ad solvendum negotium illis datum. Re quidem vera eventus qui in articulo sunt impressivi sunt: ostenditur quod si mille agentium in parallelis curris, tum motivum anthropomorphicum in duobus cruribus disci posse minus quam media hora (dum etiam methodi antecedens RL plus exigunt. una hora est). Pro accuratioribus informationibus, lectioni excellenti commendo
Varia consilia docendae anthropomorphicae rectae ambulationis, studuit methodo ES utendi ab OpenAI.
Niger arca
Magna huius methodi utilitas est, ut facile pareatur. Dum RL modi, ut A3C, informationes postulant ut inter fila laborantium et servientem modularis permutanda sint, ES solum aestimationes idoneitatem indiget et notitias parametri distribuendi. Huic simplicitati obvenit quod methodus haec modernis RL longe antecedat methodis in terminis scalandis facultatibus. Sed haec omnia non incassum veniunt: habes ipsum secundum principium nigrum ad optimize retis. Hoc in casu, "arca nigra" significat in institutione retis structuram internam penitus ignorari, et solum totius eventus (praemium pro facto) adhibetur, et ab ea pendet num pondera alicuius retis voluntas. a posteris possidenda. In casibus in quibus non multae opiniones de ambitu accipimus — et in multis traditis RL quaestionibus profluxus praemiorum valde sparsus est — quaestio de "parte nigra capsa" esse "arcam omnino nigram". Hoc in casu, signanter augere potest fructibus, ita nimirum talis transactio iustificatur. "Quis eget gradientibus, si usquam tumultuantur?" — Haec communis opinio est.
Sed in casibus ubi opiniones magis activae sunt, res errare incipiunt pro ES. Turma OpenAI describit quomodo retis classificationis simplex MNIST utens ES instructus est, et hoc tempore 1000 temporibus tardius fuit. Re vera est signum gradientis in classificatione imaginis perquam informativum quoad modum quo melius classificationem retiacula doceret. Ita quaestio minus est cum RL arte et pluribus praemiis sparsis in ambitibus quae gradationes strepitus gignunt.
Naturae solutio
Si ex exemplo naturae cognoscere conamur, cogitando de modis evolvendi AI, quandoque AI in casibus cogitari potest.
Perspectis moribus intellectualibus mammalium, perspicimus eam formari ex multiplici mutua influxu duorum processuum proxime inter se cohaerentium; discere ab aliis experientiis и discere agendo. Illa saepe cum evolutione naturali electione impulsa aequatur, hic autem ampliori vocabulo utimur ad rationem epigeneticorum, microbiomarum, aliarumque mechanismatum, quae communicationem experientiarum inter organismos genetice extraneos efficiunt. Secundus processus, ab experientia discens, est omne indicium quod animal ad discendum per totam vitam agit, et haec informatio directe determinatur per commercium huius animalis cum extra mundum. Haec categoria omnia comprehendit a discendo res cognoscendi ad coercendam communicationem in processu discendi inhaerentem.
Dure loquendo, hi duo processus in natura occurrentes comparari possunt cum duobus optionibus ad retiacula optimizing neuralis. Insidijs evolutionis, ubi de gradibus informationes adhibentur ad informationes de organismo renovandas, propius ad discendum ab aliorum experientia accedunt. Similiter modi gradientes, ubi unam vel aliam experientiam obtinentes aliamve mutationem in moribus agentis perducunt, discendi ex propria experientia comparantur. Si consideremus de generibus intellegentium morum vel facultatum, quae singulae istae duae accessiones fiunt in animalibus, fit comparatio acutior. In utroque casu, "modos evolutionis" promovere studium reactivum agendi, qui permittit aliquem congruum enucleare (sufficiens ad vivendum). Doctrina ambulandi vel fugae captivitatis multis in casibus aequivalet moribus "instinctivis", qui "durum wired" in multis animalibus in gradu genetico sunt. Praeterea, hoc exemplum confirmat methodos evolutionis applicandas esse in casibus in quibus signum praemium rarissimum est (exempli gratia, res felicis suscitationis infantis). Hoc in casu, impossibile est praemium referre quamlibet speciem actionum quae multis annis ante huius rei eventum fieri potest. Ex altera parte, si consideremus casum in quo ES deficit, nempe imago classificationis, eventus egregie comparantur cum eventibus discendi animalis consecuti in innumerabilibus experimentis psychologicis gerendi ultra 100 annos peractis.
Discendi ab animalibus
Modi in doctrina supplementi adhibiti sunt in multis casibus directe ex litteris psychologicis desumptis
Praedictio praecipua in experientia discendi ab experientia mutat motus quos supra notabiliter describit. Signum quod antea nimis sparsum erat (praemium episodic) evadit densissimum esse. Res speculativae est aliquid simile: quovis tempore cerebrum mammalium computat eventus, in complexu stimulorum et actionum sensuum, animal simpliciter in hoc flumine immersum. In hoc casu, finalis animalis mores validum signum dat, quod ad moderandas praenotiones et progressionem agendi adhibenda est. His omnibus significationibus cerebrum utitur ad praenuntiationes optimizandas (ac proinde actionum qualitates) in futurum. Cuius accessionis recensio habetur in optimo libro.
Ditior disciplina retiacula neural
Ex principiis activitatis neuralis altioris inhaerentis cerebro mammalio, quae assidue occupatur praedictiones, recentes progressiones factae sunt in supplementum doctrinae, quae nunc considerat momentum talium praedictionum. Duo similia opera tibi statim commendare possum:
In utroque chartarum auctoribus auctoribus defaltam propriae retiacula neuralis eorum supplementum adiungit cum vaticinio eventus de statu ambitus in futuro. In primo articulo, praevidens applicatur variarum mensurarum variabilium, et in secundo praevisio applicatur mutationum rerum et agendi secundum se gerendi; In utroque casu, signum sparsum cum subsidiis positive coniungendis multo uberior fit informativus, permittens tam citius discendi quam multiplicior agendi ratio. Emendationes eiusmodi tantum in promptu sunt cum modis qui signo gradiente utuntur, non cum methodis quae in principio "nigrae arca" operantur, sicut ES.
Praeterea, doctrina experientiae et methodi gradientes multo efficaciores sunt. Etiam in casibus ubi fieri potuit ut problema particulari studeret utens methodo ES citius quam utens supplementum discendi, lucrum consecutum est ex eo quod consilium ES pluries plurium notitiarum quam cum RL implicavit. In hoc enim considerando principia addiscendorum in animalibus, notamus quod ex exemplo alterius discendi post multas generationes se manifestat, quandoque autem unum quod per se expertus est, sufficit animali ad discendum semper lectionem. dum sicut
Quidni igitur ea cogenda?
Verisimile est quod multa huius articuli impressionem relinqueret quod ego RL modos auctor. Ego tamen existimo optimam utriusque methodi solutionem detegere, ut in iis adiunctis, in quibus aptissimum est, uterque adhibeatur. Patet, in multis reacceptis consiliis, vel in condicionibus cum raris significationibus positivi subsidii, ES vincit, praesertim si vim computandi in arbitrio tuo habes, in qua rudimenta massive comparare potes. Ex altera parte, methodi gradientes utentes ad doctrinam supplementum vel ad eruditionem procurandam utiles erunt cum accessus ad amplas opiniones et opus est ad solvendam quaestionem cito et cum minori notitia discendum.
Conversus ad naturam invenimus quod primus modus secundum essentiam fundat secundum. Hac de causa, per cursum evolutionis, mammalia cerebra effecta sunt, quae permittunt ut efficaciter discere a signis complexis ex ambitu ortis. Patet igitur quaestio. Insidijs evolutionis fortasse adiuvabit ut architecturae discendi efficaces adinveniant, quae etiam ad methodos discendi gradientes utiles erunt. Ceterum solutio a natura inventa est quidem prospere.
Source: www.habr.com