Delta: Data Synchronisation et Locupletatio Platform

In antecessum deducendi novi fluxus in rate Data Engineer translationem materiae iucundae paravimus.

Delta: Data Synchronisation et Locupletatio Platform

Overview

Loquemur de satis populari exemplari, quo applicationes multiplices notitiarum thesaurorum utuntur, ubi unaquaeque promptuarium ad suos usus adhibetur, exempli gratia, ut formam canonicam notitiarum (MySQL, etc.), inquisitionis facultatem provectam praebeat (ElasticSearch; etc.) .), caching (Memcached, etc.) and others. De more, cum multa notitia rerum utens, unus eorum agit ut copia prima, altera ut thesaurus derivativae. Sola quaestio est quomodo haec notitia thesaurorum synchronizem esse.

Aliquot exemplaria varia inspeximus quae problema synchronum thesaurorum multiplicium solvere conati sunt, ut duplex scribit, res gestas distribuit, etc. Sed accessus significantes limitationes habent secundum usum realem, fidem et sustentationem. Praeter synchronisationi datae, nonnullae applicationes etiam indigent ad notitias amplificandas vocando exteriora officia.

Delta ad has difficultates solvendas elaboravit. Delta tandem praebet suggestum congruentem, eventu agitatam pro synchronisation et locupletandi notitia.

Existens solutiones

Duplex viscus

Ut binas tabulas in synthesis contineas, scribendo duali uti potes, quae uni copia scribit, alteri statim postea scribit. Prima memoria revocari potest et secunda abortum fieri, si prior numerus conatibus exhaustis deficit. Sed duo thesauri ex synthesin fieri possunt si scriptura ad secundam copiam defecerit. Solet haec quaestio solvi per modum recuperandi creando qui notitias a prima tabulario ad secundum periodice re- transferre potest, vel solum si differentiae in notitia deprehenduntur.

Problemata:

Faciendi modum recuperandi officium specificum est quod reddi non potest. Praeterea notitia locorum repositionis ex sync usque remanet donec processus restitutus fiat. Solutio magis implicata fit si plures quam duae notitiae thesaurorum adhibeantur. Denique procedendi restitutio augere potest onus ad principium datae originis.

Mutatio iniuriarum mensa

Cum mutationes tabularum statuto occurrunt (ut inserendi, adaequationis, et notae deletae), tabulae mutatae additae sunt tabulae in partem eiusdem transactionis. Alius stamina vel processus constanter petit eventa e tabula stipendii easque scribit ad unum vel plures notitias, si opus est, eventus e tabula loga removens postquam recordum ab omnibus thesauris confirmatum est.

Problemata:

Praefecti bibliothecae perficiendae sunt, et specimen sine mutatione Codicis applicationis eo utentem. In ambitu polyglotta, exsecutio talis bibliothecae debet esse in quavis lingua necessaria, sed ad soliditatem functionis et morum per linguas obtinendam difficillimum est.

Alia quaestio in obtinendo schematis mutationibus in systematis quae schema transactionale non sustinent mutationes [1][2], ut MySQL. Ideo exemplar mutandi (exempli gratia schema mutationis) et transactioniter illud in tabula mutabili notans non semper laborabit.

Distributa Opera

Negotiationes distributae adhiberi possunt transactionem per plures heterogeneos notitias thesaurorum scindendi ita ut operatio vel omnibus usibus usorum adhibitorum committatur vel nulli ex eis committatur.

Problemata:

Negotiationes distributae valde magnae sunt problema pro notitia thesaurorum heterogeneorum. Natura sua solum niti potest in ultimo denominatore communi systematum implicatorum. Exempli gratia, XA transactiones exsecutionem impediunt si processus applicationis in periodo praeparationis deficit. Accedit, XA detectionem deadlock vel deprehensionem optimam machinis moderandi adiuvandum non praebet. Praeter quaedam systemata ElasticSearch ut XA vel quodlibet aliud exemplar transactionis heterogeneae heterogeneae non sustinent. Ita ut atomicam scribendam in variis notitiis technologiae repositionis remaneat valde difficilis ad applicationes[3].

Delta

Delta destinata erat ut solutiones synchronisationum datarum exsistentium adscriberent et etiam ad locupletationem notitiarum muscarum dat. Propositum erat has omnes complexiones abstrahere ab applicatione tincidunt ut plene intendere possent ad functionem functionis exsequendam. Deinde "Movie Search" describemus usum actualem causam pro Delta Netflix.

Netflix late utitur architectura microservii, et quaelibet microservio typice inservit uni speciei notitiae. Basic informationes de cinematographico in microservice quae vocatur Movie Service continetur, et notitias consociatas ut informationes de effectoribus, actoribus, venditoribus, et sic de pluribus aliis micromissionibus administratur (nempe Deal Service, Talent Service and Vendor Service).
Negotia usorum apud Netflix Studios saepe per varias criteriis pelliculas investigare necesse est, quae idcirco illis magni momenti est ut per omnia cinematographica notitia cinematographica inquirere possint.

Priusquam Delta, turmae pelliculae quaerendi opus erat ut notitias e multis micromissionibus traheret antequam notitias cinematographicas indiceret. Praeterea, turmas systema evolvere oportuit, quod per intervalla investigationis indicem renovaret postulans mutationes ab aliis micromissionibus, etiamsi omnino nullae essent mutationes. Haec ratio cito facta est multiplex et difficilis conservatio.

Delta: Data Synchronisation et Locupletatio Platform
Figure 1. Stipendium ratio ad Delta
Postquam Delta usus est, ratio facilior facta est ad eventum systematis agitatum ut in sequenti figura ostensum est. CDC (Mutare-Data-Captura) res ad Keystone Kafka mittuntur argumenta utentes Delta-Connector. Applicatio Delta constructa utens in Delta Streamo Processing Framework (Flink innixa) eventus CDC ex argumento accipit, eas amplificat vocando alia microform, ac demum locupleta data ad indicem in Elastica investigatione transit. Totum processum fere tempore reali fit, hoc est, cum primum mutationes in notitia horreorum committuntur, indices geographici renovantur.

Delta: Data Synchronisation et Locupletatio Platform
Figure 2. Data pipeline usura Delta
In sequentibus sectionibus, operationem Delta-Connectoris describemus, quae cum repositione coniungit et eventus CDC praedicat ad iacuit onerariis, quae notitia realis temporis tradenda est infrastructura quae itinera CDC eventus ad argumenta Kafka referuntur. Et in ipso fine loquemur de compage processus Delta amnis, qua applicatione tincidunt uti possunt ad processus notitias et locupletandas logicas.

CDC (Mutare-Data-Captura)

Evolvimus ministerium CDC nomine Delta-Connector, quod mutationes e notitiarum copia in reali tempore commissas capere potest et eas ad rivum scribere. Mutationes real-time sumuntur ex transactione stipes et eri ceptacula. Dumps adhibentur, quia res gestae totam historiam mutationum plerumque non condunt. Mutationes typice serialized sicut Delta eventus, sic recipiens solliciti esse non debet unde mutatio exeat.

Delta-Connector plures notas additas sustinet ut:

  • Facultas scribendi consuetudo output data praeterita Kafka.
  • Facultas excitandi eri manuales quovis tempore pro omnibus tabulis, ad certam mensam, vel ad claves primarias specificas.
  • Dumps in chunks recuperari potest, ideo in casu deficiendi non est opus denuo incipere.
  • Non opus est seris in tabulis ponere, quod magni momenti est curare ut negotiatio datorum scribat numquam nostro servitio impediri.
  • Excelsa disponibilitate debita instantiae redundantis in AWS Availability Zonae.

Nunc MySQL et Postgres, inclusa in AWS RDS et Aurora instruere. Nos quoque Cassandram adiuvamus. Plura de Delta-Connector hic invenire potes blog.

Kafka iacuit et onerariis

Eventus onerariis Delta iacuit aedificatur in suggestu's nuntius muneris Keystone.

Historice dispositis Netflix optimized est pro accessibilitate potius quam longivitate (vide infra). prior articulus). Negotiatio-off erat potentialis notitia sectoris inconstantiam in variis missionibus extremis. Exempli gratia immundus princeps electionis est reus recipiens in potentia habentem duplicatam vel certe amissam.

Cum Delta, firmiorem firmitatem praestare voluimus, ut traditionem CDC eventuum ad thesauros derivandos curaremus. Ad hoc propositum speciale designatum Kafka botrum pro obiecto primo-classis proposuimus. Inspicere potes aliquos ordines in tabula infra sectorem:

Delta: Data Synchronisation et Locupletatio Platform

in racemis Keystone Kafka; immundus princeps electionis solere includi ut editor accessibility. Hoc evenire potest in detrimento nuntius, si imago tacita quasi dux eligitur. Pro novo promptissimo promptitudine Kafka botri, optioni immundus princeps electionis avertit ne nuntius detrimentum.

Nos quoque auctus replicatio factor ex II ad III and * minimum insync replicas 1 ad 2. Editores scribentes huic botro ab omnibus aliis acks requirunt, ut 2 ex 3 replicationibus recentissimas nuntios ab editore missos habeant.

Instantia autem sectoris terminatur, instantia nova reponit vetustatem. Novus tamen sector opus erit ut replicationes sine ordine adsequi, quod pluribus horis capere potest. Ad recuperandum tempus huius missionis reducere incepimus uti notitia repositionis clausulae (Amazon Elasticae Shop) loco orbis loci sectorem. Cum nova instantia reponit instantia sectorem terminatum, huic volumine EBS adiungitur quod instantiam terminatam habuit et novis nuntiis capere incipit. Hic processus backlog alvi tempus ab horis ad minuta reducit quia instantia nova non amplius indiget ad statum inani replicare. Super, separatum repositionis et vitae cycli sectorem signanter reducere ictum mutandi sectorem.

Ad incrementa notitiarum traditionis fideiussores usi sumus nuntius tracking ratio ut aliquem nuntium damnum sub extrema condicionibus deprehendat (exempli gratia horologii desyncchronization in duce partitione).

Amnis Processing Framework

Stratum processus Delta aedificatur super tribunal Netflix SPaaS, quod integrationem Apache Flink praebet cum ecosystem Netflix. suggestum praebet user interface quod instruere jobs Flink instruere et orchestrationem ligamentorum Flink in summitate nostri Titi continentis suggestum administrationis. Interfacies etiam officium configurationum administrat ac utentes admittit ut configurationem mutationes dynamice percipiat quin jobs recompensandi Flink.

Delta amnis processui compage praebet secundum Flink et SPaaS qui usus annotationem-fundatur DSL (Lingua Domain Imprimis) technicas res abstrahere. Exempli gratia, definire gradum quo eventus augebuntur appellando exteriora officia, utentes necesse est sequenti DSL scribere, et compago exemplar in eo creabit, quod a Flink efficietur.

Delta: Data Synchronisation et Locupletatio Platform
Figura 3. Exemplum locupletationis in DSL in Delta

In compage processus discentium curvam non solum minuit, sed etiam communes lineas processus praebet ut deduplicationem, schematizationem, flexibilitatem et mollitiam ad solvendas difficultates communes operationales.

Delta Stream Processing Framework constat ex duobus clavibus modulorum, DSL & API moduli ac Runtime moduli. Modulus DSL & API praebet DSL et UDF (User-Defined-Function) APIs ut utentes suam logicam processus (ut eliquare vel transformationes) scribere possint. Modulus Runtime exsecutionem praebet Totalis DSL qui repraesentationem internam processus gradus in DAG exemplaribus aedificat. Executio componentis exempla DAG interpretatur ut enuntiationes ipsas Flink initializet ac tandem applicationem Flink percurrat. Illustratur hac figura architectura compage.

Delta: Data Synchronisation et Locupletatio Platform
Figure 4. Delta Stream Processing Framework architectura

Aditus multa commoda habet;

  • Users logicam negotia sua intendere possunt quin in speciales Flink vel SPaaS structuram influere possint.
  • Optimization fieri potest ut utentibus perspicuum sit, erroresque figi possunt sine ullis mutationibus in codice usoris (UDF).
  • Usus applicationis Delta facilior est pro utentibus, quod suggestum flexibilitatem et mollitiem e pixide praebet et colligit varietatem metri enucleandi quae in summis summis adhiberi potest.

Productio usus

Delta in productione ultra annum fuit et in multis applicationibus Netflix Studiorum partes clavis agit. Partes ad effectum deducendi causarum usus adiuvit ut investigationis index, notitia repono, ac laboris fluxus eventus agitatae. Infra speculatio summus gradus architecturae suggesti Deltae est.

Delta: Data Synchronisation et Locupletatio Platform
Figure 5. Delta summus gradus architecturae.

agnitiones

Gratias agere volumus sequentes homines qui in creatione et progressu Delta Netflix inter se fuerunt: Allen Wang, Charles Zhao, Jaebin Yoon, Josh Snyder, Kasturi Chatterjee, Mark Cho, Olof Johansson, Piyush Goyal, Prashanth Ramdas, Raghuram Onti Srinivasan, Sandeep Gupta, Steven Wu, Tharanga Gamaethige, Yun Wang et Zhenzhong Xu.

fontibus

  1. dev.mysql.com/doc/refman/5.7/en/implicit-commit.html
  2. dev.mysql.com/doc/refman/5.7/en/cannot-roll-back.html
  3. Martin Kleppmann, Alastair R. Beresford, Boerge Svingen: Res processui Online. Communi. ACM 62(5): 43-49 (2019). DOI: doi.org/10.1145/3312527

Subscribere sursum pro libera webinar"Data tool pro Amazon Redshift PRAECLUSIO."

Source: www.habr.com