Google lëshon të dhënat dhe modelin e mësimit të makinës për të ndarë tingujt

Google botuar një bazë të dhënash me shënime të tingujve të përzier referues që mund të përdoren në sistemet e mësimit të makinerive të përdorura për të ndarë tingujt arbitrarë të përzier në komponentët e tyre individualë. Një model gjenerik i mësimit të makinës së thellë (TDCN++) është publikuar gjithashtu që mund të përdoret në Tensorflow për të ndarë tingujt. Të dhënat e përgatitura në bazë të mbledhjes freesound.org и botuar licencuar sipas CC BY 4.0.

Projekti i paraqitur FUSS (Free Universal Sound Separation) ka për qëllim zgjidhjen e problemit të ndarjes së çdo numri tingujsh arbitrare, natyra e të cilave nuk dihet paraprakisht. Sisteme të tjera të ngjashme përgjithësisht kufizohen në detyrën e dallimit midis tingujve të caktuar, si zërat dhe jo-zërat, ose njerëzit e ndryshëm që flasin.

Baza e të dhënave përmban rreth 20 mijë përzierje. Kompleti përfshin gjithashtu përgjigjet e parallogaritura të impulseve të dhomës duke përdorur një imitues të dhomës të ndërtuar me porosi që merr parasysh reflektimin e murit, vendndodhjen e burimit të zërit dhe vendndodhjen e mikrofonit.

Burimi: opennet.ru

Shto një koment