Google, 소리를 분리하는 데이터 및 기계 학습 모델 출시

Google опубликовала 임의의 혼합 사운드를 개별 구성 요소로 분리하는 데 사용되는 기계 학습 시스템에서 사용할 수 있는 참조 혼합 사운드의 주석이 달린 데이터베이스입니다. Tensorflow에서 소리를 분리하는 데 사용할 수 있는 일반 딥 머신 러닝 모델(TDCN++)도 게시되었습니다. 컬렉션을 기반으로 준비된 데이터 freesound.org и 출판 된 CC BY 4.0에 따라 라이센스가 부여되었습니다.

제시된 프로젝트 FUSS(Free Universal Sound Separation)는 그 성격이 사전에 알려지지 않은 임의의 수의 사운드를 분리하는 문제를 해결하는 것을 목표로 합니다. 다른 유사한 시스템은 일반적으로 음성과 비음성 또는 다른 사람이 말하는 특정 소리를 구별하는 작업으로 제한됩니다.

데이터베이스에는 약 20개의 혼합이 포함되어 있습니다. 또한 이 키트에는 벽 반사, 음원 위치 및 마이크 위치를 고려하는 맞춤형 실내 시뮬레이터를 사용하여 미리 계산된 실내 충격 응답이 포함되어 있습니다.

출처 : opennet.ru

코멘트를 추가