Después de nueve meses de desarrollo paquete multimedia , que incluye un conjunto de aplicaciones y una colección de bibliotecas para operaciones en varios formatos multimedia (grabación, conversión y decodificación de formatos de audio y video). El paquete se distribuye bajo licencias LGPL y GPL, el desarrollo de FFmpeg se lleva a cabo junto al proyecto. .
de , en FFmpeg 4.2, podemos destacar:
- Se agregó la capacidad de usar Clang para compilar archivos CUDA;
- Soporte implementado para decodificar el formato AV1 usando un decodificador alternativo , desarrollado por los proyectos VideoLAN y FFmpeg. Dav1d se centra en lograr el mayor rendimiento de decodificación posible y garantizar un trabajo de alta calidad en modo multiproceso;
- Se agregaron desempaquetadores de contenedores de medios (demuxer) dhav, hcom y vividas, KUX e IFV;
- Se agregó codificador PCM-DVD;
- Se agregaron decodificadores VP4, hymt, hcom, ARBC, agm y lscr;
- Proporciona soporte para decodificar contenido HEVC 4:4:4 usando los motores de aceleración de hardware NVIDIA nvdec y cuviddec, así como también usando la API VDPAU (Video Decode and Presentation);
- El empaquetador del contenedor de medios mov admite la grabación de pistas sin especificar explícitamente el idioma (anteriormente, el inglés se especificaba de forma predeterminada);
- Nuevo :
- — reconocimiento automático de voz mediante el motor PocketSphinx;
- — elimina la lluvia del vídeo mediante un sistema de aprendizaje automático basado en una red neuronal y listo ;
- — determinación de la ausencia de cambios en el vídeo (imagen que no cambia durante un tiempo determinado);
- — añadir conjuntos adicionales de fotogramas al principio o al final de la transmisión de vídeo;
- — suavizado de artefactos de brillo y color (luces puntuales y arcoíris) en vídeo;
- — desplazar los componentes de color de los píxeles horizontal y verticalmente;
- — extraer el flujo base de TrueHD, descartando los metadatos de ATMOS;
- — supresión del ruido de banda ancha en el flujo de audio mediante un algoritmo ;
- — crear una máscara basada en el vídeo de entrada;
- — separación de tramas en el tren AV1;
- — ralentizar el cambio de color de los píxeles oscuros (aumentando el tiempo de visualización de los destellos brillantes);
- — corte suave del sonido (atenuación gradual de la amplitud en lugar de una interrupción brusca de la señal);
- — eliminar información sobre todos los colores RGB excepto el especificado;
- — resaltar la intersección promedio de píxeles para varios videos de entrada;
- — conversión de sonido estéreo en vídeo, que muestra la interacción espacial entre dos canales de audio;
- — eliminación de la distorsión causada por un micrófono de baja calidad o una compresión excesiva del sonido al grabar voces (elimina el efecto del sonido como en una lata).
- La composición incluye un analizador de imágenes en formato GIF;
- Se agregó soporte para subtítulos codificados ARIB STD-B24 (perfiles A y C) utilizados para la transmisión MPEG-2 TS. El soporte se implementa mediante el uso de la biblioteca libaribb24;
- La biblioteca libndi-newtek ha sido eliminada.
Fuente: opennet.ru
