Μετά από εννέα μήνες ανάπτυξης πακέτο πολυμέσων , το οποίο περιλαμβάνει ένα σύνολο εφαρμογών και μια συλλογή βιβλιοθηκών για λειτουργίες σε διάφορες μορφές πολυμέσων (εγγραφή, μετατροπή και αποκωδικοποίηση μορφών ήχου και βίντεο). Το πακέτο διανέμεται με άδειες LGPL και GPL, η ανάπτυξη FFmpeg πραγματοποιείται δίπλα στο έργο .
από , στο FFmpeg 4.2, μπορούμε να επισημάνουμε:
- Προστέθηκε η δυνατότητα χρήσης Clang για τη μεταγλώττιση αρχείων CUDA.
- Υλοποιήθηκε υποστήριξη για την αποκωδικοποίηση της μορφής AV1 με χρήση εναλλακτικού αποκωδικοποιητή , που αναπτύχθηκε από τα έργα VideoLAN και FFmpeg. Το Dav1d επικεντρώνεται στην επίτευξη της υψηλότερης δυνατής απόδοσης αποκωδικοποίησης και στην εξασφάλιση υψηλής ποιότητας εργασίας σε λειτουργία πολλαπλών νημάτων.
- Προστέθηκαν μέσα αποσυσκευασίας δοχείων πολυμέσων (demuxer) dhav, hcom και vividas, KUX και IFV.
- Προστέθηκε κωδικοποιητής PCM-DVD.
- Προστέθηκαν αποκωδικοποιητές VP4, hymt, hcom, ARBC, agm και lscr.
- Παρέχει υποστήριξη για αποκωδικοποίηση περιεχομένου HEVC 4:4:4 χρησιμοποιώντας μηχανές επιτάχυνσης υλικού NVIDIA nvdec και cuviddec, καθώς και χρήση του API VDPAU (Αποκωδικοποίηση και παρουσίαση βίντεο).
- Το πρόγραμμα συσκευασίας κοντέινερ πολυμέσων mov υποστηρίζει την εγγραφή κομματιών χωρίς να προσδιορίζεται ρητά η γλώσσα (προηγουμένως, τα Αγγλικά καθορίζονταν από προεπιλογή).
- Νέος :
- — αυτόματη αναγνώριση ομιλίας χρησιμοποιώντας τη μηχανή PocketSphinx.
- — αφαιρεί τη βροχή από το βίντεο χρησιμοποιώντας ένα σύστημα μηχανικής εκμάθησης που βασίζεται σε ένα νευρωνικό δίκτυο και έτοιμο ;
- — προσδιορισμός της απουσίας αλλαγών στο βίντεο (εικόνα που δεν αλλάζει για ορισμένο χρονικό διάστημα).
- — προσθήκη επιπλέον συνόλων καρέ στην αρχή ή στο τέλος της ροής βίντεο.
- — εξομάλυνση τεχνουργημάτων φωτεινότητας και χρώματος (σημειώσεις και ουράνια τόξα) σε βίντεο.
- — μετατόπιση των χρωματικών στοιχείων των pixel οριζόντια και κάθετα.
- — εξαγωγή της βασικής ροής από το TrueHD, απόρριψη μεταδεδομένων ATMOS.
- — καταστολή του ευρυζωνικού θορύβου στη ροή ήχου χρησιμοποιώντας έναν αλγόριθμο ;
- — δημιουργία μάσκας με βάση το εισερχόμενο βίντεο.
- — διαχωρισμός πλαισίου στη ροή AV1.
- — επιβράδυνση της αλλαγής χρώματος των σκούρων εικονοστοιχείων (αύξηση του χρόνου εμφάνισης των φωτεινών φλας).
- — κοπή απαλού ήχου (σταδιακή εξασθένηση του πλάτους αντί για απότομη θραύση του σήματος).
- — διαγραφή πληροφοριών για όλα τα χρώματα RGB εκτός από το καθορισμένο.
- — επισήμανση της μέσης τομής των pixel για πολλά βίντεο εισόδου.
- — μετατροπή στερεοφωνικού ήχου σε βίντεο, εμφανίζοντας τη χωρική αλληλεπίδραση μεταξύ δύο καναλιών ήχου.
- — αφαίρεση της παραμόρφωσης λόγω μικροφώνου χαμηλής ποιότητας ή υπερβολικής συμπίεσης ήχου κατά την εγγραφή φωνών (εξαλείφει την επίδραση του ήχου όπως σε ένα κουτί).
- Η σύνθεση περιλαμβάνει έναν αναλυτή για εικόνες σε μορφή GIF.
- Προστέθηκε υποστήριξη για κωδικοποιημένους υπότιτλους ARIB STD-B24 (προφίλ A και C) που χρησιμοποιούνται για ροή MPEG-2 TS. Η υποστήριξη υλοποιείται μέσω της χρήσης της βιβλιοθήκης libaribb24.
- Η βιβλιοθήκη libndi-newtek έχει αφαιρεθεί.
Πηγή: opennet.ru
