Само тази седмица Spotify започна да тества "без загуби" аудио файлове. Но какво е "без загуба" аудио, точно и как работи цифровата аудио компресия?

Как работи аудио компресията?

Целта в аудио компресирането е да се намали броят на битовете, необходими за точно възпроизвеждане на аналогов звук. Първият процес, който ще разгледаме, се нарича "загуба". Загубата на компресия е еднопосочна техника, която изхвърля некритични данни, за да спести място. Тези техники са най-често използваните методи за компресиране на аудио файлове, които се показват в MP3, AAC и WMA файлове. Има две места, където загубените кодеци изглеждат за спасяване на бита: скорост на предаване на данни и психоакустика.

Битрейт

Битовата скорост измерва количеството битове, използвани за кодиране на единична секунда от аудио. Например, ако използваме нискокачествено 8 килобайта / секунда (kbps) кодиране, нашият алгоритъм е ограничен до използването само на 8 килобита данни, за да се опише всяка секунда аудио. Това е като да се опише пълна цветна снимка само с няколко стотин пиксела. Може да получите правилните удари, но като цяло ще гледате сериозно влошено изображение. Ако използваме по-висока скорост на предаване като 192 kbps, имаме достатъчно място да покрием детайлите. За да се върнете към нашия фотографски пример, сега имаме достатъчно пиксели, за да опишем различните светлини, тъмни и цветове в изображението. Високата честота на предаване не определя самото качество на записа, но ниската скорост на бита може сериозно да ограничи качеството на изхода.

психоакустика

Психоакустиката е науката за това как мозъкът разбира звуците. Чрез манипулиране на известни особености по начина, по който хората възприемат звука, алгоритмите за компресия могат умело да премахнат подробностите, които повечето човешки уши няма да пропуснат. Целта е да се "закръгли" информация, която няма да промени възприеманото аудио качество на дадена песен, като съзнателно премахне само незначителна информация.

Например може да знаете, че типичният диапазон на слуха на човека е между 20Hz и 20kHz. Очевидно звуците извън този диапазон могат да бъдат премахнати. Освен това, най-подробният обхват на човешкото слушане е между 100Hz и 4kHz, а премахването на тихи звуци извън тези честотни диапазони води до минимална повреда на качеството на записа. Можем да направим подобен трик със силно контрастиращи звуци. Ако много силен звук и много тихо звучене играят в същото време, тих звук е много по-трудно да се възприемат, отколкото би било само по себе си. Енкодерите се възползват от това "звуково маскиране", за да премахнат тихия звук, като спестяват бита в процеса.

Честотата може също да повлияе на това колко добре възприемаме звуците. Например, устойчива, нискочестотна барабанна битка има тенденция да удави по-деликатните хармоници на мелодичните инструменти с по-висока честота. И звуковото маскиране е особено ефективно над 15kHz, където човешкото слушане обикновено е по-малко чувствително отначало.

Общите схеми за компресиране на аудио, като MP3, се възползват от пълната гама от възможности за компресия, като същевременно се опитват да останат верни на оригиналния запис. Разбира се, някои хора смятат, че премахването на тези честоти сериозно уврежда записа. Ето защо съществуват стандарти за компресиране без загуби.

Какво е "без загуба" аудио?

Целта на компресията без загуба на звук е да намали размера на файла, като същевременно оставя оригиналния звук недокоснат. Тези кодеци не използват нито една от постоянните техники за компресиране по-горе, като вместо това се фокусират върху напълно обратими методи за компресиране на данни. Те използват техники за компресиране без загуба, заимствани от алгоритми за компресиране на файлове като ZIP, за да премахнат излишните данни, като същевременно запазят целостта на основната информация. Двама популярни аудио кодеци без загуба - FLAC и Apple Lossless (ALAC) - и двете използват схеми, базирани на ZIP компресия.

Фокусирането върху компресирането на данни означава само запазване на много от детайлите, които MP3 и други загуби стандарти биха заличили. Ако имате остри уши и висококачествена настройка за слушане, разликата може да бъде осезаема.

Без загуба на компресия е не само доброто за слушане, но е и чудесно средство за съхранение. Точно както не бихте искали 72dpi JPG да бъде единственото цифрово копие на фотографиите на Ansel Adam, ние не искаме само 128kbps MP3 на "Kind of Blue". Без загуби стандарти като FLAC ни позволяват да съхраняваме аудио ефективно, без да отхвърляме потенциално ценни данни. Те също така правят ремастерирането и преразпределянето на аудиото по-лесно, тъй като започвайки с безкомпромисни майстори означава по-качествен завършен продукт.

Заключение: Можете ли да разберете разликата?

Звуковите формати без загуба на звук позволяват по-добри звукови записи. Но понякога разликите между висококачествено MP3 и безчетков файл са почти незабележими, особено за нетренираното ухо. Ако искате да видите дали слушалките (и ушите ви) са достатъчно запалени, за да разберете разликата, NPR има забавен тест; имайте предвид, че евтините слушалки и високоговорителите за лаптоп няма да могат да възпроизведат фините разлики между без загуба на звук и MP3 файлове. За по-сериозен анализ на кодеците, проверете оценките на кодера SoundExpert.