Буквально на этой неделе Spotify начал тестировать аудиофайлы без потерь. Но что такое звук без потерь и как работает сжатие цифрового звука?
Как работает сжатие звука?
Contents
Как работает сжатие звука?
alt="аудио-сжатие-стойка">Целью сжатия звука является уменьшение количества битов, необходимых для точного воспроизведения аналогового звука. Первый процесс, который мы рассмотрим, называется «с потерями». Сжатие с потерями — это односторонний метод, при котором некритичные данные удаляются для экономии места. Эти методы являются наиболее распространенными методами сжатия аудиофайлов и одинаково проявляются в файлах MP3, AAC и WMA. Кодеки с потерями стремятся сохранить биты двумя способами: скорость передачи данных и психоакустика.
Скорость передачи данных
Скорость передачи данных измеряет количество битов, используемых для кодирования одной секунды звука. Например, если мы используем низкокачественное кодирование со скоростью 8 килобит в секунду (кбит/с), наш алгоритм ограничен использованием только 8 килобит данных для описания каждой секунды звука. Это все равно, что пытаться описать полноцветную фотографию, используя всего несколько сотен пикселей. Возможно, в общих чертах вы поняли правильно, но в целом вы увидите сильно ухудшенное изображение. Если мы испо
Скорость передачи данных
ь передачи данных, например 192 кбит/с, у нас будет достаточно места для передачи тонких деталей. Возвращаясь к нашему примеру с фотографией, теперь у нас достаточно пикселей, чтобы описать различные светлые, темные и цветные оттенки изображения. Высокий битрейт сам по себе не определяет качество записи, но низкий битрейт может серьезно ограничить качество вывода.Психоакустика
Психоакустика — наука о том, как мозг понимает звуки. Манипулируя известными особенностями человеческого восприятия звука, алгоритмы сжатия могут ловко удалять детали, которые не упустит большинство человеческих ушей. Цель состоит в том, чтобы «округлить» информацию, которая не повлияет на воспринимаемое качество звука трека, разумно удаляя только неважную информацию.
Например, вы можете знать, что типичный диапазон человеческого слуха находится между 20 Гц и 20 кГц. Очевидно, что звуки за пределами этого диапазона можно удалить. Кроме того, наиболее детальный диапазон человеческого слуха находится в диапазоне 100 Гц и 4 кГц , и удаление тихих звуков за пределами этих частотных диапазонов наносит минимальный ущерб качеству записи. Мы можем проделать аналогичный трюк с очень контрастными звуками. Если одновременно воспроизводится очень громкий и очень тихий звук, тихий звук воспринимать гораздо труднее, чем он был бы сам по себе. Кодировщики используют эту «маскировку звука», чтобы
Психоакустика
ономя при этом биты.Частота также может влиять на то, насколько хорошо мы воспринимаем звуки. Например, настойчивый низкочастотный барабанный бой имеет тенденцию заглушать более тонкие, высокочастотные гармоники мелодических инструментов. А маскировка звука особенно эффективна на частотах выше 15 кГц, где человеческий слух обычно менее чувствителен.
Распространенные схемы сжатия звука, такие как MP3, используют весь спектр возможностей сжатия, стараясь при этом оставаться максимально верными исходной записи. Конечно, некоторые люди считают, что удаление этих частот наносит серьезный ущерб записи. Вот почему существуют стандарты сжатия без потерь.
Что такое аудио без потерь?
Цель сжатия звука без потерь — уменьшить размер файла, оставив исходный звук нетронутым. Эти кодеки не используют ни один из вышеперечисленных методов постоянного сжатия, вместо этого основное внимание уделяется полностью обратимым методам сжатия данных. Они используют методы сжатия без потерь, заимствованные из алгоритмов сжатия файлов, таких как ZIP до удалить лишние данные , сохраняя при этом целостность базовой информации. Два популярных аудиокодека без потерь — FLAC и Apple Lossless (ALAC) — используют схемы, основанные на сжатии ZIP.
Сосредоточение внимания на сжатии данных означает лишь сохранение многих деталей, которые MP3 и другие стандарты с потерями могут уничтожить. Если у вас острый слух и качественная настройка прослушивания, разница может быть ощутимой.
Однако сжатие без потерь полезно не только для прослушивания: это также отличный инструмент для хранения. Точно так же, как вы не хотите, чтобы JPG с разрешением 72 dpi был единственной цифровой копией фотографий Анселя Адама, нам не нужны только MP3 со скоростью 128 кбит/с с «Kind of Blue». Стандарты без потерь, такие как FLAC, позволяют нам эффективно хранить аудио, не выбрасывая потенциально ценные данные. Они также упрощают ремастеринг и распространение аудио, поскольку использование бескомпромиссных мастеров означает более высокое качество готового продукта.
Заключение: можете ли вы заметить разницу?
Аудиоформаты без потерь позволяют улучшить звучание записей. Но иногда разница между высококачественным MP3 и файлом без потерь почти незаметна, особенно для нетренированного уха. Если вы хотите проверить, достаточно ли чувствительны ваши наушники (и уши), чтобы заметить разницу, NPR проводит забавный тест ; просто имейте в виду, что дешевые наушники и динамики ноутбука не смогут воспроизвести тонкую разницу между звуком без потерь и MP3. Более серьезный анализ кодеков можно найти в разделе Рейтинги кодировщиков SoundExpert .