Аппаратно-программные средства MP3

Евгений Рудометов, Виктор Рудометов.
authors@rudometov.com

Статья основана на материалах книги "Архитектура ПК, комплектующие, мультимедиа"  — СПб: Питер, 2000, 416 с.

В процессе эволюции средств хранения информации разработчики постоянно стремятся повысить плотность ее размещения на носителях. В ходе выполняемых научно-технических исследований совершенствуются как сами носители, так и технологии, и алгоритмы кодирования, записи и чтения. При этом развитие алгоритмов обработки информации и стремительно возростающая мощность вычислительных устройств часто позволяют, не повышая требований к информационной емкости носителей и изменения технологии записи, увеличить время записи/воспроизведения информации. Это достигается использованием специальных алгоритмов сжатия (компрессии), реализуемых с помощью современных персональных компьютеров или устройств на основе спецпроцессоров относительно высокой производительности. Такой подход позволяет не только эффективнее использовать информационную емкость существующих носителей, но и дает возможность реализовать принципиально новые устройства записи, обработки, хранения и воспроизведения информации. Часто такие устройства предоставляют пользователю новые функциональные возможности, недоступные ранее. Это касается и видео, и аудио.

В процессе совершенствования алгоритмов сжатия был разработан эффективный метод компрессии звуковой информации MPEG, фактически ставший одним из распространенных стандартов. Его нередко называют как MPEG 1 Layer 3, MPEG 3, MP3. Последнее является наиболее часто используемым названием.

Алгоритмы, положенные в основу стандарта MP3, учитывают психофизиологические особенности человеческого слуха. Данные алгоритмы позволяют существенно уменьшить размер обычного звукового wav-файла, отбрасывая незначительные элементы фонограммы. Необходимо учитывать, что данное преобразованте осуществляется с потерей части звуковой информации. Однако соответствующим выбором параметров кодирования удается минимизировать эти потери и достичь приемлемого уровня качества. Оптимальный же набор параметров позволяет, как правило, практически полностью сохранять исходное качество звучания при существенной экономии информационного пространства носителя. Используемые алгоритмы сжатия, реализующие стандарт MP3 достаточно эффективны и совершенны. Даже при значительном сжатии, например, в 10 раз часто не ощущаются потери в качестве музыкальных произведений, особенно, если они не отличаются широким динамическим диапазоном. Все это способствовало широкому внедрению и популяризации данного стандарта. Закодированные файлы вследствие уменьшения их размера легче хранить, копировать или передавать, например, используя средства связи. Стандарт MP3 стал популярным средством передачи звуковой информации в сети Internet. Кроме того, стало популярным создавать сборники файлов mp3 и записывать их на ставшие уже традиционными CD-ROM, CD-R, CD-RW. При этом на одном CD-ROM стандартной емкости может уместиться информация нескольких обычных, несжатых, музыкальных дисков, например, информация 10 CD. Все зависит от степени компрессии, особенностей звуковой информации и требуемого качества воспроизведения после декомпрессии. Преобразованные файлы имеют чаще всего расширение mp3.

Обычно запись и воспроизведение сжатой звуковой информации осуществляется с помощью специальных программ, осуществляющих на компьютере компрессию и декомпрессию файлов. Однако уже выпущены портативные устройства, способные воспроизводить и даже записывать файлы по стандарту MP3.

Создание файла mp3 с музыкального CD делится на два этапа: чтение c CD и запись требуемой композиции в обычный wav-файл на компьютере и последующее кодирование этого файла с целью создания файла сжатой информации с расширением mp3.

Преобразование в формат MP3 осуществляется в соответствии со специальными алгоритмами сжатия, реализующими требования стандарта. Кодирование характеризуется степенью компрессии — коэффициентом сжатия. Величина данного коэффициента непосредственно связана с требуемым качеством звуковой информации, получаемым в процессе последующего раскодирования. Чем больше сжимается файл, тем больше потери в исходной информации и ниже качество раскодированного сигнала.

Качество воспроизведения файла mp3 характеризуется частотой дискретизации, например, 44,1 кГц, разрядностью, например, 16 бит, количеством каналов — моно/стерео. И очень важным параметром является величина потока информации (bit rate), получаемого в процессе компрессии. При выполнении кодирования, в результате которого осуществляется преобразование wav-файла в файл mp3, выбираются все четыре параметра.

Для достижения высокого качества используются параметры CD — 44,1 кГц, 16 бит, стерео. При компрессии можно выбирать разную величину потока, например: 64, 98, 128, 192, 256 Кбит/c и т. д. Чем больше величина потока, тем выше будет качество воспроизведения звуковой информации, но ниже величина коэффициента сжатия (компрессии) и, соответственно, объемнее получится результирующий файл mp3.

Кстати, следует отметить, что даже при низких величинах потока обеспечивается очень высокий уровень динамического диапазона, ограниченный только особенностями исходного сигнала. И при копировании информации этот уровень полностью сохраняется. Это нельзя сказать относительно операций с традиционным кассетным магнитофоном, магнитные ленты которого даже очень высокого качества, даже при использовании шумоподавителя характеризуются сравнительно высоким уровнем шумов и соответственно ограничивают динамический диапазон. Особенно это касается последующего копирования, когда уровни шумов и искажений быстро возрастают для каждой последующей копии. Именно высокое качество и идентичность копий и являются важнейшими характеристиками, которые отличают цифровые методы, положенные в основу MP3 и CD, от аналоговых способов предыдущего поколения устройств преобразования информации.

Обычно для кодирования речи с помощью алгоритмов MP3 достаточно потока 64 Кбит/с. Выбор такого потока практически не сказывается на качестве, но позволяет эффективно сжимать звуковую информацию, экономя информационное пространство носителя.

Для кодирования музыки используется поток 128 Кбит/с, что соответствует примерно коэффициенту сжатия 11. Экспертные оценки подтверждают, что поток в 128 Кбит/c обеспечивает сравнительно высокое качество, близкое к CD, особенно по уровню шумов. В первую очередь это относится к музыке типа pop, rock и т. п. Такая музыка характеризуется, как правило, сравнительно низким динамическим диапазоном и сравнительно узким частотным спектром. Указанный поток стал фактическим стандартом для кодирования такого типа звуковой информации. Тем не менее, несмотря на все достоинства кодирования с потоком 128 Кбит/с, многие эксперты все-таки считают, что по-настоящему высокое качество, действительно, не уступающее CD, обеспечивают только потоки, начиная с величины 256 Кбит/с. Кстати, поток 256 Кбит/с соответствует коэффициенту сжатия приблизительно 5. Именно с целью достижения высокого качества нередки случаи использования потока 256 Кбит/с, особенно в случае кодирования классической музыки.

Рекомендуемые параметры кодирования

Качество

Поток, Кбит/с

Входной сигнал, Гц

Частота дискретизации, кГц

Телефон

32 (16)

300-3400

16 (8)

Радио FM

128

30-15000

32

Магнитофон

128

20-18000

44,1

Hi-Fi

160

20-20000

44,1

CD

192

0-22050

44,1

Студийная запись

256

0-24000

48

Оценивая качество фонограммы на CD, подвергнутой компрессии по MP3, необходимо учитывать, что, к сожалению, встречаются и случаи обмана, своего рода мошенничество в сфере кодирования звуковой информации. Например, для привлечения покупателей на диске с классической музыкой в формате mp3 часто пишут, что гарантируется неотразимое качество звучания, обеспеченное кодированием с потоком, соответствующим величине 256 Кбит/с, а на самом деле всего 128 Кбит/с, что, конечно же, недопустимо.

Работая с файлами mp3, не обязательно ориентироваться только на специальные CD с уже закодированной информацией с потоками 128 Кбит/с или 256 Кбит/с. Такие CD выпускаются в большом количестве многочисленными фирмами звукозаписи. При самостоятельном создании файлов mp3 в качестве источников звуковой информации высокого качества могут быть использованы традиционные аудио CD. Как правило, современные дисководы CD-ROM имеют специальную функцию чтения аудиоданных с музыкальных компакт-дисков — Reading Raw Audio Stream — RA (Raw Audio). Пользователи, имеющие такой дисковод, могут воспользоваться специальными программами, которые обеспечивают преобразование указанного аудиотрека в wav-файл. Это так называемые программы-грабберы, большое количество которых можно найти в Internet. Примером могут служить такие программы, как AudioGrabber, CD2WAV, CDCOPY, CDDA, CDGRAB и другие.

Программа AudioGrabber кроме создания wav-файла, позволяет, отрегулировать уровень записи и закодировать wav-файл в файл mp3. Следует отметить, что ранние версии этой программы работали только с устройствами, поддерживающими RA. Однако в последние версии программы встроена функция аналогового копирования информации с музыкального CD через звуковую карту. Это позволяет использовать дисководы без поддержки RA. Пример работы программы AudioGrabber приведен на рис.1.

Рис.1. Программа AudioGrabber

К сожалению, программы, обеспечивающие преобразование аудио-трека в wav-файл, как правило, не работают с дисководами CD-ROM, не поддерживающими RA. К таким дисководам, как правило, относятся уже устаревшие, но сравнительно часто используемые низкоскоростные устройства. Это, например, дисководы 2х, 4х, 6х. Для подобных дисководов можно воспользоваться альтернативными средствами, обеспечивающими выполнение данной задачи. Например, один из способов — это одновременно проигрывать музыкальный диск и записывать звуковую информацию через звуковую карту на жесткий диск с помощью, например, PLAYFILE или какой-либо другой подходящей программы создания wav-файла.

В дальнейшем в качестве инструмента для преобразования wav-файла в файл mp3 можно использовать популярную и неоднократно проверенную программу L3ENC, использующую алгоритм Fraunhofer-IIS.

Следует отметить, что время кодирования достаточно велико. Для машин класса 486 преобразование 5-минутной мелодии с помощью программы L3ENC с заданным значением потока 128 Кбит/с требует примерно 2-3 часа. На компьютере с процессором Pentium-166 MMX эта же работа выполняется за 20–30 минут. Однако компьютер с процессором Pentium II-266 справляется с такой задачей уже за 5-10 минут. В случае использования компьютера с процессором Pentium III работа может быть выполнена уже в реальном времени.

Конечно, кроме указанной программы, существуют и многие другие программы для создания файлов mp3. Многие из них кодируют быстро и качественно. Некоторые из этих программ используют более совершенные алгоритмы, чем у приведенной L3ENC. При этом часть программ ориентировано на низкие значения потоков — 128 Кбит/с и менее , а другая  — на высокие — 256 Кбит/с и более. Но независимо от используемых алгоритмов для прослушивания закодированных файлов могут быть использованы, как правило, одни и те же программы.

Для проигрывания уже готовых файлов mp3 на рынке программных продуктов можно выделить два наиболее популярных — это WinAmp и WinPlay. WinPlay — это довольно простая программа, позволяющая проигрывать mp3-файлы с хорошим качеством даже на компьютерах класса 486. Работа программы представлена на рис.2.

Рис.2. Программа WinPlay.

Программа WinAmp является наиболее популярным проигрывателем. Она имеет некоторые дополнительные возможности по сравнению с другими, например, графический эквалайзер, анализаторы сигнала и многое другое. Работа программы представлена на рис.3.

Рис.3. Программа WinAmp.

Проигрывание файла mp3требует от компьютера достаточно высокой производительности. Часто бывает так, что компьютер не справляется с быстрым раскодированием: в процессе воспроизведения наблюдается эффект прерывистости звучания. Особенно это касается компьютеров класса 486. Однако и в этом случае остается возможность проигрывания мелодии, правда, с худшим качеством. Например, в настройках программы-проигрывателя можно снизить частоту в два раза, отключить стерео и т. д. Стоит отметить, что в большинстве случаев производительности компьютера на базе процессора Pentium (и тем более Pentium II) достаточно для обеспечения необходимой скорости декомпрессии, а также реализации возможностей многочисленных спецэффектов, предоставляемых программами.

Рассматривая и анализируя возможности современных компьютеров, необходимо отметить, что для воспроизведения файлов mp3 можно использовать не только компьютеры, но и специализированные устройства.

Одним из первых портативных плееров, предназначенных для проигрывания файлов mp3, стал плеер Diamond Rio PMP300 фирмы Diamond. Это устройство характеризуется широким частотным диапазоном, составляющим 20 Гц–20 кГц при соотношении сигнал/шум более 90 дБ, низкими гармоническими искажениями — 0,01–0,1 %, выходной мощностью более 50 мВт. Размеры устройства — 89x64x16 мм, вес — 70 г. Питание осуществляется от одного элемента типа АА 1,5 В. Файлы mp3 подготавливаются с помощью специализированного программного обеспечения на компьютере, подключение устройства к которому осуществляется через порт LPT. Готовые файлы могут быть получены и через сеть Internet. Данный плеер позволяет хранить примерно 30 минут качественного звука при потоке 128 Кбайт/с.

Еще одним устройством является MPIO фирмы Daewoo. Этот портативный прибор обеспечивает не только воспроизведение файлов mp3, но и запись звуковой информации. Как и предыдущее устройство, MPIO характеризуется широким частотным диапазоном, низким уровнем шумов и искажений. Подключение к компьютеру осуществляется через порт LPT. В составе MPIO используются графический дисплей LCD и встроенный микрофон. Предусмотрены варианты с FM-тюнером и/или видеомодулем для использования данного устройства в качестве цифрового фотоаппарата.

В качестве альтернативы указанным устройствам можно привести плеер raveMP фирмы Sensory Science. Встроенная память увеличена до 64 Мбайт.Устройство позволяет не только воспроизводить, но и осуществлять запись до 4 часов звука через встроенный микрофон.

В качестве средств хранения информации в портативных плеерах файлов mp3 могут выступать, например, CD-ROM, или даже жесткие диски. В качестве примера можно привести MP3 Shuttle и MP3 Shuttle II фирмы Xeenon, которые используют для хранения файлов mp3 соответственно CD-ROM и жесткий диск. Плеер MP3-ROM фирмы MacPower позволяет использовать практически все современные носители информации, как CD-ROM, DVD и др. Thomson Multimedia — проигрыватель mp3-файлов фирмы Lyra, в качестве носителя информации будет использовать миниатюрный жесткий диск емкостью 340 Мбайт, недавно разработанный фирмой IBM.

Что касается перспектив, то следует отметить, что CompactFlash Association собирается встраивать в состав флэш-карт памяти, используемых в плеерах, USB контроллеры, которые позволят в автономном режиме с легкостью считывать с карты и писать на карту необходимую информацию.

Все вышесказанное иллюстрирует тот факт, что, несмотря на сопротивление некоторых фирм звукозаписи, инициирующих разработку альтернативных стандартов звукозаписи, препятствующих несанкционированному копированию аудиоинформации, алгоритмы MP3 продолжают развиваться, завоевывая новых сторонников. Профессиональные разработчики и энтузиасты MP3 предлагают улучшенные алгоритмы, программисты создают новые программы, а электронная промышленность выпускает все новые и новые устройства.