Как устроен компакт-диск?
Конструкция диска CD-DA (Compact Disk - Digital Audio, компакт-диск - цифровой звук) и способ записи звука на нем описывается стандартом предложивших его фирм Sony и Philips, изданным в 1980 году под названием Red Book (Красная Книга).
Стандартный компакт-диск (CD) состоит из трех слоев: основы, отражающего и защитного. Основа выполнена из прозрачного поликарбоната, на котором методом прессования сформирован информационный рельеф. Поверх рельефа напыляется металлический отражающий слой (алюминий, золото, серебро, другие металлы и сплавы). Отражающий слой покрывается сверху защитным слоем поликарбоната или нейтрального лака - так, чтобы вся металлическая поверхность была защищена от контакта со внешней средой. Общая толщина диска - 1.2 мм.
Информационный рельеф диска представляет собой непрерывную спиральную дорожку, начинающуюся от центра и состоящую из последовательности углублений - питов (pits). Промежутки между питами носят название lands. Чередованием питов и промежутков различной длины на диске записывается закодированный цифровой сигнал: переход от промежутка к питу и наоборот обозначает единицу, а длина пита или промежутка - длину серии нулей. Расстояние между витками дорожки выбирается от 1.4 до 2 мкм, стандарт определяет расстояние в 1.6 мкм.
Каким образом на диске представляется звуковой сигнал?
Исходный стереофонический звуковой сигнал подвергается оцифровке в 16-разрядные отсчеты (линейное квантование) с частотой дискретизации 44.1 кГц. Полученный цифровой сигнал носит название PCM (Pulse Code Modulation - импульсно-кодовая модуляция, ИКМ), так как каждый импульс исходного сигнала представляется отдельным кодовым словом. Каждые шесть отсчетов левого и правого каналов оформляются в первичные кадры, или микрокадры, размером 24 байта (192 бита), поступающие со скоростью 7350 штук в секунду, которые подвергаются кодированию при помощи двухуровневого кода CIRC (Cross Interleaved Reed-Solomon Code - избыточный код Рида-Соломона с перекрестным перемежением) по схеме: перемежение с задержкой на 1 байт, кодирование уровнем C2, перекрестное перемежение с переменной задержкой, кодирование уровнем C1, перемежение с задержкой на 2 байта. Уровень C1 предназначен для обнаружения и коррекции одиночных ошибок, C2 - групповых. В результате получается блок длиной 256 бит, данные в котором снабжены разрядами обнаружения и коррекции ошибок, и к тому же "размазаны" до блоку, что приводит к записи смежных звуковых данных в физически несмежных областях диска и снижает влияние ошибок на отдельные отсчеты.
Код Рида-Соломона имеет избыточность 25% и позволяет обнаруживать до четырех ошибочных байтов и корректировать до четырех потерянных или двух ошибочных байтов. Максимальная длина полностью исправляемого пакета ошибок - около 4000 бит (~2.5 мм длины дорожки), однако не любой пакет такой длины может быть полностью исправлен.
После второго перемежения к каждому полученному блоку добавляются разряды субкодов - P, Q, R, S, T, U, V, W; каждый блок получает восемь субкодных битов. Затем каждые 98 блоков с субкодами оформляются в один сверхкадр длительностью 1/75 сек (объем чистых звуковых данных - 2352 байта), называемый также сектором, в котором субкоды первых двух блоков служат признаком синхронизации, а оставшиеся 96 разрядов каждого субкода образуют P-слово, Q-слово и т.д. На протяжении всей дорожки последовательность субкодных слов называют также субкодными каналами.
Слова или каналы субкодов используются для управления форматом записи, индикации фрагментов фонограммы и т.п. - например, канал P служит для пометки звуковых дорожек и пауз между ними (0 - пауза, 1 - звук), а канал Q - для пометки формата дорожек и секторов, записи оглавления TOC (Table Of Contents - таблица содержимого) и временнЫх меток, по которым отслеживается время воспроизведения. Канал Q может использоваться также для записи информации в ISRC (International Standard Recording Code - международный стандартный код записи), предназначенном для представления сведений о производителе, времени выпуска и т.п., а также - для разделения дорожки на отдельные фрагменты (всего на звуковом диске может быть до 99 звуковых дорожек, каждая из которых может включать до 99 фрагментов).
В конце концов оформленные таким образом кадры подвергаются канальному кодированию в терминах "пит - промежуток" с использованием избыточного кода 8/14 (Eight to Fourteen Modulation - EFM), в котором исходные байты кодируются 14-битными словами, повышающими разборчивость сигнала. Между словами вставляется по три связующих бита для соблюдения ограничений на количество смежных нулей и единиц, что облегчает демодуляцию и уменьшает постоянную составляющую сигнала. В результате из каждого первичного микрокадра получается 588 канальных битов, и полученный битовый поток записываются на диск со скоростью 4.3218 (588 x 7350) Мбит/с. Поскольку EFM-кодирование дает цифровой поток, в котором нулей больше, чем единиц, и была выбрана система представления единиц границами пита и промежутка, а количества нулей между единицами - длиной пита или промежутка соответственно.
В начале диска располагается так называемая вводная (lead-in) зона, содержащая информацию о формате диска, структуре звуковых программ, адресах фрагментов, названиях произведений и т.п. В конце записывается выводная (lead-out) зона (дорожка с номером AA), выполняющая роль границы записанной области диска; бит P-кода в этой зоне изменяется с частотой 2 Гц. Ряд бытовых проигрывателей не может опознать диск без этой зоны, однако многие могут обходиться без нее. Между вводной и выводной зонами записывается программная область (Program Memory Area - PMA), содержащая собственно звуковые данные. Программная область отделена от вводной зоны участком из 150 пустых блоков (2 секунды), играющим роль зазора (pre-gap).
Общая длительность записи на компакт-диске - 74 минуты, однако при уменьшении стандартного шага дорожки и расстояния между питами можно достичь увеличения времени записи - за счет снижения надежности считывания в стандартном дисковом приводе.
Как записываются и изготавливаются компакт-диски?
Основной способ изготовления дисков - прессование с матрицы. Оригинал формируется с исходной цифровой мастер-ленты, содержащей уже подготовленный и закодированный цифровой сигнал, специальным высокоточным станком на стеклянном диске, покрытом слоем фоторезиста - материала, изменяющего свою растворимость под воздействием лазерного луча. При обработке записанного оригинала растворителем на стекле возникает требуемый рельеф, который методом гальванопластики переносится на никелевый оригинал (негатив), который может служить матрицей при мелкосерийном производстве, либо основой для снятия позитивных копий, с которых, в свою очередь, снимаются негативы для массового тиражирования.
Штамповка выполняется методом литья под давлением: с негативной матрицы прессуется поликарбонатная подложка с рельефом, сверху напыляется отражающий слой, который покрывается лаком. Поверх защитного слоя обычно наносятся информационные надписи и изображения.
Диски с возможностью записи (CD-R, "болванки") изготавливаются таким же методом, но между основой и отражающим слоем располагается слой органического вещества, темнеющего при нагревании. В исходном состоянии слой прозрачен, при воздействии лазерного луча образуются непрозрачные участки, эквивалентные питам. Для облегчения слежения за дорожкой при записи на диске в процессе изготовления формируется предварительный рельеф (разметка), дорожка которого содержит метки кадров и сигналы синхронизации, записанные со сниженной амплитудой и впоследствии перекрываемые записываемым сигналом.
Записываемые диски за счет наличия органического фиксирующего слоя имеют более низкий коэффициент отражения, чем штампованные, отчего некоторые проигрыватели (Compact Disk Player - CDP), рассчитанные на стандартные алюминиевые диски и не имеющие запаса по надежности чтения, могут воспроизводить диски CD-R менее надежно, чем обычные.
Как воспроизводятся компакт-диски?
При воспроизведении звуковой компакт-диск вращается с постоянной линейной скоростью (Constant Linear Velocuty - CLV), при которой скорость дорожки относительно воспроизводящей головки приблизительно равна 1.25 м/с. Система стабилизации скорости вращения поддерживает ее на таком уровне, чтобы обеспечить скорость считанного цифрового потока равной 4.3218 Мбит/с, поэтому в зависимости от длины питов и промежутков действительная скорость может изменяться. Угловая скорость диска при этом изменяется от 500 об/мин при чтении самых внутренних участков дорожки до 200 об/м на самых внешних.
Для считывания информации с диска используется полупроводниковый лазер с длиной волны около 780 нм (инфракрасный диапазон). Луч лазера, проходя через фокусирующую линзу, падает на отражающий слой, отраженный луч попадает в фотоприемник, где происходит определение питов и промежутков, а также проверка качества фокусировки пятна на дорожке и его ориентации по центру дорожки. При нарушении фокусировки происходит перемещение линзы, работающей по принципу диффузора громкоговорителя (voice coil - звуковая катушка), при отклонении от центра дорожки - перемещение всей головки по радиусу диска. В сущности, системы управления линзой, головкой и шпиндельным двигателем в приводе являются системами автоматической регулировки (САР) и находятся в режиме постоянного слежения за выбранной дорожкой.
Полученный от фотоприемника сигнал в коде 8/14 демодулируется, в результате чего восстанавливается результат кодирования по CIRC с добавленными субкодами. Затем производится отделение субкодных каналов, деперемежение и декодирование CIRC на двухступенчатом корректоре (C1 - для одиночных ошибок и C2 - для групповых), в результате чего обнаруживается и исправляется большая часть ошибок, внесенных нарушениями при штамповке, дефектами и неоднородностью материалов диска, царапинами на его поверхности, нечетким определением пита/промежутка в фотоприемнике и т.п. В итоге поток "чистых" звуковых отсчетов направляется на ЦАП для преобразования в аналоговую форму.
В звуковых проигрывателях после корректора имеется также интерполятор различной сложности, приближенно восстанавливающий ошибочные отсчеты, которые не удалось исправить в декодере. Интерполяция может быть линейной - в простейшем случае, полиномиальной или с использованием сложных гладких кривых.
Для выполнения деперемежения любое CD-читающее устройство имеет буферную память (стандартный объем - 2 кб), которая заодно используется для стабилизации скорости цифрового потока. Для декодирования может использоваться несколько различных стратегий, в которых вероятность обнаружения групповых ошибок обратно пропорциональна надежности их коррекции; выбор стратегии отдается на усмотрение разработчика декодера. Например, для CD-проигрывателя с мощным интерполятором может выбираться стратегия с упором на максимальное обнаружение, а для CDP с простым интерполятором или привода CD-ROM - на максимальную коррекцию.
Каковы параметры звукового сигнала на CD?
Стандартные параметры оцифровки - частота дискретизации 44.1 кГц и разрядность отсчета 16 - определяют следующие теоретически вычисленные характеристики сигнала:
- Диапазон частот: 0..22050 Гц
- Динамический диапазон: 98 дБ
- Уровень шума: -98 дБ
- Коэффициент нелинейных искажений: 0.0015% (на максимальном уровне сигнала)
В реальных устройствах записи и воспроизведения CD верхние частоты нередко обрезаются на уровне 20 кГц для создания запаса по крутизне АЧХ фильтра. Уровень шума может быть как меньше 98 дБ в случае линейного ЦАП и шумного выходного усилителя, так и больше - в случае передискретизации на более высокой частоте с использованием ЦАП типа Delta-Sigma, Bitstream или MASH и малошумящих усилителей. Коэффициент нелинейных искажений сильно зависит от применяемого ЦАП выходных цепей и качества источника питания.
Динамический диапазон в 98 дБ определяется для CD, исходя из разницы между минимальным и максимальным уровнем звукового сигнала, однако на малом сигнале значительно возрастает уровень нелинейных искажений, отчего реальный динамический диапазон, внутри которого сохраняется приемлемый уровень искажений, обычно не превышает 50-60 дБ.
Коэффициент детонации в системе "компакт-диск" лишен смысла, поскольку нестабильность скорости вращения диска напрямую никак не связана с нестабильностью выходного сигнала, которая практически целиком определяется задающими генераторами. Однако "тонкая" зависимость звука от работы механических и электронных систем CDP может проявляться благодаря распространению помех по цепям питания, наводкам между сигнальны ми линиями, микрофонному эффекту отдельных деталей и прочим паразитным воздействиям на звуковой тракт. В частности, помехи по питанию вызывают дрожание фазы (jitter) опорных генераторов, приводящее к такому же дрожанию фазы цифрового сигнала, поступающего на ЦАП, что в итоге нарушает фазовые характеристики звукового сигнала, ощущаемые на слух как "размывание" и потеря локализации источников звука в пространстве.
Что такое jitter?
Джиттер - быстрое по отношению к длительности периода дрожание фазы цифрового сигнала, когда нарушается строгая равномерность следования фронтов импульсов. Такое дрожание возникает из-за нестабильности тактовых генераторов, а также в местах выделения синхросигнала из комплексного сигнала методом PLL (Phase Locked Loop - петля с захватом фазы, или фазовая автоподстройка частоты - ФАПЧ). Такое выделение имеет место, например, в демодуляторе сигнала, считанного с диска, в результате чего образуется опорный синхросигнал, который путем коррекции скорости вращения диска "подгоняется" к эталонной частоте 4.3218 МГц. Частота синхросигнала, а следовательно - его фаза и фаза информационного сигнала - при этом непрерывно колеблются с различной частотой. Дополнительный вклад может вносить неравномерность расположения питов на диске, порожденная, например, некачественным прессованием или нестабильной записью.
Однако неравномерности сигнала с диска полностью компенсируются входным буфером декодера, так что любое дрожание и детонация, возникшие до помещения сигнала в буфер, на этом этапе уничтожаются. Выборка из буфера управляется стабильным генератором с фиксированной частотой, однако таким генераторам тоже присуща определенная, хотя и гораздо меньшая, нестабильность. В частности, она может быть вызвана помехами по цепям питания, которые, в свою очередь, могут возникать в моменты срабатывания САР и коррекции скорости диска или положения головки/линзы. На дисках низкого качества эти коррекции происходят чаще, давая ряду экспертов повод напрямую связывать стабильность выходного сигнала с качеством диска, хотя на самом деле причиной является недостаточно хорошая развязка систем CDP.
Что означают аббревиатуры AAD, DDD, ADD?
Буквы этой аббревиатуры отражают формы звукового сигнала, использованные при создании диска: первая - при исходной записи, вторая - при обработке и сведении, третья - конечный мастер-сигнал, с которого формируется диск. "A" обозначает аналоговую (analog) форму, "D" - цифровую (digital). Мастер-сигнал для CD всегда существует только в цифровой форме, поэтому третья буква аббревиатуры всегда "D".
И аналоговая, и цифровая формы сигнала имеют свои достоинства и недостатки. При записи и обработке сигнала в аналоговой форме наиболее полно сохраняются его "тонкие элементы", в частности - высшие гармоники, однако возрастает уровень шума и искажаются амплитудно-частотная и фазо-частотная характеристики (АЧХ/ФЧХ). При обработке в цифровой форме высшие гармоники принудительно обрезаются на половине частоты дискретизации, а часто и еще ниже, однако все дальнейшие операции выполняются с предельно возможной для выбранного разрешения точностью. Сигнал, прошедший аналоговую обработку, ряд экспертов оценивает, как более "теплый" и "живой", однако многие современные методы обработки сигнала приемлемо реализуются только в цифровом варианте.
Могут ли два одинаковых диска звучать по-разному?
Прежде всего, необходимо убедиться, что диски действительно содержат идентичный цифровой звуковой сигнал. Полное двоичное совпадение двух дисков на уровне конфигурации питов и промежутков практически невозможно за счет мелких дефектов материала и искажений при обработке матриц и прессовании, однако благодаря избыточному кодированию подавляющее большинство этих ошибок исправляется при декодировании, обеспечивая один и тот же цифровой поток "высокого уровня".
Сравнить цифровое содержимое дисков можно путем чтения их в приводе CD-ROM, поддерживающем режим Read Long или Raw Read - считывания "длинных секторов", которые на самом деле являются сверхкадрами CD-DA объемом 2352 байта каждый. Подробнее об этом можно прочитать в FAQ по CD-ROM или в руководстве к программам считывания звука (CD-DA Grabbers/Rippers). Сравнить диски можно также на студийной аппаратуре, умеющей читать диски в цифровом виде на DAT-магнитофон.
Причин для возникновения цифровых различий между похожими на слух дисками может быть несколько. Некоторые приводы CD-ROM и другие аппараты цифрового чтения CD-DA могут в целях недопущения прямого копирования вносить в сигнал малозаметные на слух искажения (например, применяя сглаживающие полиномы), а большинство приводов, поддерживающих команды чтения полных кадров, делают это неаккуратно и неточно. При изготовлении копий (перепечаток) звуковых дисков, особенно пиратским способом, они нередко копируются с передискретизацией на другую частоту (например, 48 кГц в DAT) с последующей передискретизацией на исходную, либо вовсе через аналоговый тракт с двойным преобразованием цифра/аналог. Ряд версий записывающих программ для CD-R также намеренно или случайно искажает исходные данные, так что копия не совпадает с оригиналом.
Если цифровое содержимое двух дисков совпадает, они тем не менее тоже могут давать различное звучание на одном CDP. Возможными причинами этого могут быть:
- Недостаточно надежная система считывания и декодирования во многих дорогих CDP, преднамеренно рассчитанная на столь же редкие и дорогие диски. Это косвенно подтверждается тем, что нередко диски низкого качества, успешно считываемые дешевыми CDP, крайне плохо воспроизводятся проигрывателями класса High End.
- Применение в декодере CIRC стратегий, ориентированных на обнаружение ошибок, нежели на их исправление, в результате чего безошибочно считываются только очень качественные диски, а большая часть обычных порождает ошибки, маскируемые интерполятором.
- Недостаточно полное подавление помех, создаваемых механической системой CDP, которая при плохом качестве сигнала с диска работает с большей нагрузкой и создает помехи большей интенсивности.
- Различные коэффициенты отражения/преломления луча, глубина/форма питов, неровность дорожки, а также прочие особенности дисков, влияющие на интенсивность отраженного луча и форму сигнала, создаваемого им в фотоприемнике. Даже если восстановленный при декодировании цифровой сигнал в обоих случаях будет одинаковым, тем не менее электрические процессы, происходящие в CDP, в общем случае будут различны. Отголоски этих процессов в виде паразитных помех могут проникать в схему ЦАП и влиять на выдаваемый им звуковой сигнал.
Надо отметить, что даже если цифровое содержимое двух дисков совпало при их сравнении в некоторой системе (CD-ROM, специальные устройства для сравнения оригинала/копии и т.п.), это вовсе не означает, что на том или ином CDP с них также будут декодироваться идентичные цифровые сигналы. Поэтому наиболее надежным способом выяснения причины различий в звуке будет использование CDP с цифровым выходом, с которого во время прослушивания обоих дисков ведется запись на какое-либо устройство хранения. Последующее цифровое сравнение полученных сигналограмм покажет, в каком месте проигрывателя в сигнал вносятся слышимые ухом изменения.
Разумеется, перед сравнением оригинала и копии таким способом необходимо убедиться в повторяемости результатов многократного считывания одних и тех же дисков. Различные цифровые сигналограммы в этом случае могут свидетельствовать о ненадежном считывании диска или плохой работе цифровых интерфейсов (приемник, передатчик, кабель, разъемы). Идентичность цифровых данных при повторных воспроизведениях нескольких дисков можно считать достаточным признаком надежности как самих дисков, так и систем считывания, декодирования и межмодульной передачи.
Слуховое сравнение звучания дисков должно быть корректным - наиболее признанным является двойной слепой тест (double-blind test). Суть метода состоит в том, что эксперт (слушатель) не должен видеть манипуляций с аппаратурой и производящего их человека, а сам этот человек, произвольным образом меняющий диски, не должен знать особенностей их содержимого. Таким образом максимально исключаются любые влияния, в том числе "тонкие" и неизученные, людей на аппаратуру и друг на друга, а мнение эксперта считается предельно непредвзятым.
Что такое HDCD?
High Definition Compatible Digital - "сверх-система" кодирования звука на CD, использующая стандартный формат CD-DA. Звуковой сигнал с более высокой разрядностью и частотой дискретизации подвергается цифровой обработке, в результате которой из него выделяется основная часть, кодируемая, как обычно, методом PCM, а дополнительная информация, уточняющая мелкие детали, кодируется в младших битах отсчетов (LSB) и маскируемых спектральных областях. При проигрывании диска HDCD на обычном CDP используется только основная часть сигнала, а при использовании специального CDP со встроенным декодером и процессором HDCD из цифрового кода извлекается вся информация о сигнале.
Как обращаться с компакт-дисками?
Избегая механического повреждения любой из поверхностей, попадания на диск органических растворителей и прямого яркого света, ударов и перегибов диска. Надписи на записываемых дисках допускается делать только карандашами или специальными фломастерами, исключая нажим и использование шариковых или перьевых ручек.
При извлечении диска из коробки следует остерегаться его перегиба. Один из удобных и безопасных методов требует участия двух рук - большой палец левой руки слегка нажимает на фиксатор, ослабляя его, в то время как другая рука снимает диск с фиксатора. Метод с использованием одной руки, когда указательный палец ослабляет фиксатор, а большой и средний снимают диск, требует более точного согласования усилий, без которого легко перегнуть диск или сломать лепестки фиксатора.
Загрязненный диск можно мыть теплой водой с мылом или неагрессивным поверхностно-активным веществом (шампунь, стиральный порошок), либо специально выпускаемыми жидкостями. Неглубокие царапины на прозрачном слое можно заполировать - полирующими пастами, не содержащими органических растворителей и масел, или обычной зубной пастой.
Что такое "зеленый фломастер" и зачем он нужен?
Это фломастер, наполненный специальным составом, хорошо поглощающим инфракрасное излучение. Им закрашивается внешняя кромка диска с целью ослабить отражения луча от ее внутренней поверхности, и тем самым снизить помехи от паразитных отражений на основной луч.
Многие пользователи и эксперты утверждают, что обработанный таким образом диск дает более чистое звучание в аппаратах высокого класса, приписывая это более точному считыванию цифровой информации с диска, который в своем исходном виде якобы не может быть достоверно считан в большинстве приводов. Однако тщательно выполненная система (привод и декодер) в состоянии правильно считывать не только необработанные диски, но и диски среднего качества, и даже слегка загрязненные и поцарапанные, поэтому возможные причины улучшения звучания следует искать не в диске. Наиболее вероятными объяснениями этого феномена представляются те же факторы, которые создают различное звучание совпадающих по цифровому содержимому экземпляров дисков.
Где найти более подробную информацию по компакт-дискам?
- П. Шкритек, Справочное руководство по звуковой схемотехнике. - М., "Мир", 1991.
- Оптические дисковые системы. - М., "Радио и связь", 1991.
- Compact Disk Terminology, Jim Fricks, Disc Manufacturing, Inc. Рас- пространяется в файле CD_Term.Doc.
- CD-R FAQ, Andy McFadden, www.fadden.com/cdrfaq/
- www.cd-info.com
- а также с помощью поисковых систем по ключевым словам CD, CD-DA, Compact Disk, CDP, CIRC и т.п.