Ціль.Осмислити процес перетворення звукової інформації, засвоїти поняття необхідні підрахунку обсягу звукової інформації. Навчитися вирішувати завдання на тему.

Ціль-мотивація.Підготовка до ЄДІ.

План уроку

1. Перегляд презентації на тему з коментарями вчителя.Додаток 1

Матеріал презентації: кодування звукової інформації.

З початку 90-х персональні комп'ютери отримали можливість працювати зі звуковою інформацією. Кожен комп'ютер, що має звукову плату, мікрофон та колонки, може записувати, зберігати та відтворювати звукову інформацію.

Процес перетворення звукових хвиль на двійковий код у пам'яті комп'ютера:

Процес відтворення звукової інформації, збереженої у пам'яті ЕОМ:

Звукявляє собою звукову хвилю з амплітудою і частотою, що безперервно змінюється. Чим більше амплітуда, тим голосніше для людини, що більше частота сигналу, то вище тон. Програмне забезпечення комп'ютера в даний час дозволяє безперервний звуковий сигналперетворювати на послідовність електричних імпульсів, які можна представити в двійковій формі. У процесі кодування безперервного звукового сигналу здійснюється його тимчасова дискретизація . Безперервна звукова хвиля розбивається на окремі маленькі часові ділянки, причому для кожної такої ділянки встановлюється певна величина амплітуди.

Таким чином, безперервна залежність амплітуди сигналу від часу A(t)замінюється на дискретну послідовність рівнів гучності. На графіку це виглядає як заміна гладкої кривої на послідовність «сходинок». Кожній «сходинці» надається значення рівня гучності звуку, його код (1, 2, 3 і так

далі). Рівні гучності звуку можна розглядати як набір можливих станів, відповідно, чим більше рівнів гучності буде виділено в процесі кодування, тим більша кількість інформації буде нести значення кожного рівня і тим якіснішим буде звучання.

Аудіоадаптер (звукова плата) - спеціальний пристрій, що підключається до комп'ютера, призначений для перетворення електричних коливань звукової частоти в числовий двійковий код під час введення звуку та для зворотного перетворення (з числового коду в електричні коливання) при відтворенні звуку.

У процесі запису звуку аудіоадаптер з певним періодом вимірює амплітуду електричного струму і заносить до регістра двійковий код отриманої величини. Потім отриманий код з регістру переписується на оперативну пам'ять комп'ютера. Якість комп'ютерного звуку визначається характеристиками аудіоадаптера:

  • Частотою дискретизації
  • Розрядністю (глибина звуку).

Частота тимчасової дискретизації

Ця кількість вимірів вхідного сигналу за 1 секунду. Частота вимірюється у герцах (Гц). Один вимір за секунду відповідає частоті 1 Гц. 1000 вимірів за 1 секунду – 1 кілогерц (кГц). Характерні частоти дискретизації аудіоадаптерів:

11 кГц, 22 кГц, 44,1 кГц та ін.

Розрядність регістру (глибина звуку) – число біт у регістрі аудіоадаптера, задає кількість можливих рівнів звуку.

Розрядність визначає точність виміру вхідного сигналу. Чим більша розрядність, тим менша похибка кожного окремого перетворення величини електричного сигналу в число і назад. Якщо розрядність дорівнює 8 (16) то при вимірюванні вхідного сигналу може бути отримано 2 8 = 256 (2 16 = 65536) різних значень. Очевидно, 16-розрядний аудіоадаптер точніше кодує і відтворює звук, ніж 8-розрядний. Сучасні звукові карти забезпечують 16-розрядну глибину кодування звуку. Кількість різних рівнів сигналу (станів при даному кодуванні) можна розрахувати за такою формулою:

N = 2 I = 2 16 = 65 536, де I - глибина звуку.

Таким чином, сучасні звукові карти можуть забезпечити кодування рівнів 65536 сигналу. Кожному значенню амплітуди звукового сигналу надається 16-бітовий код. При двійковому кодуванні безперервного звукового сигналу він замінюється послідовністю дискретних рівнів сигналу. Якість кодування залежить від кількості вимірювань рівня сигналу за одиницю часу, тобто частоти дискретизаціїЧим більша кількість вимірювань проводиться за 1 секунду (чим більша частота дискретизації, тим точніше процедура двійкового кодування).

Звуковий файл -файл, що зберігає звукову інформацію у числовій двійковій формі.

2. Повторюємо одиниці виміру інформації

1 байт = 8 біт

1 Кбайт = 2 10 байт = 1024 байт

1 Мбайт = 2 10 Кбайт = 1024 Кбайт

1 Гбайт = 2 10 Мбайт = 1024 Мбайт

1 Тбайт = 2 10 Гбайт = 1024 Гбайт

1 Пбайт = 2 10 Тбайт = 1024 Тбайт

3. Закріпити вивчений матеріал, переглянувши презентацію, підручник

4. Розв'язання задач

Підручник , показ рішення на презентації.

Завдання 1.Визначити інформаційний обсяг стерео аудіо файлу тривалістю звучання 1 секунда за високої якості звуку (16 бітів, 48 кГц).

Завдання (самостійно).Підручник , показ рішення на презентації.
Визначити інформаційний обсяг цифрового аудіо файлу тривалістю звучання якого становить 10 секунд при частоті дискретизації 22,05 кГц і роздільній здатності 8 бітів.

5. Закріплення. Вирішення завдань вдома, самостійно на наступному уроці

Визначити обсяг пам'яті для зберігання цифрового аудіофайлу, час звучання якого становить дві хвилини при частоті дискретизації 44,1 кГц та роздільній здатності 16 біт.

У розпорядженні користувача є пам'ять об'ємом 2,6 Мб. Необхідно записати цифровий аудіофайл із тривалістю звучання 1 хвилина. Якою має бути частота дискретизації та розрядність?

Об'єм вільної пам'яті на диску – 5,25 Мб, розрядність звукової плати – 16. Яка тривалість звучання цифрового аудіофайлу, записаного з частотою дискретизації 22,05 кГц?

Одна хвилина запису цифрового аудіофайлу займає на диску 1,3 Мб, розрядність звукової плати – 8. З якою частотою дискретизації записано звук?

Який обсяг пам'яті потрібен для зберігання цифрового аудіофайлу із записом високої якості за умови, що час звучання становить 3 хвилини?

Цифровий аудіофайл містить запис звуку низької якості (звук похмурий та приглушений). Якою є тривалість звучання файлу, якщо його обсяг становить 650 Кб?

Дві хвилини записування цифрового аудіофайлу займають на диску 5,05 Мб. Частота дискретизації – 22 050 Гц. Яка розрядність аудіоадаптера?

Об'єм вільної пам'яті на диску – 0,1 Гб, розрядність звукової плати – 16. Яка тривалість звучання цифрового аудіофайлу, записаного з частотою дискретизації 44 100 Гц?

Відповіді

№ 92. 124,8 секунд.

№ 93. 22,05 кГц.

№ 94. Висока якість звучання досягається при частоті дискретизації 44,1 кГц та розрядності аудіоадаптера, що дорівнює 16. Необхідний об'єм пам'яті – 15,1 Мб.

№ 95. Для похмурого та приглушеного звуку характерні такі параметри: частота дискретизації – 11 кГц, розрядність аудіоадаптера – 8. Тривалість звучання дорівнює 60,5 с.

№ 96. 16 бітів.

№ 97. 20,3 хвилини.

Література

1. Підручник: Інформатика, задачник-практикум 1 том, за редакцією І.Г.Семакіна, Є.К. Хеннера)

2. Фестиваль педагогічних ідей «Відкритий урок» Звук. Двійкове кодування звукової інформації. Супрягіна Олена Олександрівна, учитель інформатики.

3. Н. Угрінович. Інформатика та інформаційні технології. 10-11 класи. Москва. Біном. Лабораторія знань 2003 року.

Звукові пристрої стають невід'ємною частиною кожного комп'ютера. У процесі конкурентної боротьби було вироблено універсальний, широко підтримуваний стандарт звукового програмного та апаратного забезпечення. Звукові пристрої перетворилися з дорогих екзотичних доповнень на звичну частину системи практично будь-якої конфігурації.

У сучасних комп'ютерах апаратна підтримка звуку реалізується в одній із таких форм:

  • аудіоадаптер, що міститься в роз'єм шини PCI або ISA;
  • мікросхема на системній платі, що випускається компаніями Crystal, Analog Devices, Sigmatel, ESS та ін;
  • звукові пристрої, інтегровані в базовий набір мікросхем системної плати, до яких належать найсучасніші набори мікросхем компаній Intel, SiS та VIA Technologies, створені для недорогих комп'ютерів.

Крім основного аудіопристрою, існує ще безліч додаткових аудіопристроїв: акустичні системи, мікрофон та ін У цьому розділі розглядаються функціональність та особливості роботи всіх компонентів аудіосистеми комп'ютера.

Перші звукові плати з'явилися наприкінці 1980-х. на базі розробок компаній AdLib, Roland та Creative Labs та використовувалися тільки для ігор. У 1989 р. компанія Creative Labs випустила стереозвукову плату Game Blaster; пізніше з'явилася плата Sound Blaster Pro.

Для стабільного функціонування плати були потрібні певні програмні (MS DOS, Windows) та апаратні ресурси (IRQ, DMA та адреси порту введення-виведення).

У зв'язку з проблемами, що виникають у процесі застосування звукових плат, не сумісних із системою Sound Blaster Pro, у грудні 1995 р. з'явилася нова розробка компанії Microsoft- DirectX, яка є серією програмованих інтерфейсів програми (Application Program Interfaces - API) для безпосередньої взаємодії з пристроями апаратного забезпечення.

Сьогодні практично кожен комп'ютер оснащений звуковим адаптером того чи іншого типу та пристроєм CD-ROM або

CD-ROM-сумісним дисководом. Після прийняття стандартів МРС-1-МРС-3, які визначають класифікацію комп'ютерів, системи, обладнані звуковою платою та CD-ROM-сумісним накопичувачем, отримали назву мультимедійних комп'ютерів (Multimedia PC). Перший стандарт МРС-1 було представлено 1990 р.; стандарт МРС-3, який змінив його у червні 1995 р., визначив наступні мінімальні вимогидо апаратного та програмного забезпечення:

  • процесор – Pentium, 75 МГц;
  • оперативна пам'ять – 8 Мб;
  • жорсткий диск – 540 Мб;
  • дисковод CD-ROM - чотиришвидкісний (4х);
  • роздільна здатність VGA - 640 х 480;
  • глибина кольору - 65536 кольорів (16-бітовий колір);
  • мінімальна операційна система – Windows 3.1.

Будь-які комп'ютери, створені після 1996 р., містять

звуковий адаптер і CD-ROM-сумісний дисковод повністю задовольняють вимогам стандарту МРС-3.

В даний час критерії приналежності комп'ютера до класу мультимедійних дещо змінилися у зв'язку з технічними досягненнями у цій галузі:

  • процесор - Pentium III, Celeron, Athlon, Duron або інший процесор класу Pentium, 600 МГц;
  • оперативна пам'ять – 64 Мб;
  • жорсткий диск – 3,2 Гб;
  • гнучкий диск - 1,44 Мб (3,5" диск із високою щільністю розміщення даних);
  • дисковод CD-ROM - 24-швидкісний (24х);
  • звукова частотадискретизації – 16-розрядна;
  • роздільна здатність VGA - 1024 х 768;
  • глибина кольору – 16,8 млн кольорів (24-бітовий колір);
  • пристрої вводу-виводу – паралельний, послідовний, MIDI, ігровий порт;
  • мінімальна операційна система – Windows 98 або Windows Me.

Незважаючи на те, що звукові колонки або навушники технічно не є частиною МРС специфікації або наведеного вище переліку, вони необхідні для відтворення звуку. Крім того, для введення голосової інформації, яка використовується для запису звуку або мовного керування комп'ютером, потрібен мікрофон. Системи, оснащені звуковим адаптером, зазвичай містять недорогі пасивні або активні колонки (можуть бути замінені навушниками, що забезпечують необхідну якість і частотні характеристики звуку, що відтворюється).

Мультимедійний комп'ютер, оснащений колонками та мікрофоном, має ряд можливостей та забезпечує:

  • додавання стереозвуку до розважальних (ігрових) програм;
  • підвищення ефективності освітніх програм (для дітей);
  • додавання звукових ефектів до демонстраційних та навчальних програм;
  • створення музики за допомогою апаратних та програмних засобів MIDI;
  • додавання до файлів звукових коментарів;
  • реалізацію звукових мережевих конференцій;
  • додавання звукових ефектів до подій операційної системи;
  • звукове відтворення тексту;
  • програвання аудіокомпакт-дисків;
  • програвання файлів формату.mp3;
  • програвання відеокліпів;
  • відтворення DVD-фільмів;
  • підтримку керування голосом.

Компоненти аудіосистеми.Під час вибору аудіосистеми необхідно враховувати параметри її компонентів.

Рознімання звукових плат.Більшість звукових плат мають однакові мініатюрні (1/8") роз'єми, за допомогою яких сигнали подаються з плати на акустичні системи, навушники та входи стереосистеми; до аналогічних роз'ємів підключається мікрофон, програвач компакт-дисків і магнітофон. На рис. роз'ємів, які як мінімум повинні бути встановлені на звуковій платі Колірні позначення роз'ємів кожного типу визначені в посібнику РС99 Design Guide та варіюються для різних звукових адаптерів.

Рис. 5.4.

Перерахуємо найпоширеніші роз'єми:

  • лінійний вихід плати. Сигнал із цього роз'єму подається на зовнішні пристрої- акустичні системи, навушники або на вхід стереопідсилювача, за допомогою якого підсилюють сигнал до необхідного рівня;
  • лінійний вхід плати. Використовується для мікшування або запису звукового сигналу, що надходить від зовнішньої аудіосистеми на жорсткий диск;
  • роз'єм для акустичної системита навушників. Є не у всіх платах. Сигнали на акустичні системи подаються з того ж роз'єму (лінійного виходу), що на вхід стереопідсилювача;
  • мікрофонний вхід або вхід монофонічного сигналу. Використовується для підключення мікрофона. Запис із мікрофона є монофонічним. Рівень вхідного сигналу підтримується постійним і оптимальним для перетворення. Для запису краще використовувати електродинамічний або конденсаторний мікрофон, розрахований на опір навантаження від 600 Ом до 10 кОм. У деяких дешевих звукових платах мікрофон підключається до лінійного входу;
  • роз'єм для джойстика (MIDI-порт). Є 15-контактним D-подібним роз'ємом. Два контакти можна використовувати для керування пристроєм MIDI, наприклад клавішним синтезатором. В цьому випадку необхідно придбати Y-подібний кабель;
  • роз'єм MIDI. Включається в порт джойстика, має два круглі 5-контактні роз'єми DIN, що використовуються для підключення пристроїв MIDI, а також роз'єм для джойстика;
  • внутрішній контактний роз'єм - спеціальний роз'єм для підключення до внутрішнього накопичувача CD-ROM. Дозволяє відтворювати звук із компакт-дисків через акустичні системи, підключені до звукової плати. Цей роз'єм відрізняється від роз'єму для підключення контролера CD-ROM до звукової плати, оскільки дані про нього не передаються на шину комп'ютера.

Додаткові роз'єми.Більшість сучасних звукових адаптерів підтримує можливості відтворення DVD, обробки звуку і т. д., а отже, має кілька додаткових роз'ємів, особливості яких наведені нижче:

  • вхід та вихід MIDI. Такий роз'єм, не суміщений з ігровим портом, дозволяє одночасно використовувати як джойстик, так і зовнішні MIDI пристрої;
  • вхід та вихід SPDIF (Sony/Philips Digital Interface - SP/DIF). Роз'єм використовується для передачі цифрових аудіосигналів між пристроями без їхнього перетворення до аналогового вигляду. Інтерфейс SPDIF іноді називають Dolby Digital;
  • CD SPDIF. Роз'єм призначений для підключення накопичувача CD-ROM до звукової плати за допомогою інтерфейсу SPDIF;
  • вхід TAD. Роз'єм для підключення модемів за допомогою автовідповідача (Telephone Answering Device) до звукової плати;
  • Цифровий вихід DIN. Роз'єм призначений для підключення багатоканальних цифрових акустичних систем;
  • вхід Аїх. Забезпечує підключення до звукової картки інших джерел сигналу, наприклад, ТВ-тюнера;
  • вхід I2S. Дозволяє підключати до звукової карти цифровий вихід зовнішніх джерел, наприклад DVD.

Додаткові роз'єми зазвичай розміщуються безпосередньо на звуковій платі або приєднуються до зовнішнього блоку або дочірньої плати. Наприклад, Sound Blaster Live! Platinum 5.1 являє собою пристрій, що складається із двох частин. Сам звуковий адаптер підключається за допомогою роз'єму PCI, а додаткові з'єднувачі - до зовнішнього комутаційного блоку LiveDrive IR, який встановлюється у відсік дисковода, що не використовується.

Управління гучністю. Удеяких звукових платах передбачено ручне регулювання гучності; на більш складних платах управління гучністю здійснюється програмно за допомогою комбінацій клавіш, безпосередньо в процесі гри в системі Windowsабо в будь-якому додатку.

Синтезатори.В даний час всі плати є стереофонічними, що підтримують стандарт MIDI.

Стереофонічні звукові плати одночасно відтворюють (і записують) кілька сигналів від двох джерел. Чим більше сигналів передбачено в адаптері, тим природніший звук. Кожна розташована на платі мікросхема синтезатора, найчастіше компанії Yamaha дозволяє отримати 11 (мікросхема YM3812 або OPL2) сигналів або більше. Для імітації понад 20 сигналів (мікросхема YMF262 чи OPL3) встановлюється одна чи дві мікросхеми частотних синтезаторів.

У таблично-хвильових звукових платах замість синтезованих звуків, що генеруються мікросхемою частотної модуляції, використовуються цифрові записиреальних інструментів та звукових ефектів. Наприклад, при відтворенні таким аудіоадаптер звуку труби чується безпосередньо звук труби, а не його імітація. Перші звукові плати, що підтримують цю функцію, містили до 1 Мб звукових фрагментів, що зберігаються в мікросхемах адаптера. Але внаслідок появи високошвидкісної шини PCI та збільшення обсягу оперативної пам'ятіКомп'ютерів у більшості звукових плат в даний час використовується так званий програмований таблично-хвильовий метод, що дозволяє завантажувати в оперативну пам'ять 2-8 Мб коротких звукових фрагментів різних музичних інструментів.

У сучасних комп'ютерних іграх MIDI-звук практично не використовується, але, незважаючи на це, зміни, зроблені в звуковій платі DirectX 8 роблять його прийнятним варіантом для ігрових фонограм.

Стиснення даних. Убільшості плат якість звучання відповідає якості компакт-дисків із частотою дискретизації

44,1 кГц, коли на кожну хвилину звучання під час запису навіть звичайного голосу витрачається близько 11 Мб дискового простору. Щоб зменшити розміри звукових файлів, у багатьох платах використовується стиск даних. Наприклад, у платі Sound Blaster ASP 16 стискування звуку здійснюється в реальному часі (безпосередньо при записі) зі ступенем стиснення 2:1, 3: 1 або 4:1.

Оскільки для зберігання звукового сигналу необхідний великий об'єм дискового простору, його стискається методом адаптивної диференціальної імпульсно-кодової модуляції (Adaptive Differential Pulse Code Modulation - ADPCM), що дозволяє зменшити розмір файлу приблизно на 50 %. Щоправда, при цьому погіршується якість звуку.

Багатофункціональні сигнальні процесори.Багато звукових платах використовуються процесори цифрової обробки сигналів (Digital Signal Processor - DSP). Завдяки їм плати стали більш «інтелектуальними» та звільнили центральний процесоркомп'ютера від виконання таких трудомістких завдань, як очищення сигналів від шуму та стиснення даних у режимі реального часу.

Процесори встановлюються у багатьох універсальних звукових платах. Наприклад, програмований процесор цифрової обробки сигналів EMU10K1 плати Sound Blaster Live! стискає дані, перетворює текст на мовлення та синтезує так зване тривимірне звучання, створюючи ефект відображення звуку та хорового супроводу. За наявності такого процесора звукова плата перетворюється на багатофункціональний пристрій. Наприклад, у комунікаційній платі WindSurfer компанії IBM цифровий процесор виконує функції модему, факсу та цифрового автовідповідача.

Драйвери звукових платЗ більшістю плат поставляються універсальні драйвери для DOS-і Windows-програм. У операційних системах Windows 9х і Windows NT вже є драйвери для популярних звукових плат; драйвери для інших плат можна придбати окремо.

DOS зазвичай не мають широкого вибору драйверів, але комп'ютерні ігри підтримують адаптери Sound Blaster Pro.

Останнім часом вимоги до звукових пристроїв значно зросли, що зумовило своє чергу підвищення потужності апаратних засобів. Сучасне уніфіковане мультимедійне апаратне забезпечення не може повністю вважатися досконалою мультимедійною системою, Що характеризується такими особливостями:

  • реалістичний об'ємний звук у комп'ютерних іграх;
  • високоякісний звук у DVD-фільмах;
  • розпізнавання мови та голосове управління;
  • створення та запис звукових файлів форматів MIDI, MP3, WAV та CD-Audio.

Додаткові вимоги до апаратного та програмного забезпечення, необхідні для досягнення перерахованих вище характеристик, представлені в табл. 5.3.

Таблиця 5.3.Додаткові можливості та властивості звукових адаптерів

Призначення

Необхідні

можливості

Додаткове апаратне забезпечення

Додаткове програмне забезпечення

Ігровий порт; тривимірний звук; аудіоприскорення

Ігровий контролер; задні колонки

Фільми формату DVD

Декодування Dolby 5.1

Колонки з аудіоадаптером сумісні з Dolby 5.1

Програма декодування MPEG-файлів

Програмно-сумісний аудіоадаптер

Мікрофон

Програмне забезпечення, яке дозволяє диктувати тексти

Створення файлів MIDI

Аудіоадаптер з MIDI-входом

MIDI-сумісна

музична

клавіатура

Програма для створення MIDI-файлів

Створення файлів MP3

Оцифрування звукових файлів

Дисковод CD-R або CD-RW

Програма для створення МРЗ-файлів

Створення файлів WAV

Мікрофон

Програма звукозапису

Створення файлів CDAudio

Зовнішнє джерело звуку

Програма перетворення файлів WAV або MP3 у CD-Audio

Мінімальні вимоги до звукових плат.

Заміна колишнього аудіоадаптера Sound Blaster Pro стандарту ISA звуковою платою PCI дозволила значно покращити робочі характеристики системи, проте доцільно використати всі можливості звукових плат, яких зокрема відносяться:

  • підтримка тривимірного звуку, реалізована у наборі мікросхем. Вираз «тривимірний звук» означає, що звуки, що відповідають на екрані, лунають далі або ближче, за спиною або десь осторонь. Інтерфейс Microsoft DirectX 8.0 включає підтримку тривимірного звуку, проте для цього краще використовувати аудіоадаптер із апаратно вбудованою підтримкою тривимірного звуку;
  • використання інтерфейсу DirectX 8.0 поряд з іншими інтерфейсами API тривимірного звуку, до яких відносяться, наприклад, ЕАХ компанії Creative, 3D Positional Audio компанії Sensaura і технологія A3D компанії Aureal, що нині не існує;
  • ЗО-звукове прискорення. Звукові плати з наборами мікросхем, що підтримують цю можливість мають досить низький коефіцієнт завантаження процесора, що призводить до загального збільшення швидкості ігор. Для отримання найкращих результатів слід скористатися наборами мікросхем, які підтримують прискорення найбільшої кількості 3D-потоків; в іншому випадку обробка тривимірного звуку центральним процесором буде утруднена, що в кінцевому рахунку позначиться на швидкості гри;
  • ігрові порти, що підтримують ігрові контролериіз силовим зворотним зв'язком.

Сьогодні існує безліч звукових плат середнього рівня, що підтримують щонайменше дві з перерахованих функцій. При цьому роздрібна ціна аудіоадаптерів не перевищує 50-100 дол. Нові набори мікросхем тривимірного звуку, що поставляються різними виробниками, дозволяють любителям комп'ютерних 3D-ігор модернізувати систему відповідно до своїх побажань.

Фільми у форматі DVD на екрані комп'ютера.Для перегляду фільмів у форматі DVD на комп'ютері потрібні такі компоненти:

  • програмне забезпечення для відтворення цифрових дисків, яке підтримує вихід Dolby Digital 5.1. Одним із найбільш прийнятних варіантів є програма PowerDVD;
  • аудіоадаптер, що підтримує вхідний сигнал Dolby Digital дисководу DVD та виводить дані на Dolby Digital 5.1-сумісні звукові апаратні пристрої. У разі відсутності відповідного апаратного забезпечення вхід Dolby 5.1 налаштовується для роботи з чотирма колонками; крім того, можна додати вхід S/PDIF ACS (Dolby Surround), призначений для чотириколоночних акустичних систем;
  • Dolby Digital 5.1-сумісні приймач та колонки. Більшість високоякісних звукових плат, що підтримують систему Dolby Digital 5.1, з'єднані зі спеціальним аналого-вхідним приймачем, але низка інших, наприклад звукові плати серії Creative Labs Sound Blaster Live! Platinum підтримують і акустичні системи з цифровим входом, додаючи до плати додатковий роз'єм Digital DIN.

Розпізнавання мови.Технологія розпізнавання мови поки що недосконала, але вже сьогодні існують програми, що дозволяють віддавати комп'ютеру команди голосом, викликати потрібні програми, відкривати файли та необхідні діалогові вікна і навіть диктувати йому тексти, які раніше довелося б набирати.

Для типового користувача програми цього типу марні. Так, компанія Compaq деякий час постачала комп'ютери з мікрофоном та додатком для голосового управління, причому коштував додаток дуже дешево. Спостерігати за безліччю користувачів в офісі, які розмовляють з комп'ютерами, було, звичайно, цікаво, але продуктивність фактично не збільшилася, зате багато часу було витрачено марно, оскільки користувачі були змушені експериментувати з програмним забезпеченням, а крім того, в офісі стало дуже галасливо.

Однак для користувачів з обмеженими можливостями здоров'я програмне забезпечення цього типу може представляти певний інтерес, тому технологія розпізнавання мовлення безперервно розвивається.

Як було зазначено вище, існує ще один тип програмного забезпечення розпізнавання мови, що дозволяє перетворювати мову на текст. Це надзвичайно важке завдання, перш за все через відмінності в мовних моделях різних людей, тому майже все програмне забезпечення, в тому числі деякі програми для подання команд голосом, передбачають етап «навчання» технології розпізнавання голосу конкретного користувача. У процесі такого навчання користувач читає текст (або слова), що біжить на екрані комп'ютера. Оскільки текст запрограмований, комп'ютер швидко адаптується до манері мови.

В результаті проведених експериментів виявилось, що якість розпізнавання залежить від індивідуальних особливостей мови. Крім того, деякі користувачі можуть диктувати цілі сторінки тексту без дотиків до клавіатури, в той час як інші від цього втомлюються.

Існує безліч параметрів, які впливають якість розпізнавання промови. Перерахуємо основні з них:

  • програми розпізнавання дискретного та злитого мовлення. Злите (або зв'язне) мовлення, що дозволяє вести більш природний «діалог» з комп'ютером, в даний час є стандартним, але, з іншого боку, є низка нерозв'язних поки що проблем у досягненні прийнятної точності розпізнавання;
  • навчальні та ненавчені програми. «Навчання» програми для коректного розпізнавання мовлення дає хороші результати навіть у додатках, які дозволяють пропустити цей етап;
  • великі активні та загальні словники. Програми з більшим активним словником значно швидше реагують на усне мовлення, а програми, які мають більший загальний словник, дозволяють зберегти унікальний запас слів;
  • продуктивність апаратного забезпечення комп'ютера Збільшення швидкодії процесорів та обсягу оперативної пам'яті призводить до відчутного підвищення швидкості та точності програм розпізнавання мовлення, а також дозволяє розробникам вводити додаткові можливостінові версії додатків;
  • високоякісна звукова плата та мікрофон: навушники із вбудованим мікрофоном призначені не для запису музики або звукових ефектів, а саме для розпізнавання мовлення.

Звукові файли.Для зберігання аудіозаписів на персональному комп'ютері є файли двох основних типів. У файлах першого типу, які називаються звичайними звуковими файлами, використовуються формати .wav, .voc, .au та .aiff. Звуковий файл містить дані про форму хвилі, тобто є запис аналогових аудіосигналів у цифровій формі, придатної для зберігання на комп'ютері. Визначено три рівні якості запису звуків, що застосовуються в операційних системах Windows 9х та Windows Me, а також рівень якості запису звуку з характеристиками 48 кГц, 16-розрядний стерео та 188 Кб/с. Цей рівень призначений для підтримки відтворення звуку з таких джерел, як DVD та Dolby АС-3.

Для досягнення компромісу між високою якістю звуку та малим розміром файлу можна перетворити файли формату.wav на формат.mp3.

Стиснення аудіоданих.Існує дві основні області, в яких застосовується стискування звуку:

  • використання звукових фрагментів на веб-сайтах;
  • Зменшення обсягу високоякісних музичних файлів.

Спеціальні програми редагування звукових файлів, зокрема RealProducer компанії Real або Microsoft Windows Media Encoder 7 дозволяють зменшувати об'єм звукових фрагментів при мінімальній втраті якості.

Найпопулярніший формат звукових файлів – .mp3. Якість цих файлів наближається до якості звучання компакт-диска, а за розміром вони набагато менші за звичайні файли.wav. Так, звуковий файл тривалістю звучання 5 хв формату.wav з якістю компакт-диска має розмір близько 50 Мб, тоді як той самий звуковий файл формату.mp3 - близько 4 Мб.

Єдиним недоліком файлів формату.mp3 є відсутність захисту від несанкціонованого використання, тобто будь-хто може вільно завантажити такий файл з Інтернету (благо веб-вузлів, що пропонують ці «піратські» записи, існує безліч). Формат файлів, що описується, незважаючи на недоліки, отримав досить широке поширення і зумовив масове виробництво трЗ-плеєрів.

Файли MIDI.Звуковий файл формату MIDI відрізняється від формату. wav так само, як векторний малюнок від растру. Файли MIDI мають розширення .mid або .rmi і є повністю цифровими, що містять не запис звуку, а команди, що використовуються аудіообладнанням для створення. Подібно до того, як за командами відеоадаптери створюють зображення тривимірних об'єктів, звукові плати MIDI працюють із файлами MIDI, щоб синтезувати музику.

MIDI - потужна мова програмування, яка набула поширення в 1980-х роках. та розроблений спеціально для електронних музичних інструментів. Стандарт MIDI став новим словом у галузі електронної музики. За допомогою MIDI можна створювати, записувати, редагувати та відтворювати музичні файли на персональному комп'ютері або на MIDI-сумісному електронному музичному інструменті, підключеному до комп'ютера.

Файли MIDI, на відміну від інших типів звукових файлів, вимагають відносно невеликого об'єму дискового простору. Для запису 1 години стереомузики, що зберігається у форматі MIDI, потрібно менше 500 Кбайт. У багатьох іграх використовується запис звуків у форматі MIDI, а чи не записи дискретизированного аналогового сигналу.

Файл MIDI - це цифрове відображення музичної партитури, складене з декількох виділених каналів, кожен з яких представляє різний музичний документ або тип звуку. У кожному каналі визначено частоти та тривалість звучання нот: в результаті файл MIDI, наприклад, для струнного квартету, містить чотири канали, які представляють дві скрипки, альт та віолончель.

Усі три специфікації МРС, і навіть РС9х передбачають підтримку формату MIDI переважають у всіх звукових платах. Стандарт General MIDI для більшості звукових плат передбачає до 16 каналів у єдиному файлі MIDI, але це не обов'язково обмежує звук 16 інструментами. Один канал здатний репрезентувати звук групи інструментів; тому можна синтезувати повний оркестр.

Оскільки файл MIDI складається із цифрових команд, редагувати його набагато легше, ніж звуковий файл типу .wav. Відповідне програмне забезпечення дозволяє вибирати будь-який канал MIDI, записувати ноти, а також додавати ефекти. Певні пакети програм призначені для запису музики у файлі MIDI, використовуючи стандартну музичну систему позначень. У результаті композитор пише музику безпосередньо на комп'ютері, редагує її за потреби, а потім роздруковує ноти для виконавців. Це дуже зручно для професійних музикантів, котрі змушені витрачати багато часу на переписування нот.

Відтворення файлів MIDI.Запуск MIDI-файлу на персональному комп'ютері не означає відтворення запису. Комп'ютер фактично створює музику за записаними командами: система читає файл MIDI, синтезатор генерує звуки для кожного каналу відповідно до команд у файлі, щоб надати потрібний тон і тривалість звучання нот. Для отримання звуку певного музичного інструменту синтезатор використовує зумовлений зразок, тобто набір команд, за допомогою яких створюється звук, подібний до відтворюваного конкретним інструментом.

Синтезатор на звуковій платі подібний до електронного клавішного синтезатора, але з обмеженими можливостями. Відповідно до специфікації МРС звукова плата повинна мати частотний синтезатор, який може одночасно програти принаймні шість мелодійних нот та дві ударні.

Частотний синтез.Більшість звукових плат генерують звуки за допомогою частотного синтезатора; ця технологія була розроблена ще в 1976 р. Використовуючи одну синусоїдальну хвилю для зміни іншої, частотний синтезатор створює штучний звук, що нагадує звучання певного інструменту. У стандарті MIDI визначено набір запрограмованих звуків, які можна програти за допомогою більшості інструментів.

У деяких частотних синтезаторах використовуються чотири хвилі, і звуки, що відтворюються, мають цілком нормальне, хоча і дещо штучне звучання. Наприклад, синтезований звук труби, безсумнівно, подібний до її звучання, але ніхто і ніколи не визнає його звуком справжньої труби.

Таблично-хвильовий синтез.Особливість частотного синтезу полягає в тому, що звук, що відтворюється, навіть у кращому випадку не повністю збігається з реальним звучанням музичного інструменту. Недорога технологія більш природного звучання була розроблена корпорацією Ensoniq у 1984 р. Вона передбачає запис звучання будь-якого інструменту (включаючи фортепіано, скрипку, гітару, флейту, трубу та барабан) та збереження оцифрованого звуку у спеціальній таблиці. Ця таблиця записується або в мікросхеми ROM або диск, а звукова плата може витягувати з таблиці оцифрований звук потрібного інструменту.

За допомогою таблично-хвильового синтезатора можна вибрати інструмент, змусити звучати єдино потрібну ноту і при необхідності змінити її частоту (тобто відтворити задану ноту з відповідної октави). У деяких адаптерах для покращення відтворення звуку використовується кілька зразків звучання того самого інструмента. Найвища нота на фортепіано відрізняється від найнижчою висотою тону, тому для природнішого звучання потрібно вибрати зразок, найбільш близький (по висоті тону) до ноти, що синтезується.

Таким чином, від розміру таблиці значною мірою залежить якість та різноманітність звуків, які здатний відтворювати синтезатор. Кращі якісні таблично-хвильові адаптери зазвичай мають на платі пам'ять обсягом кілька мегабайт для зберігання зразків. У деяких із них передбачена можливість підключення додаткових плат для встановлення додаткової пам'яті та запису зразків звуків до таблиці.

Підключення інших пристроїв до гнізда MIDI.Інтерфейс MIDI звукової плати також застосовується для підключення електронних інструментів, генераторів звуків, барабанів та інших пристроїв MIDI до комп'ютера. У результаті, файли MIDI відтворює високоякісний музичний синтезатор, а не синтезатор звукової плати, крім того, можна створювати власні файли MIDI, програваючи ноти на спеціальній клавіатурі. Правильно підібране програмне забезпечення дозволить створити симфонію на комп'ютері типу PC за допомогою запису нот кожного інструменту окремо у власний канал, а потім дозволити одночасне звучання всіх каналів. Багато професійних музикантів і композиторів використовують пристрої MIDI для створення музики прямо на комп'ютерах, тобто обходячись без традиційних інструментів.

Існують також плати MIDI з високою якістю звучання, які працюють у двонаправленому режимі, тобто відтворюють попередньо записані звукові доріжки під час запису нової доріжки до того ж файлу MIDI. Ще кілька років тому це можна було зробити лише у студії на професійному устаткуванні, яке коштувало сотні тисяч доларів.

Пристрої MIDI підключаються до двох круглих 5-контактних роз'ємів DIN звукового адаптера, які використовуються для вхідних (MIDI-IN) та вихідних (MIDI-OUT) сигналів. Багато пристроїв також мають порт MIDI-THRU, який передає сигнали, що надходять на вхід пристрою безпосередньо на його вихід, але звукові плати, як правило, такого порту не мають. Цікаво, що відповідно до стандарту MIDI дані передаються лише через контакти 1 та 3 роз'ємів. Контакт 2 екранований, а контакти 4 та 5 не використовуються.

Основна функція інтерфейсу MIDI звукової плати полягає в конвертуванні (перетворенні) потоку байтів (тобто паралельно надходять 8 біт) даних, що передаються системною шиною комп'ютера, у послідовний потік даних у форматі MIDI. Пристрої MIDI оснащені послідовними асинхронними портами, що працюють на швидкості 31,25 Кбод. При обміні даними відповідно до стандарту MIDI використовуються вісім інформаційних розрядів з одним стартовим та одним стоповим бітами, причому на послідовну передачу 1 байта витрачається 320 мс.

Відповідно до стандарту MIDI сигнали передаються по спеціальній неекранованій кручений парі, яка може мати максимальну довжину до 15 м (хоча більшість кабелів, що продаються, мають довжину 3 або 6 м). За допомогою шлейфу також можна підключити кілька пристроїв MIDI, щоб об'єднати їх можливості. Повна довжина ланцюжка MIDI пристроїв не обмежена, але довжина кожного окремого кабелю не повинна перевищувати 15 м.

У системах типу legacy-free немає роз'єму ігрового порту (MIDI-порту) – всі пристрої підключаються до шини типу USB.

Програмне забезпечення для MIDI пристроїв.З операційними системами Windows 9х, Windows Me та Windows 2000 поставляється програма "Універсальний програвач" (Media Player), яка відтворює файли MIDI. Для того, щоб використовувати всі можливості MIDI, рекомендується придбати спеціалізоване програмне забезпечення для виконання різних операцій редагування файлів MIDI (завдання темпу відтворення, вирізання, а також вставки різної попередньо записаної музики).

Ряд звукових плат поставляється разом із програмами, в яких передбачені можливості редагування файлів MIDI. Крім того, багато безкоштовних та умовно-безкоштовних інструментальних засобів (програми) вільно поширюються через Інтернет, але дійсно потужне програмне забезпечення, яке дозволяє створювати та редагувати файли MIDI, доводиться купувати окремо.

Запис.Практично на всіх звукових платах встановлюється вхідний роз'єм, підключивши мікрофон до якого можна записати свій голос. За допомогою програми «Звукозапис» (Sound Recorder) у системі Windows відтворюють, редагують та записують звуковий файл у спеціальному форматі .wav.

Нижче наведено основні способи використання файлів формату.wav:

  • супровід тих чи інших подій у Windows. Для цього слід скористатися опцією "Звук" (Sounds) панелі управління Windows;
  • додавання мовних коментарів за допомогою елементів керування Windows OLEта ActiveX до документів різного типу;
  • введення супровідного тексту у презентації, що створюються за допомогою PowerPoint, Freelance Graphics, Corel Presentations або ін.

З метою зменшення обсягу та подальшого використання в Інтернеті файли.wav перетворять на файли формату.mp3 або.wma.

Аудіокомпакт-диски.За допомогою накопичувача CD-ROMможна прослуховувати аудіокомпакт-диски не лише через акустичні системи, а й через навушники, паралельно працюючи з іншими програмами. До ряду звукових плат додаються програми для відтворення компакт-дисків, а через Інтернет такі програми найчастіше завантажують безкоштовно. У цих програмах зазвичай є візуальний дисплей, що імітує передню панель програвача компакт-дисків для керування за допомогою клавіатури або миші.

Звуковий змішувач (мікшер).За наявності кількох джерел звуку та лише однієї акустичної системи необхідно скористатися звуковим змішувачем. Більшість звукових плат оснащені вбудованим змішувачем звуку (мікшером), що дозволяє змішувати звук від аудіо-, MIDI- та WAV-джерел, лінійного входу та CD-програвача, відтворюючи його на єдиному лінійному виході. Зазвичай інтерфейси програм для змішування звуку на екрані виглядають так само, як стандартна панель звукового змішувача. Це дозволяє легко керувати гучністю кожного джерела.

Звукові плати: основні поняття та терміни.Щоб зрозуміти, що таке звукові плати, спочатку необхідно розібратися в термінах. Звук - це коливання (хвилі), що розповсюджуються в повітрі або іншому середовищі від джерела коливань у всіх напрямках. Коли хвилі досягають вуха, розташовані у ньому чутливі елементи сприймають вібрацію і чується звук.

Кожен звук характеризується частотою та інтенсивністю (гучністю).

Частота -це кількість звукових коливань за секунду; вона вимірюється у герцах (Гц). Один цикл (період) – це один рух джерела коливання (туди і назад). Чим вища частота, тим вищий тон.

Людське вухо сприймає лише невеликий діапазон частот. Дуже мало хто чує звуки нижче 16 Гц і вище 20 кГц (1 кГц = 1000 Гц). Частота звуку найнижчої ноти роялю дорівнює 27 Гц, а найвищої - трохи більше 4 кГц. Найвища звукова частота, яку можуть передати радіомовні FM-станції, становить 15 кГц.

Гучністьзвуку визначається амплітудою коливань, що залежить насамперед потужності джерела звуку. Наприклад, струна фортепіано за слабкого удару по клавіші звучить тихо, оскільки діапазон її коливань невеликий. Якщо вдарити по сильнішій клавіші, то амплітуда коливань струни збільшиться. Гучність звуку вимірюється у децибелах (дБ). Шурхіт листя, наприклад, має гучність близько 20 дБ, звичайний вуличний шум - близько 70 дБ, а близький удар грому - 120 дБ.

Оцінка якості звукового адаптера.Для оцінки якості звукового адаптера використовуються три параметри:

  • діапазон частот;
  • коефіцієнт нелінійних спотворень;
  • відношення сигнал/шум.

Частотна характеристика визначає той діапазон частот, в якому рівень амплітуд, що записуються і відтворюються, залишається постійним. Більшість звукових плат діапазон становить від 30 Гц до 20 кГц. Чим ширший цей діапазон, тим краща плата.

Коефіцієнт нелінійних спотворень характеризує нелінійність звукової плати, тобто відмінність реальної кривої частотної характеристикивід ідеальної прямої, чи, простіше кажучи, коефіцієнт характеризує чистоту відтворення звуку. Кожен нелінійний елемент є причиною спотворення. Чим менший цей коефіцієнт, тим вища якість звуку.

Високі значення відношення сигнал/шум (у децибелах) відповідають найкращій якості звуку.

Дискретизація.Якщо в комп'ютері встановлена ​​звукова плата, то можливий запис звуку в цифровій (називається також дискретної) формі, у цьому випадку комп'ютер використовується як записуючий пристрій. До складу звукової плати входить невелика мікросхема – аналого-цифровий перетворювач, або АЦП (Analog-to-Digital Converter – ADC), який при записі перетворює аналоговий сигнал на цифрову форму, зрозумілу комп'ютеру. Аналогічно при відтворенні цифроаналоговий перетворювач (Digital-to-Analog Converter - DAC) перетворює аудіозапис на звук, який здатні сприймати наші вуха.

Процес перетворення вихідного звукового сигналу на цифрову форму (рис. 5.5), в якій він і зберігається для подальшого відтворення, називається дискретизацією, або оцифровуванням. При цьому зберігаються миттєві значеннязвукового сигналу в певні моменти часу, звані вибір-


Рис. 5.5. Схема перетворення звукового сигналу на цифрову форму ками. Що частіше беруться вибірки, то точніше цифрова копія звуку відповідає оригіналу.

Першим стандартом МРС передбачався 8-розрядний звук. Розрядність звуку характеризує кількість біт, що використовуються цифрового подання кожної вибірки.

Вісім розрядів визначають 256 дискретних рівнів звукового сигналу, а якщо використовувати 16 біт, то їх кількість досягає 65536 (природно, якість звуку значно покращується). Для запису та відтворення мови достатньо 8-розрядного подання, а для музики потрібно 16 розрядів. Більшість старих плат підтримує лише 8-розрядне уявлення звуку, всі сучасні плати забезпечують 16 і більше розрядів.

Якість записуваного та відтворюваного звуку поряд з роздільною здатністю визначається частотою дискретизації (кількістю вибірок за секунду). Теоретично вона має бути в 2 рази вищою максимальної частотисигналу (тобто верхньої межі частот) плюс 10%-ний запас. Поріг чутності людського вуха – 20 кГц. Запис з компакт-диска відповідає частота 44,1 кГц.

Звук, дискретизований на частоті 11 кГц (11 000 вибірок за секунду), виходить більш розмитим, ніж звук, дискретизований на частоті 22 кГц. Об'єм дискового простору, необхідний для запису 16-розрядного звуку з частотою дискретизації 44,1 кГц протягом 1 хв, становитиме 10,5 Мб. При 8-розрядному поданні, монофонічному звучанні та частоті дискретизації 11 кГц необхідний дисковий простір скорочується у 16 ​​разів. Ці дані можна перевірити за допомогою програми «Звукозапис»: запишіть звуковий фрагмент із різними частотами дискретизації та подивіться на обсяг отриманих файлів.

Тривимірний звук.Одним із найбільш складних випробувань для звукових плат, що входять до складу ігрових систем, є виконання завдань, пов'язаних із обробкою тривимірного звуку. Існує кілька факторів, що ускладнюють вирішення таких задач:

  • різні стандарти позиціонування звуку;
  • апаратне та програмне забезпечення, що використовується для обробки тривимірного звуку;
  • проблеми, пов'язані із підтримкою інтерфейсу DirectX.

Позиційний звук.Позиціювання звуку є загальну технологіюдля всіх зЬ-звукових плат і включає налаштування певних параметрів, таких як реверберація або відображення звуку, вирівнювання (баланс) і вказівка ​​на розташування джерела звуку. Всі ці компоненти створюють ілюзію звуків, що лунають попереду, праворуч, ліворуч від користувача або за його спиною. Найбільш важливим елементом позиційного звуку є функція перетворення HRTF (Head Related Transfer Function), що визначає зміну сприйняття звуку в залежності від форми вуха та кута повороту голови слухача. Параметри цієї функції описують умови, за яких «реалістичний» звук сприймається зовсім інакше, коли голова слухача повернута у той чи інший бік. Використання акустичних систем з декількома колонками, що «оточують» користувача з усіх боків, а також складні звукові алгоритми, що доповнюють відтворюваний звук реверберацією, що керується, дозволяють зробити синтезований комп'ютером звук ще більш реалістичним.

Обробка тривимірного звуку.Важливим фактором якісного звучання є різні способи обробки тривимірного звуку в звукових платах, зокрема:

  • централізована (для обробки тривимірного звуку використовується центральний процесор, що призводить до зниження загальної швидкодії системи);
  • обробка звукової плати (3D-прискорення) за допомогою потужного цифрового оброблювача сигналів (DSP), що виконує обробку безпосередньо в звуковій платі.

Звукові плати, здійснюють централізовану обробку тривимірного звуку, можуть стати основною причиною зниження частоти зміни кадрів (числа анімаційних кадрів, що виводяться на екран за кожну секунду) при використанні функції тривимірного звуку. У звукових платах із вбудованим аудіопроцесором частота зміни кадрів при включенні або вимкненні тривимірного звуку майже не змінюється.

Як показує практика, середня частота зміни кадрів реалістичної комп'ютерної гри має бути не менше 30 кадрів/с (кадрів на секунду). За наявності швидкодіючого процесора, наприклад Pentium III 800 МГц, і будь-якої сучасної ЗЕ-звукової плати така частота досягається досить легко. При використанні повільнішого процесора, скажімо, Celeron 300А з робочою частотою 300 МГц, і плати з централізованою обробкою тривимірного звуку частота зміни кадрів стане набагато нижчою за 30 кадр./с. Щоб побачити, як впливає обробка тривимірного звуку на швидкість комп'ютерних ігор, передбачена функція відстеження частоти кадрів, вбудована більшість ігор. Частота зміни кадрів пов'язана безпосередньо з коефіцієнтом використання процесора; підвищення ресурсних вимог до процесора призведе до зменшення частоти зміни кадрів.

Технології тривимірного звуку та тривимірного відеозображення становлять найбільший інтерес насамперед для розробників комп'ютерних ігор, проте їх використання у комерційному середовищі також не за горами.

Підключення стереосистеми до звукової плати.Процес підключення стереосистеми до звукової плати полягає у їх приєднанні за допомогою кабелю. Якщо в звуковій платі є вихід для акустичної системи або навушників та лінійний стереовиход, то для підключення стереосистеми краще скористатися останнім. У цьому випадку виходить якісніший звук, оскільки на лінійний вихід сигнал надходить, минаючи ланцюга посилення, і тому практично не піддається спотворенням, а посилювати сигнал буде тільки стереосистема.

З'єднайте цей вихід із додатковим входом вашої стереосистеми. Якщо стереосистема не має допоміжних входів, скористайтеся іншими, наприклад, входом для програвача компакт-дисків. Стереопідсилювач і комп'ютер зовсім не обов'язково розташовувати поруч, тому довжина сполучного кабелюможе становити кілька метрів.

У ряді стереомагнітол та радіоприймачів на задній панелі передбачений роз'єм для підключення тюнера, магнітофона та програвача компакт-дисків. Використовуючи цей роз'єм, а також лінійні вхід та вихід звукової плати, можна прослуховувати звук, що надходить від комп'ютера, а також радіопередачі за допомогою акустичної стереосистеми.

Принципи оцифрування звуку

Цифровий звук- Це аналоговий звуковий сигнал, представлений за допомогою дискретних чисельних значень його амплітуди.

Оцифрування звуку- технологія поділеним тимчасовим кроком та наступного запису отриманих значень у чисельному вигляді.
Інша назва оцифрування звуку - аналогово-цифрове перетвореннязвуку.

Оцифрування звуку включає два процеси:

  • процес дискретизації (здійснення вибірки) сигналу за часом
  • процес квантування з амплітуди.

Дискретизація за часом

Процес дискретизації за часом - процес отримання значень сигналу, що перетворюється, з певним тимчасовим кроком; кроком дискретизації. Кількість вимірів величини сигналу, що здійснюються в одну секунду, називають частотою дискретизаціїабо частотою вибірки, або частотою семплювання(Від англ. "Sampling" - "вибірка"). Чим менший крок дискретизації, тим вище частота дискретизації і тим більш точне уявлення про сигнал буде отримано.
Це підтверджується теоремою Котельникова (у зарубіжній літературі трапляється як теорема Шеннона, Shannon). Відповідно до неї, аналоговий сигнал з обмеженим спектром точно описуємо дискретною послідовністю значень його амплітуди, якщо ці значення беруться з частотою, щонайменше вдвічі перевищує найвищу частоту спектра сигналу. Тобто, аналоговий сигнал , в якому найвища частота спектра дорівнює F m може бути точно представлений послідовністю дискретних значень амплітуди, якщо для частоти дискретизації F d виконується: F d >2F m .
Насправді це означає, що з того, щоб оцифрований сигнал містив інформацію про всьому діапазоні чутних частот вихідного аналогового сигналу (0 – 20 кГц) необхідно, щоб обране значення частоти дискретизації становило щонайменше 40 кГц. Кількість вимірів амплітуди за секунду називають частотою дискретизації(якщо крок дискретизації постійний).
Основна складність оцифрування полягає у неможливості записати виміряні значення сигналу з ідеальною точністю.

Лінійне (однорідне) квантування амплітуди

Відведемо для запису одного значення амплітуди сигналу пам'яті комп'ютера N біт. Отже, з допомогою одного N -бітного слова можна описати 2 N різних положень. Нехай амплітуда сигналу, що оцифровується, коливається в межах від -1 до 1 деяких умовних одиниць. Уявімо цей діапазон зміни амплітуди - динамічний діапазон сигналу - у вигляді 2 N -1 рівних проміжків, розділивши його на 2 N рівнів - квантів. Тепер для запису кожного окремого значення амплітуди його необхідно округлити до найближчого рівня квантування. Цей процес називається квантування по амплітуді. Квантування з амплітуди – процес заміни реальних значень амплітуди сигналу значеннями, наближеними до певної точності. Кожен із 2 N можливих рівнів називається рівнем квантування, а відстань між двома найближчими рівнями квантування називається кроком квантування. Якщо амплітудна шкала розбита на рівні лінійно, квантування називають лінійним (однорідним).
Точність округлення залежить від обраної кількості (2 N) рівнів квантування, яке, своєю чергою, залежить від кількості біт (N), відведених для запису значення амплітуди. Число N називають розрядністю квантування(маючи на увазі кількість розрядів, тобто біт, у кожному слові), а отримані в результаті округлення значень амплітуди числа – відліками чи семплами(Від англ. "sample" - "замір"). Приймається, що похибки квантування, результат квантування з розрядністю 16 біт, залишаються для слухача майже непомітними. Цей спосіб оцифрування сигналу - дискретизація сигналу в часі разом із методом однорідного квантування - називається імпульсно-кодовою модуляцією, ІКМ(англ. Pulse Code Modulation - PCM).
Оцифрований сигнал у вигляді набору послідовних значень амплітуди можна зберегти в пам'яті комп'ютера. У разі коли записуються абсолютні значення амплітуди, такий формат записуназивається PCM(Pulse Code Modulation). Стандартний аудіо компакт-диск (CD-DA), що застосовується з початку 80-х років 20-го століття, зберігає інформацію у форматі PCM із частотою дискретизації 44.1 кГц та розрядністю квантування 16 біт.

Інші способи оцифрування

Аналогово-цифрові перетворювачі (АЦП)

Вищеописаний процес оцифрування звуку виконується аналогово-цифровими перетворювачами (АЦП).
Це перетворення включає наступні операції:

  1. Обмеження смуги частот здійснюється за допомогою фільтра нижніх частот для придушення спектральних компонентів, частота яких перевищує половину частоти дискретизації.
  2. Дискретизацію в часі, тобто заміну безперервного аналогового сигналу послідовністю його значень дискретні моменти часу - відліків. Це завдання вирішується шляхом використання спеціальної схеми на вході АЦП - устрою вибірки-зберігання.
  3. Квантування за рівнем є заміною величини відліку сигналу найближчим значенням з набору фіксованих величин - рівнів квантування.
  4. Кодування або оцифрування, в результаті якого значення кожного квантованого відліку подається у вигляді числа, що відповідає порядковому номеру рівня квантування.

Робиться це так: безперервний аналоговий сигнал «ріжеться» на ділянки, з частотою дискретизації, виходить цифровий дискретний сигнал, який проходить процес квантування з певною розрядністю, а потім кодується, тобто замінюється послідовністю кодових символів. Для запису звуку у смузі частот 20-20 000 Гц, потрібна частота дискретизації від 44,1 і від (нині з'явилися АЦП і ЦАП з частотою дискретизації 192 і навіть 384 кГц). Для отримання якісного запису достатньо розрядності 16 біт, проте для розширення динамічного діапазону та підвищення якості звукозапису використовується розрядність 24 (рідше 32) біта.

Кодування оцифрованого звуку перед записом на носій

Для зберігання цифрового звуку існує багато різних способів. Оцифрований звук є набір значень амплітуди сигналу, взятих через певні проміжки часу.

Термінологія

  • кодер – програма (або пристрій), що реалізує певний алгоритм кодування даних (наприклад, архіватор, або кодер MP 3), яка як введення приймає вихідну інформацію, а як висновок повертає закодовану інформацію у певному форматі.
  • декодер – програма (або пристрій), що реалізує зворотне перетворення закодованого сигналу декодований.
  • кодек (від англ. codec - Coder / Decoder) - програмний або апаратний блок, призначений для кодування/декодування даних.

Найбільш поширені кодеки

  • MP3 – MPEG-1 Layer 3
  • ОGG – Ogg Vorbis
  • WMA – Windows Media Audio
  • MPC - MusePack
  • AAC – MPEG-2/4 AAC ( Advanced Audio Coding)
    • Стандарт MPEG-2 AAC
    • Стандарт MPEG-4 AAC

Деякі формати оцифрування звуку порівняно

Основна стаття: Порівняння звукових форматів

Назва формату Квантування, біт Частота дискретизації, кГц Число каналів Розмір потоку даних із диска, кбіт/с Ступінь стиснення/упаковки
16 44,1 2 1411,2 1:1 без втрат
Dolby Digital (AC3) 16-24 48 6 до 640 ~12:1 із втратами
DTS 20-24 48; 96 до 8 до 1536 ~3:1 із втратами
DVD-Audio 16; 20; 24 44,1; 48; 88,2; 96 6 6912 2:1 без втрат
DVD-Audio 16; 20; 24 176,4; 192 2 4608 2:1 без втрат
MP3 плаваючий до 48 2 до 320 ~11:1 із втратами
AAC плаваючий до 96 до 48 до 529 із втратами
AAC+ (SBR) плаваючий до 48 2 до 320 із втратами
Ogg Vorbis до 32 до 192 до 255 до 1000 із втратами
WMA до 24 до 96 до 8 до 768 2:1, є версія без втрат

Повний цикл перетворення звуку: від оцифрування до відтворення у споживача

Повний цикл перетворення звуку: від оцифрування до відтворення

З мінливою амплітудою та частотою. Чим вище амплітуда сигналу, тим голосніше сприймається людиною. Чим більша частота сигналу, тим вищий його тон.

Малюнок 1. Амплітуда коливань звукових хвиль

Частота звукової хвилівизначається кількістю коливань за одну секунду. Ця величина вимірюється в герцах (Гц, Hz).

Вухо людини сприймає звуки в діапазоні від $20$ Гц до $20$ кГц, цей діапазон називають звуковим. Кількість біт, яке при цьому відводиться на один звуковий сигнал, називають глибиною кодування звуку. У сучасних звукових картахзабезпечується $16-$, $32-$ або $64-$бітна глибина кодування звуку. У процесі кодування звукової інформації безперервний сигнал замінюється дискретним, тобто перетворюється на послідовність електричних імпульсів, що складаються з двійкових нулів та одиниць.

Частота дискретизації звуку

Одною з важливих характеристикПроцес кодування звуку є частота дискретизації, яка являє собою кількість вимірювань рівня сигналу за $1$ секунду:

  • один вимір за одну секунду відповідає частоті $1$ гігагерц (ГГц);
  • $1000$ вимірів за одну секунду відповідає частоті $1$ кілогерц (кГц) .

Визначення 2

Частота дискретизації звуку- це кількість вимірювань гучності за одну секунду.

Кількість вимірів може бути в діапазоні від $8$ кГц до $48$ кГц, причому перша величина відповідає частоті радіотрансляції, а друга - якості звучання музичних носіїв.

Зауваження 1

Чим вище частота і глибина дискретизації звуку, тим якісніше звучатиме оцифрований звук. Найнижча якість оцифрованого звуку, яка відповідає якості телефонного зв'язку, Виходить, коли частота дискретизації дорівнює 8000 разів на секунду, глибина дискретизації $ 8 $ бітів, що відповідає запису однієї звукової доріжки (режим «моно»). Саме висока якістьоцифрованого звуку, що відповідає якості аудіо-CD, досягається, коли частота дискретизації дорівнює $48000$ раз на секунду, глибина дискретизації $16$ бітів, що відповідає запису двох звукових доріжок (режим «стерео»).

Інформаційний обсяг звукового файлу

Слід зазначити, що вища якість цифрового звуку, то більше вписувалося інформаційний обсяг звукового файла .

Оцінимо інформаційний обсяг моноаудіофайлу ($V$), це можна зробити, використовуючи формулу:

$V = N \cdot f \cdot k$,

де $N$ - загальна тривалість звучання, що виражається в секундах,

$f$ - частота дискретизації (Гц),

$k$ - глибина кодування (біт).

Приклад 1

Наприклад, якщо тривалість звучання дорівнює $1$ хвилині і маємо середню якість звуку, при якому частота дискретизації $24$ кГц, а глибина кодування $16$ біт, то:

$ V = 60 \ cdot 24000 \ cdot 16 \ біт = 23040000 \ біт = 2880000 \ байт = 2812,5 \ Кбайт = 2,75 \ Мбайт.

При кодуванні стереозвуку процес дискретизації проводиться окремо та незалежно для лівого та правого каналів, що, відповідно, збільшує обсяг звукового файлуудвічі проти монозвуком.

Приклад 2

Наприклад, оцінимо інформаційний обсяг цифрового стереозвукового файлу, у якого тривалість звучання дорівнює $1$ секунді при середній якості звуку ($16$ бітів, $24000$ вимірювань за секунду). Для цього глибину кодування помножимо на кількість вимірів у $1$ секунду і помножимо на $2$ (стереозвук):

$ V = 16 \ біт \ cdot 24000 \ cdot 2 = 768000 \ біт = 96000 \ байт = 93,75 \ Кбайт.

Основні методи кодування звукової інформації

Існують різні методи кодування звукової інформації двійковим кодом, серед яких виділяють два основні напрямки: метод FMі метод Wave-Table.

Метод FM (Frequency Modulation) заснований на тому, що теоретично будь-який складний звук можна розкласти на послідовність найпростіших гармонійних сигналів різних частот, кожен з яких буде правильною синусоїдою, а це означає, що його можна описати кодом. Процес розкладання звукових сигналів у гармонійні ряди та їх подання у вигляді дискретних цифрових сигналів відбувається у спеціальних пристроях, які називають аналогово-цифрові перетворювачі (АЦП).

Рисунок 2. Перетворення звукового сигналу на дискретний сигнал

На малюнку 2а зображено звуковий сигнал на вході АЦП, а малюнку 2б зображено вже перетворений дискретний сигнал на виході АЦП.

Для зворотного перетворення при відтворенні звуку, представленого у вигляді числового коду, використовують цифро-аналогові перетворювачі (ЦАП). Процес перетворення звуку зображено на рис. 3. Цей метод кодування не дає хорошої якості звучання, але забезпечує компактний код.

Рисунок 3. Перетворення дискретного сигналу на звуковий сигнал

На малюнку 3а представлений дискретний сигнал, який маємо на вході ЦАП, але в малюнку 3б представлений звуковий сигнал на виході ЦАП.

Таблично-хвильовий метод (Wave-Table) заснований на тому, що в заздалегідь підготовлених таблицях зберігаються зразки звуків навколишнього світу, музичних інструментів і т. д. Числові коди виражають висоту тону, тривалість та інтенсивність звуку та інші параметри, що характеризують особливості звуку. Оскільки як зразки використовуються «реальні» звуки, якість звуку, отриманого в результаті синтезу, виходить дуже високою та наближається до якості звучання реальних музичних інструментів.

Приклади форматів звукових файлів

Звукові файли мають декілька форматів. Найбільш популярні їх MIDI, WAV, МРЗ.

Формат MIDI(Musical Instrument Digital Interface) спочатку був призначений для керування музичними інструментами. В даний час використовується в галузі електронних музичних інструментів та комп'ютерних модулів синтезу.

Формат аудіофайлу WAV(Waveform) представляє довільний звук у вигляді цифрового подання вихідного звукового коливання або звукової хвилі. Усі стандартні звуки Windowsмають розширення WAV.

Формат МРЗ(MPEG-1 Audio Layer 3) – один із цифрових форматів зберігання звукової інформації. Він забезпечує більш високу якість кодування.