Какие бывают звуки в мультимедиа. Звук как не последняя составляющая мультимедиа. Программное обеспечение по преобразованию цифровой записи

Какие бывают звуки в мультимедиа. Звук как не последняя составляющая мультимедиа. Программное обеспечение по преобразованию цифровой записи

Мультимедиа технологии

Цифровое аудио

  • Запись / воспроизведение звука с использованием

    • цифрового сигнала
    • импульсно-кодовой модуляции (Pulse Code Modulation)
  • Включает

    • Аналого-цифровой преобразователь (АЦП, ADC)
    • Цифро-аналоговый преобразователь (ЦАП, DAC)
    • Цифровой формат хранения
    • Цифровая обработка сигнала
    • Протоколы цифрового аудиовещания

Преимущества

  • Минимальные шумы и искажения

  • Копирование и хранение без потери качества

  • Широкие возможности цифровой обработки

  • Цифровая передача через сети

  • Простая интеграция с другими цифровыми медиа

  • Цифровой синтез звука


Представление звуковой волны в виде электрического сигнала


Частота, Гц, слышимый диапазон 20 – 20000 Гц

Ниже

Звуки в окружающем мире – сложные комбинации


Путь аудио-сигнала в цифровой системе


Оцифровка сигнала

  • 1. Дискретизация (Семплирование)

  • 2. Квантование

  • 3. Преобразование в определенный формат (+сжатие)


Дискретизация


Квантование


Квантование


ИКМ (PCM)


Разновидности ИКМ

  • Дифференциальная (или дельта ) импульсно-кодовая модуляция (ДИКМ ) кодирует сигнал в виде разности между текущим и предыдущим значением. Для звуковых данных такой тип модуляции уменьшает требуемое количество бит на отсчёт примерно на 25 %.

  • Адаптивная ДИКМ (АДИКМ, ADPCM ) является разновидностью ДИКМ, которая изменяет уровень шага квантования, что позволяет ещё больше уменьшить требования к полосе пропускания при заданном соотношении сигнала и шума.


Стандарты цифрового радиовещания

  • Digital Audio Broadcasting (DAB)

  • HD Radio

  • Digital Radio Mondiale (DRM)

  • In-band on-channel (IBOC)


Технологии хранения

  • Digital Audio Tape (DAT)

    • 32 kHz / 12 bits,
    • 32 kHz, 44.1 kHz, 48 kHz / 16 bits.
    • 96 kHz / 24 bits
  • Compact Disc (CD)

    • 44.1 kHz /16 bits
  • Hard disk recorder

  • DVD Audio

    • 192 kHz / 24-bits
  • MiniDisc

    • Алгоритм сжатия ATRAC
  • Super Audio CD

    • 1 бит DSD-модуляция / 2,8224 МГц (44.1 кГц х 64)

Технологии хранения

  • + различные форматы файлов

    • Без сжатия
    • WAV, AIFF, AU
    • Сжатие без потерь
    • FLAC, Monkey"s Audio (filename extension APE), WavPack (filename extension WV), TTA, ATRAC Advanced Lossless, Apple Lossless (filename extension m4a), MPEG-4 SLS, MPEG-4 ALS, MPEG-4 DST, Windows Media Audio Lossless (WMA Lossless), and Shorten (SHN).
    • Сжатие с потерями
    • MP3, Vorbis, Musepack, AAC, ATRAC and Windows Media Audio Lossy (WMA lossy)

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Введение

Multimedia - это подхваченный всеми термин, обозначающий интерактивный инструмент для работы с графикой, анимацией, звуком и видео. Мультимедиа привносит блеск в презентации, живопись и игры, и, кроме того, доставляет удовольствие при обучении. Она превращает компьютер из настольной системы с клавиатурой и монитором в некий «космический аппарат», укомплектованный динамиками, микрофоном, наушниками, джойстиками и компакт-дисками.

1. Что же такое мультимедиа?

программный мультимедиа графика звук

Мультимедиа позволяет работать на компьютере со всеми видами информации, а не только с текстом или обычными рисунками. Мультимедиа - это цифровая информация, имеющая более широкие возможности, чем другие ее виды.

ь Поскольку звуковая и графическая информация записывается в цифровой форме, она может копироваться без потери качества.

ь Цифровая информация может сжиматься до минимума для хранения.

ь Можно записать огромное количество информации на CD-ROM, а сам CD-ROM занимает очень мало места.

ь Интерактивные компьютерные программы, использующие цифровые медиасистемы, являются отличными средствами обучения.

Если вы покупаете компьютер со встроенными средствами мультимедиа или устанавливаете на свой компьютер, то вам необходимо разобраться в многообразии средств мультимедиа, а также познакомиться с существующими способами записи и воспроизведения. Существуют два основных вида систем мультимедиа:

o Системы воспроизведения . Эти системы, как правило включают многоскоростной дисковод CD-ROM, звуковую карту, динамики и видеосистему с относительно высоким разрешением. Не помешает также наличие карты декомпрессии, работающей с цифровой информацией.

o Авторские системы . (системы, используемые для создания файлов систем мультимедиа). Авторские системы, как правило, включают такие компоненты, как микрофоны и видеокамеры для записи звука и съемки видеоизображений. Они также высокоскоростные, емкие жесткие диски, способные хранить и обслуживать большие объемы информации, требующиеся для цифрового видео.

В 80-х годах персональный компьютер состоял из микропроцессора (CPU), клавиатуры, монитора, дисковода и принтера. Все, что вы могли сделать на компьютере, - это работать с текстом. Люди тратили очень много времени, оформляя письма, производя финансовые расчеты и просматривая базы данных.

Но теперь, когда появились такие графические пользовательские интерфейсы, как Windows95/98 (SE)/МЕ/NT/2 k., и значительно более мощные персональные компьютеры, начали появляться приложения, предоставляющие возможность использовать анимационные эффекты, звук и видео. В конце 1980 г. люди начали сочинять музыку на компьютере, комбинируя анимацию и звук, создавая захватывающие мультимедиа-презентации со звуком и движущимися картинками. Оборудование, однако, было дорогим, а результаты часто не оправдывали ожиданий. Windows3.1 и DOS не имели достаточно ресурсов для поддержки систем мультимедиа, поэтому картинки на экране двигались очень медленно.

2. Мультимедиа и Windows 95/9 8 (SE)/МЕ/NT/2k /XP

Благодаря Windows все преобразовалось. Она поддерживает средства значительно улучшающие работу с мультимедиа.

ь Windows95/98 (SE)/МЕ/NT/2k. является 32-разрядной, многозадачной, многопоточной операционной системой. Это означает, что Windows поддерживает выполнение нескольких задач одновременно, проигрывание мультимедиа-презентаций и работу пользователей в диалоговом режиме.

ь При установке Windows автоматически определяет конфигурацию мультимедиа устройств.

ь Приложения Windows поддерживают мультимедиа. Вы можете создавать составные документы, т.е. документы, включающие звук , видео, графику, диаграммы, картинки и другие элементы различных приложений.

ь Windows поддерживает форматы компакт-дисков Sony/Philips CD+ и Kodak PhotoCD, а также позволяет легко запускать программы и проигрывать диски с устройства CD-ROM.

ь Видеостандарт Windows широко поддерживается в компьютерной индустрии. Разработчики мультимедиа-продуктов могут спокойно распространять свою продукцию, зная, что она будет работать под Windows.

ь Мультимедиа-продукты, разработанные для Windows, как правило, являются продуктами высокого качества, так как Windows поддерживает большие видеоокна и 32-разрядная архитектура Windows улучшает прохождение данных.

ь Windows поддерживает интерфейс Sony VISCA. Это означает, что в приложениях вы можете использовать так называемые VCR-кнопки (VCR - английская аббревиатура от Video Cassette Recorder - видеомагнитофон, т.е. кнопки, функционально аналогичные кнопкам перемотки, воспроизведения и другим на аудио- и видеовоспроизводящих устройствах) при проигрывании лазерных дисков.

ь Качество игр в Windows значительно улучшено за счет нового программного графического интерфейса.

ь Windows поддерживает множество различных стандартных промышленных звуковых и видеоустройств компрессии информации при ее записи в файл, а также декомпрессии при воспроизведении (так называемых кодек-устройств). Кодек сокращает объем мультимедиа-файлов и позволяет распространять их в различных форматах.

Наиболее важным средством мультимедиа в последние несколько лет стало видео. Видео вмещает невероятное количество информации, которая может быть сжата перед перенесением ее с одного устройства на другое, например, из видеокамеры на жесткий диск через шину компьютера. Применение технологии сжатия аудио- и видеоинформации позволяет расширить рынок средств мультимедиа.

3. Системы мультимедиа

Дополнительными периферийными устройствами к компьютеру в середине 80-х годов были дисководы, сканеры, принтеры и коммуникационные средства типа модем. В 90-х годах появляется звуковые карты , видео-карты, дисководы CD-ROM и высокоскоростные коммуникационные средства, благодаря которым теперь вы можете связаться с информационной службой, передающей вам мультимедиа по проводам.

Ниже перечислены минимальные требования для запуска мультимедиа под Windows.

ь Процессор Intel 80486 (Для цифровых видеоприложений рекомендуется Pentium).

ь Шина PCI для передачи данных для контроллера диска и видеокарты.

ь Жесткий диск большого объем (от 300 Мбайт). Для высококачественных цифровых видеосистем требуется гигабайты памяти.

ь CD-ROM со скоростью не ниже 4-х с регулировкой звука на передней панели.

ь Звуковая карта , обеспечивающая частоты квантования 11,025; 22,05 и 44,1-кГц для стерео звучания. Также требуется многоголосные и многотембровые устройства, способные воспринимать на входе несколько источников, а на выходе представить стереозвучание.

ь Видеоаппаратуру, поддерживающую высокие разрешения монитора. Microsoft рекомендует для лучшего качества представления видео использовать VESA или PCI видеокарты. В последнее время стали популярны AGP адаптеры.

ь IBM-совместимый аналоговый порт джойстика.

ь MIDI-порт, поддерживающий установленные стандарты для ввода, вывода и передачи данных. Некоторые звуковые карты содержат MIDI-синтезаторы, но в общем случае вы подсоединяетесь к внешнему MIDI-синтезатору, по внешнему виду напоминающему клавиатуру.

MIDI (Musical Instrument Digital Interface - интерфейс цифровых музыкальных инструментов) является стандартом для записи нот и сопутствующей информации, связанной с проигрыванием музыки на электронном музыкальном устройстве. Реальный звук при этом не записывается.

Вышеперечисленные компоненты необходимы для воспроизведения и записи средствами мультимедиа. Однако, если вы хотите сами создавать мультимедиа-клипы, то вам могут потребоваться дополнительная аппаратура.

4. Типы и стандарты мультимедиа

Мультимедиа-информация храниться в виде файлов специального формата, содержащих звук, видеоизображения, или в файлах формата MIDI.

Аудиомедиа (звуковая медиа) хранится, в основном, в двух форматах, WAV и MIDI. Большинство WAV-файлов требует много дискового пространства, но они могут воспроизводиться с помощью любой звуковой карты. MIDI-файлы занимают значительно меньше места на диске, но могут проигрываться только на MIDI-совместимых устройствах. В настоящее время почти все карты способны воспроизводить MIDI-файлы.

Визуальное медиа - это анимационные файлы и видеофайлы.

Анимация. В Windows, если у вас есть соответствующее приложение, вы можете создавать изображения, перемещающиеся по экрану. Не существует стандартного формата анимационного файла, однако многие разработчики одновременно развивают производство как анимационных средств, так и воспроизводящей аппаратуры. Анимация может сопровождаться звуковыми файлами разных форматов.

Видео. Video for Windows - это видеостандарт для Windows. Вы можете записать фильм с видеокамеры или лазерного диска на жесткий диск компьютера и сохранить его как файл в формате AVI либо MPG. Сжатие требуется лишь для высококачественного видео и его эффективного хранения.

5. О звуковой мультимедиа

Приложения для записи и воспроизведения звука были одними из первых известных приложений мультимедиа для персонального компьютера. Добавив звуковую карту, вы сможете записывать сообщение, переданное голосом, сохранять его как файл на диске, переносить его на другой компьютер, где оно также может быть воспроизведено. Вы также можете записывать музыку и звук для компьютерных презентаций.

Существует два способа звукозаписи:

· Цифровая запись , когда реальные звуковые волны записываются и конвертируются в цифровые данные.

· MIDI апись , вообще говоря, является не реальным звуком, а записью нажатий на клавиши или другой операций, выполняемых на синтезаторах или MIDI-совместимых электромузыкальных устройствах. MIDI-файл является электронным эквивалентом игры на фортепиано.

6. Цифровая запись

Звуковая плата преобразует звук на выходе в цифровую информацию путем измерения звука тысячи раз в секунду. Цифровой звук хранится в файлах с расширением WAV. При записи звука аналого-цифровой преобразователь конвертирует звук в цифровые данные. При воспроизведении звука цифроаналоговый преобразователь конвертирует цифровые данные в аналог звуковой волны.

Звук представляет собой вибрации, которые формируют волну с соответствующими амплитудой и периодом, как это показано на рис. 1. Амплитуда выражает высоту волны, или громкость звука. Период - это расстояние между двумя звуковыми волнами. Наконец, частота показывает количество периодов в секунду и измеряется в герцах. Например, сто периодов в секунду - это 100 Гц. Человек может воспринимать звук с частотой от 20 до 20000 Гц, и вся выпускаемая звуковоспроизводящая и звукозаписывающая аппаратура рассчитана на этот диапазон частот.

Измерение звуковой волны

Для того чтобы записать звук и хранить его на цифровом устройстве типа вашего компьютера, производится квантование звука, т.е. разбиение звуковой волны на определенные интервалы по времени. Звуковая волна, показанная на рис. 2, была разбита на 16 интервалов. Если предположить, что продолжительность звуковой волны равна одной секунде, то ее частота квантования - 16 Гц.

Квантование волны при частоте квантования 16 Гц

Как правило, такая низкая частота квантования не используется. Даже цифровой звук с частотой квантования 100 или 1000 Гц не будет распознаваться при воспроизведении. Это происходит потому, что цифровое представление волны в данном случае не сглажено. Фильтрующая аппаратура сглаживает волну, однако наилучшим способом получения качественной цифровой записи является повышение частоты квантования. Следует учесть, что при этом увеличивается объем хранящихся данных, что потребует больше памяти на диске.

Стандартам мультимедиа соответствуют три типа частоты квантования: 11,025; 22,05; 44,1 кГц. Частота квантования зависит от записываемого звука: 11,025 кГц подходит для записи голоса, но для получения высококачественной записи требуется частота квантования 44,1 или 48 кГц. Однако повышение частоты квантования приводит к увеличению размера файла и требуемого пространства на диске для его хранения. Формула для расчета дискового пространства будет приведена ниже, но прежде необходимо разобраться с одной переменной - числом разрядов (бит), используемым для хранения информации о квантовании.

Каждый интервал содержит информацию о малом временном сегменте звука. Количество разрядов для записи каждого интервала определяет точность аппроксимации звуковой волны, однако увеличивает размер файла, в котором хранится цифровой звук. 4-разрядное разбиение на интервалы обеспечивает деление амплитуды звуковой волны по вертикали на 16 уровней, а 8-разрядное разбиение - на 256 уровней. Для высококачественной записи требуется 16-разрядное разбиение на интервалы по амплитуде, которое определяет 65536 уровней амплитуды.

Предшествующее обсуждение касалось сглаженной звуковой волны, но реальная волна не сглажена - она состоит из многих различных частот, которые вместе создают тембр звука. Тембр - это уникальный звук, присущий инструменту. Например, колебания струны и резонатор определяют звучание скрипки (уникальное звучание скрипки Страдивари является результатом добавления ценных веществ в ее полировку). Скрипка производит целый комплекс звуковых волн, как это показано на рис. 3.

Теперь вы видите важность повышения частоты квантования и разрядности звуковой платы при записи звука. Вам необходимо знать не только амплитуду каждого выбранного интервала, но и все, что происходит с волной за единицу времени. Повышение частоты квантования и разрядности звуковой платы обеспечивает качественную запись звука, однако, следует помнить, что это приводит к значительному увеличению дискового пространства, необходимого для хранения записываемого звука. К счастью, если вы записываете голос, то нет необходимости использовать большую частоту квантования и разрядность звуковой платы.

Реальные звуковые волны имеют весьма сложную форму и для получения их высококачественного цифрового представления требуется высокая частота квантования

Ниже приводится формула расчета требуемого дискового пространства для хранения цифрового звука:

на секунду

В табл. 1. приведено требуемое пространство на диске для хранения записи звука продолжительностью одна минута для каждой частоты квантования при разрядности 8 бит. Первая строка в таблице соответствует низкокачественной записи голоса, а последняя строка - стандартам, установленным для цифровых аудиокомпакт-дисков.

Требования по хранению звуковых файлов

Разрядность

Частота квантования

Байт для хранения

0,66 Мбайт/мин

1,32 Мбайт/мин

2,646 Мбайт/мин

5,292 Мбайт/мин

Заметим, что высокая частота квантования и разрядность не требуются, если звук был записан и проигрывается на оборудовании более низкого качества. Например, карманный микрофон записывает звук гораздо более низкого качества, чем запись при частоте квантования 44 кГц. Если у вас высококачественная запись, то для ее воспроизведения соответственно требуется аппаратура высокого качетва.

7. Звук и типы звуковых файлов

Звук - это физическое природное явление, распространяющееся посредством колебаний воздуха и, следовательно, можно сказать, что мы имеем дело только с волновыми характеристиками. Задачей преобразования звука в электронный вид является повторение всех его этих самых волновых характеристик. Но электронный сигнал не является аналоговым, и может записываться посредством коротких дискретных значений. Пусть они имеют малый интервал между собой и практически неощутимы, на первый взгляд для человеческого уха, но мы должны всегда иметь в виду, что имеем дело только с эмуляцией природного явления именуемого звуком.
Такая запись именуется импульсно-кодовой модуляцией и являет собой последовательную запись дискретных значений. Разрядность устройства, исчисляемая в битах, говорит о том сколькими значениями одновременно в одном записанном дискрете, берется звук. Чем больше разрядность, тем больше звук соответствует оригиналу.

Любой звуковой файл можно представить, чтобы Вам было наиболее понятно, как базу данных. Она имеет свою структуру, о параметрах которой указывается обычно вначале файла. Потом идет структурированный список значений по определенным полям. Иногда вместо значений стоят формулы, позволяющие уменьшать размер файла. Данные файлы могут читать только специализированные программы, в которые заложен блок чтения.

РСМ расшифровывается как pulse code modulation, что и является в переводе как импульсно-кодовая. Файлы именно с таким расширением встречаются довольно редко (я встречал только в программе 3D Audio). Но РСМ является основополагающей для всех звуковых файлов. Я бы не сказал, что это очень экономный метод для хранения данных на диске, но думаю, что от этого уже никогда точно не уйдешь, причем объемы современных винчестеров уже позволяют не обращать внимания на пару десятков мегабайт.

Изыскания по поводу экономного хранения звуковых данных на диске. Если Вы встречаете данную аббревиатуру, то знайте, что имеете дело с разностным РСМ. В основе данного метода лежит та вполне оправданная идея, что вычисления гораздо более громоздки по сравнению с тем, что можно просто указать значения разности.

Адаптивный DPCM. Согласитесь, что при указании просто значений разности может возникнуть проблема с тем, что есть очень маленькие и очень большие значения. В результате, какие бы супер-точные измерения не были все равно имеет место искажение действительности. Поэтому в адаптивном методе добавлен коэффициэнт масштабируемости.

Самое простое хранилище дискретных даннных. Я бы сказал прямое. Один из типов файлов семейства RIFF. Помимо обычных дискретных значений, битности, количества каналов и значений уровней громкости в wav может быть указано еще множество параметров, о которых Вы, скорее всего, и не подозревали - это: метки позиций для синхронизации, общее количество дискретных значений, порядок воспроизведения различных частей звукового файла, а также есть место для того, чтобы Вы смогли разместить там текстовую информацию.

Resource Interchange File Format. Уникальная система хранения любых структурированных данных.

Эта технология хранения данных проистекает от Amiga-систем. Interchange File Format. Почти то же, что и RIFF, только имеются некоторые нюансы. Начнем с того, что система Amiga - одна из первых, в которой стали задумываться о программно-сэмплерной эмуляции музыкальных инструментов. В результате, в данном файле звук делится на две части: то, что должно звучать вначале и элемент того, что идет за началом. В результате, звучит начало один раз, за тем повторяется второй кусок столько раз, сколько Вам нужно и нота может звучать бесконечно долго.

Файл хранит в себе короткий образец звука, который потом можно использовать в качестве шаблона для инструмента. Проще говоря, прошитый в синтезатор сэмпл.

AIF или AIFF

Audio Interchange File Format. Данный формат распространен в системах Apple Macintosh и Silicon Graphics. Заключает в себе сочетание MOD и WAV.

AIFC или AIFF

Тот же AIFF, только с заданными параметрами сжатия (компрессии).

Опять же та же гонка за экономией места. Структура файла намного проще, чем в wav, но там указан метод кодирования данных. Файлы очень мало «весят», за счет чего получили довольно широкое распространение в Интернете. Чаще всего Вы можете встретить параметры?-Law 8 кГц - моно. Но есть и 16-битные стерео-файлы с частотами 22050 и 44100 Гц. Это звуковой формат предназначен для работы со звуком в рабочих системах SUN, Linux и FreeBCD.

Файл, хранящий в себе сообщения MIDI-системе, установленной на Вашем компьютере или в устройстве.

Самый скандальный формат за последнее время. Многие для объяснения параметров сжатия, которые в нем применяют, сравнивают его с jpeg для изображений. Там очень много наворотов в вычислениях, чего и не перечислишь, но коэффициент сжатия в 10-12 раз сказали о себе сами. Если говорят, что там есть качество, то могу сказать, что там его немного. Специалисты говорят о контурности звука как о самом большом недостатке данного формата. Действительно, если сравнивать музыку с изображением, то смысл остался, а мелкие нюансы ушли. Качество МР3 до сих пор вызывает много споров, но для «обычных немузыкальных» людей потери не ощутимы явно.

Хорошая альтернатива МР3, разве что менее распространенная. Есть и свои недостатки. Закодировать файл в VQF - процесс гораздо более долгий. К тому же, очень мало бесплатных программ, позволяющих работать с данным форматом файлов, что, собственно, и сказалось на его распространении.

Восьмибитный моно-формат от семейства SoundBlaster. Можно встретить в большом количестве старых программ, использующих звук (не музыкальных).

НСОМ

То же самое, что и VOC (восемь бит, моно), но только для Apple Macintosh.

Стандартный формат U-Law. 8 кГц, 8 бит, моно.

Real Audio или потоковая передача аудиоданных. Довольно распространенная система передачи звука в реальном времени через Интернет. Скорость передачи порядка 1 Кб в секунду. Полученный звук обладает следующими параметрами: 8 или 16 бит и 8 или 11 кГц.

Бывает двух видов. Один - это тот же AU для SUN и NeXT. Другой - это 8-мибитный моно-файл для РС и Маков с различной частотой дискретизации.

Существуют и другие типы звуковых файлов, но это, скорее всего, файлы различных программ для создания и обработки музыки. В основном, такие файлы читаются только той программой, в которой они были созданы.

8. Компрессия аудиоданных

Мультимедиа-информация состоит из огромного количества цифровых данных, которые необходимо хранить в сжатом виде. Windows включает в себя средства управления компрессией аудио- и видеоизображений, которые работают с одним или более модулями декомпрессии и называются кодеками (от Компрессия и ДЕКомпрессия). Большое количество программных кодеков поставляются с Windows. Когда вы записываете или воспроизводите звук или видеофайл, Windows автоматически использует кодек.

Многие звуковые и видеокарты имеют встроенные аппаратные кодеки. Windows сначала использует аппаратный кодек, поскольку он быстрее и не очень нагружает процессор. Если аппаратный кодек отсутствует, то Windows применяет программные кодеки. Если она не смогла найти кодек, на экране появится сообщение об ошибке, поскольку сжатый файл невозможно распаковать.

Программа управления компрессией аудиоданных (Audio Compression Manager, ACM) в Windows использует следующие кодеки для компрессии / декомпрессии аудиоданных.

· TrueSpeech Сodec . Кодек, ориентированный на голос, разработанный компанией DSP Group. Используйте этот кодек только при сжатии и передачи по сетям или телефонным линиям файлов, содержащих запись голоса. TrueSpeech производит компрессию данных не в реальном времени, в свою очередь, декомпрессия производится в реальном масштабе времени.

· Microsoft GSM Audio Codec . Кодек, производящий компрессию данных монохромных звуковых записей низкого качества в реальном масштабе времени. Используйте этот кодек при записи голосовых сообщений, вставленных в сообщения электронной почты (e-mail). Для записи голосовых сообщений вы можете использовать приложение Фонограф.

· Microsoft CCITT G.711 A-Law and U-Law Codec . Этот кодек обеспечивает совместимость телефонных стандартов в Европе и северной Америке. Он обеспечивает коэффициент сжатия данных 2:1.

· Microsoft ADPCM Codec . Этот кодек обеспечивает компрессию как в реальном, так и не в реальном масштабе времени, последняя используется пользователями авторских систем мультимедиа. Аудиофайлы лучше генерируются кодеком не в реальном времени масштабе времени.

· IMA ADPCM Codec . Этот кодек был рекомендован Interactive Multimedia Association для использования на различных платформах мультимедиа. Он осуществляет компрессию в реальном масштабе времени и подобен кодеку Microsoft ADPCM.

· Microsoft PCM converter . Этот конвертер позволяет проигрывать 16-разрядный звук на 8-разрядной звуковой карте. Вы также можете использовать этот кодек в случае, когда необходимо поддерживать частоту квантования 1 МГц для карты, поддерживающую другую частоту квантования.

9. Программное обеспечение по преобразованию цифровой записи

Существует множество программ-кодеков, разработанных специально для преобразований файлов с цифровой записью. Цель каждой такой программы одна - сжатие звукового файла с наименьшей потерей качества и наибольшей степенью сжатия. У каждой из них свои плюсы и минусы: у одних качество сжатия высоко, однако скорость этого сжатия желает лучшего, другие моментально кодируют но с потерей качества, кто же захочет слушать файл с любимой музыкальной композицией, которая кряхтит, свистит и шуршит как старая дедова пластинка.

Наиболее популярные программы-кодеки приведены ниже.

Voice

Программное обеспечение состоит из четырёх модулей, которые могут работать как на одном компьютере, так и на разных.
Первый модуль, работающий в среде Windows, отвечает за работу с внешней аппаратурой, производит непосредственно запись с телефонной (радио) линии и воспроизведение в телефонную (радио) линию звуковых файлов.

Диалоговое окно программы Voice

Второй программный модуль, отвечающий за сжатие звуковых файлов, использует в свой работе стандартные алгоритмы сжатия Wav-файлов. Используемые алгоритмы сжатия позволяют упаковывать поступающие сообщения до уровня 4Кбайт - 600 байт за секунду. Алгоритмы сжатия можно оперативно изменять в зависимости от требуемой степени сжатия и качества звучания.

Третий программный модуль отвечает за ведение базы данных (добавление разговоров в базу данных и автоматическое удаление из неё по мере их старения). В базе данных информация хранится в течение заданного отрезка времени, после чего она либо архивируется, либо автоматически удаляется.

Последний, четвёртый программный модуль предназначен для работы с базой данных: поиск разговоров, их прослушивание, перезапись и ручное удаление.

Все модули работают в 32х разрядных средах Windows. Всё программное обеспечение одновременно может работать как друг с другом, так и с другими Windows-приложениями.

Mpeg Encoder

Диалоговое окно программы mpeg Encoder

Один недостаток mpeg Encoder - уходит много времени на сжатие файла с цифровой записью. На обработку звукового файла продолжительностью около 3-5 минут уходит порядка 25-40 минут. Но ожидания стоят того - качество не отличается от оригинала.

Программа состоит только из одного диалогового окна, что упрощает работу. Не требуется каких-либо дополнительных знаний в области преобразований цифровой информации и т.п., вы указываете путь к исходящему файлу в поле SOURCE и в поле TARGET конечную папку, в которой будет находиться сжатый файл в формате mp3 (по умолчанию). Задаете частоту квантования, параметры качества - стерео или моно и… вперед! Смело жмем кнопку Encode.

LameBatch

LameBatch - это незатейливая оболочка, написанная с целью упрощения работы с командными строками mp3-кодеров, называющегося LAME от Mark Taylor и компании. Оболочки основана на простом ядре.

Диалоговое окно с параметрами программы LameBatch

Содержит всего две вкладки «Files» и «Settings», в последней вы указываете все нужные вам параметры сжатия.

Основные фишки:

ь Только одно окошко (без всплывающих окон непосредственно кодера).

ь Индивидуальные настройки кодирования каждого файла.

ь Возможность их изменения для других файлов во время кодирования одного.

ь Всяческая информация о ходе процесса.

ь Проверка файлов на допустимость формата.

ь Различные варианты сортировки очереди.

ь Незатейливое прописывание тэгов.

ь Возможность отложить работу на неопределенный срок.

ь Различная настройка папки для результатов.

ь Проверка перезаписи и доступного места.

ь Поддержка Drag and drop.

ь Встраивается в контекстное меню Explorer.

ь Выключение машины по окончании процедуры.

Последняя версия на сегодня это LameBatch 0.99c и выпущена 25 октября. При тестировании использовались LAME 3.35. LameBatch распространяется как халява, поэтому - никаких гарантий.

Список программ и их достоинства, и недостатки можно перечислять очень долго. Программ-кодеков в последнее время разработано много, стоит подключиться к сети Internet, набрать в строке поискового портала «programs&encode&multimedia» как сразу получишь список программ для обработки звуковых и не только файлов.

Заключение

Порассуждаем немного о сжатии звуковых файлов. Для чего это нужно, особо говорить не стоит, упомяну лишь то, что широко распространенные способы сжатия цифровых музыкальных данных в 11-14 раз позволили неимоверно толкнуть вперед программную и «железную» музыкальную индустрию, не говоря уже о том, что с качественной музыкой теперь в Internet проблем, в общем-то, нет. Найти можно практически любую композицию. (На самом деле, конечно же, далеко не любую. Попробуйте поискать что-нибудь нетривиальное - Билли Маккензи, например, или Берни Марсдена, вряд ли у вас что-нибудь получится. Найти можно преимущественно популярную музыку или классику жанра, да и то далеко не всю.

С момента начала своего бурного развития (около двух лет назад) открытая технология сжатия музыкальной (звуковой) информации качественных изменений технологии сжатия не претерпела. Другими словами, многочисленным поклонникам музыки приходится мириться с достаточно емкими файлами, т.к. никаких сдвигов на этом фронте не намечается. Сегодняшние пределы для сжатия без значительной потери качества составляют около 11-12 раз от оригинального размера музыкального файла. Как известно, на компакт-диске со стандартной частотой оцифровки 44 100 Гц (стерео, два байта на одно амплитудное значение) может уместиться до 74 минут звука - примерно по 10 Мбайт на минуту.

При средней длительности музыкальной композиции 4 минуты имеем чистого (несжатого) звука 40 Мбайт. Много. Очень много для Internet. Имея модем со скоростью 33,6 Кбайт/с и полный канал для скачивания (т.е. в идеале - 3,5 Кбайт/с) 40 Мбайт мы получим только через 4-5 часов (обычно эта цифра в 1,5-2 раза больше).

Применяя сжатие музыкального файла без потери его основных характеристик (стерео, частота дискретизации при оцифровке 44 100 Гц, 2 байта на выборку амплитуды), можно добиться уменьшения размера в 11-12 раз. Так что вместо 40 Мбайт получится всего 3,8-3,9 Мбайт. Это уже вполне приемлемо. Можно сжимать еще больше, но тогда ощутимо проигрываем в качестве: отличия от оригинала становятся слышимыми даже не меломану. Называемые здесь пределы - 11 или 12 раз - это уже подобранные и проверенные критерии качество / размер за всю недолгую историю использования программ-сжимателей звуковых файлов.

Литература

1. Том Шелдон. «Windows 95 проще простого» Диалектика. Киев. 1996 г.

2. А. Чижов. «Napster - панацея для MP3-меломана» Фантазия. 1999-2000 г.

Размещено на Allbest.ru

...

Подобные документы

    Понятие мультимедиа как интерактивных систем, обеспечивающих работу с неподвижными изображениями и движущимся видео, анимированной компьютерной графикой, текстом, речью и качественным звуком. Области применения сканера, веб-камеры, лазерной клавиатуры.

    контрольная работа , добавлен 12.01.2012

    Форматы и характеристики цифрового видео: частота кадра, экранное разрешение, глубина цвета, качество изображения. Типовый технологический процесс производства видеокомпонентов для мультимедиа продуктов с использованием программы miroVIDEO Capture.

    лекция , добавлен 30.04.2009

    Описания интерактивных систем, обеспечивающих работу с изображениями, движущимся видео и анимированной компьютерной графикой. Определение основных мультимедийных ресурсов сети Интернет. Преимущества и недостатки применения мультимедиа в образовании.

    курсовая работа , добавлен 17.01.2015

    Области применения мультимедиа. Основные носители и категории мультимедиа-продуктов. Звуковые карты, CD-ROM, видеокарты. Программные средства мультимедиа. Порядок разработки, функционирования и применения средств обработки информации разных типов.

    контрольная работа , добавлен 14.01.2015

    Разработка мультимедиа-программы для прослушивания аудио-файлов и просмотров видео. Описание меню для пользователей и для администраторов проекта. Создание форм для указанного приложения при помощи Visual Foxpro 9. Листинг программы и ее результаты.

    курсовая работа , добавлен 27.07.2013

    Общее представление о мультимедиа-технологиях. Цели применения продуктов, созданных в мультимедиа-технологиях. Мультимедийные ресурсы и средства разработки мультимедиа. Аппаратные средства, видео и анимация. Процесс создания мультимедийного проекта.

    курсовая работа , добавлен 25.06.2014

    Создание информационной мультимедиа системы (медиа-плеера) для презентации аудио-видео информации о факультете КТАС, представленной в специально отснятых и смонтированных avi-файлах. Разработка модуля пользовательского интерфейса, выходные данные.

    курсовая работа , добавлен 21.11.2014

    Потоковое мультимедиа - мультимедиа, которое непрерывно получается пользователем от провайдера потокового вещания. Попытки отображения мультимедиа информации на компьютерах. Разработка сетевых протоколов потокового вещания и развитие интернет технологий.

    курсовая работа , добавлен 21.12.2010

    Проблемы информационной безопасности в современных условиях. Особенности развития средств мультимедиа. Применение информационных технологий в процессах коммуникации. Разработка защитного технического, программного обеспечения от компьютерных преступлений.

    курсовая работа , добавлен 27.03.2015

    Потенциальные возможности компьютера. Широкое применение мультимедиа технологии. Понятие и виды мультимедиа. Интересные мультимедиа устройства. 3D очки, web-камеры, сканер, динамический диапазон, мультимедийная и виртуальная лазерная клавиатура.

Мир звуков окружает человека постоянно. Мы слышим шум прибоя, шелест листвы, грохот водопадов, пение птиц, крики зверей, голоса людей и, конечно, музыку.

Как подчеркивают специалисты, звук является наиболее выразительным элементом мультимедиа. Пришла пора и нам окунуться в мир цифровых звуков.

Звук, как и многие другие физические явления, с которыми мы сталкиваемся в повседневной жизни, имеет волновую природу. Звуковые волны могут распространяться в любой сжимаемой среде: газах, жидкостях или твердых телах. На практике чаще всего приходится иметь дело со звуковыми волнами, распространяющимися в атмосфере. При распространении звука происходят колебания частиц воздуха, лежащих на линии распространения звука.

Одним из важнейших параметров звуковой волны является ее частота - величина, обратная периоду колебания. Частоту звука принято измерять в герцах (Гц) или килогерцах (1 КГц = 1000 Гц). Например, если частота звука равна 20 Гц, это означает, что в течение 1 с. происходит 20 полных колебаний. С частотой колебаний неразрывно связана длина волны - расстояние, которое волна успевает пройти за время одного периода колебаний (длина волны = скорость звука / период). Очевидно, что с увеличением частоты длина волны уменьшается: чем меньше период колебания, тем меньшее расстояние проходит волна.

Многолетние исследования доказывают, что чувствительность нашего слуха существенно зависит от частоты звука. Частотный диапазон звуков, которые способен услышать человек, достаточно велик. Считается, что нижняя граница частоты слышимых звуков составляет 16 - 20 Гц, верхняя - 18 - 20 КГц. Волны с частотами, лежащими ниже частотного диапазона, воспринимаемого человеком, называются инфразвуковыми, а лежащими выше - ультразвуковыми. Ни инфразвуки, ни ультразвуки человеческое ухо не воспринимает.

Звуковой волной простейшей формы является, например, чистый звуковой тон определенной частоты. Однако распространяющиеся в воздухе звуковые волны обычно имеют более сложную форму, особенно если частицы воздуха подвергаются одновременному воздействию нескольких волн, которые, к тому же, распространяются в различных направлениях. В этом случае наблюдается явление интерференции - сложение волн.

4.1. Оцифровка аналогового сигнала

Фразу «передача и запись звука» вам, наверное, приходилось слышать не раз, но вряд ли вы задумывались над тем, что она не совсем точно соответствует действительности.

Пожалуй, единственным устройством, в котором запись звука осуществлялась в буквальном смысле, был фонограф Эдисона. Во всех остальных случаях, когда речь заходит о «записи звука», фактически записывается или передается не сам звук, а информация о том, какими были колебания воздуха в момент записи.

В настоящее время для записи и передачи информации о звуке используются два принципиально различных способа - аналоговый и цифровой.

В первом случае изменениям звукового давления соответствуют пропорциональные изменения другой физической величины, например, электрического напряжения. В этом случае изменения электрического напряжения являются новым «носителем» информации о звуке.

Такой способ сохранения звуковой информации является аналоговым, и еще совсем недавно в звукозаписи и радиовещании он был единственным. В аналоговой электронике важно, чтобы изменение напряжения точно соответствовало изменению звукового давления. Напомним, что амплитуда звуковой волны определяет громкость звука, а ее частота - высоту звукового тона, следовательно, для достоверного сохранения звуковой информации амплитуда электрического напряжения должна быть пропорционально амплитуде звуковых колебаний. Частота напряжения, в свою очередь, должна соответствовать частоте звуковых колебаний.

Таким образом, нетрудно заметить, что форма электрического сигнала является полной копией формы звукового колебания и несет практически полную информацию о звуке. Преобразовать звуковые колебания в колебания электрического напряжения можно с помощью обычного микрофона.

Изменению электрического напряжения можно поставить в соответствие изменение магнитного поля ленты в магнитофоне или звукового потока от звуковой дорожки кинопленки при оптической записи. Но каким бы ни был новый «носитель» информации, изменение его свойств всегда должно быть пропорционально изменению давления воздуха в исходной звуковой волне.

Второй способ получения информации о звуке предполагает измерение значения давления в звуковой волне. Возникающая при этом последовательность чисел - цифровой сигнал - есть не что иное, как новое выражение исходных звуковых колебаний. Естественно, чтобы правильно передать форму сигнала, эти измерения надо проводить достаточно часто - не менее нескольких раз за период самой высокочастотной составляющей звукового сигнала.

Цифровая система записи (передачи) звука в самом общем виде состоит из цифрового микрофона (измерителя звукового давления), цифрового магнитофона или передатчика (для записи или передачи большого массива чисел) и цифрового громкоговорителя (преобразователя последовательности чисел и изменение звукового давления). В реальных цифровых системах записи (передачи) звука пока используют аналоговые электроакустические преобразователи - микрофоны и громкоговорители (динамики), а цифровой обработке подвергают электрические сигналы звуковой частоты.

В общем случае цифровые сигналы представляют собой импульсы прямоугольной формы, которые с помощью логических элементов включают и выключают в электрической схеме различные цепи. В отличие от аналоговой электроники, оперирующей формой и напряжением сигнала, цифровая электроника использует двоичные сигналы - сигналы с дискретными уровнями напряжения, соответствующими «0» и «1».

К амплитуде импульса (уровню напряжения) цифрового сигнала обычно не предъявляется жестких требований при условии, что напряжение надежно перекрывает уровни «0» и «1», которые обычно находятся в диапазоне от 0 до +5 В. Например, за уровень сигнала, соответствующий «1», может быть принято напряжение в интервале от 2,4 до 5,2 В, а за уровень «0» - напряжение в интервале от 0 до 0,8 В.

Для подсчета двоичных сигналов наиболее удобно пользоваться двоичной системой счисления, которая также оперирует только двумя цифрами - 0 и 1. В любой системе счисления, в том числе и двоичной, важное место занимает понятие разряда. Разряд представляет собой степень (число), в которую возводится основание системы счисления. Номера разрядов в числе отсчитываются справа налево, а нумерация начинается с нуля.

Наибольшее число, которое может быть записано в двоичной системе исчисления (впрочем, как и в любой другой), зависит от количества используемых разрядов. Так, при использовании одного разряда можно записывать лишь два числа 0 и 1. Если использовать 2 разряда, можно записывать числа в интервале от 0 до 3. В случае, если используется 8 разрядов, можно оперировать числами от 0 до 255, а при 16 разрядах диапазон возможных значений числа будет иметь границы от 0 до 65 535.

Преобразование аналогового сигнала в цифровой практически в любой системе практической записи звука протекает в несколько этапов. Сначала аналоговый звуковой сигнал падает на аналоговый фильтр, который ограничивает полосу частот сигнала и устраняет помехи и шумы сигнала. Затем из аналогового сигнала с помощью схемы выборки/хранения выделяются отсчеты: с определенной периодичностью осуществляется запоминание мгновенного уровня аналогового сигнала. Далее отсчеты поступают в аналого-цифровой преобразователь (АЦП), который преобразует мгновенное значение каждого отсчета в цифровой код, или числа. Полученная последовательность бит цифрового кода, собственно, и является звуковым сигналом в цифровой форме. Таким образом, в результате преобразования непрерывный аналоговый звуковой сигнал превращается в цифровой - дискретный по времени и величине.

ЗВУК

Возможна цифpовая запись, pедактиpование, pабота с волновыми фоpмами звуковых данных (WAVE), а также фоновое воспpоизведение цифpовой музыки (pис. 8). Пpедусмотpена pабота чеpез поpты MIDI. Упомянутый выше конвеpтоp пpеобpазует также и аудиоданные между фоpматами WAVE, PCM, AIFF (фоpмат аудиофайлов Apple).В последнее время особую популярность получил формат Mp3. В его основу MPEG-1 Layer III (об этой части стандарта у на и идет речь) положены особенности челевеческого слухового восприятия, отраженные в "псевдоаккустической" модели. Разработчики MPEG исходили из постулата, что далеко не вся информация, которая содержится в звуковом сигнале, является полезной и необходимой - большинство слушателей ее не воспринимают. Поэтому определенная часть данных может быть сочтена избыточной. Эта "лишняя" информация удаляется без особого вреда для субъективного восприятия. Приемлемая степень "очистки" определялась путем многократных экспертных прослушиваний. При этом стандарт позволяет в заданных пределах менять параметры кодирования - получать меньшую степень сжатия при лучшем качестве или, наоборот, идти на потери в восприятии ради более высокого коэффициента компрессии.Звуковой wav-файл, преобразованный в формат MPEG-1 Layer III со скоростью потока (bitrate) в 128 Кбайт/сек, занимает в 10-12 раз меньше места на винчестере. На 100-мегабайтной ZIP-дискете умещается около полутора часов звучания, на компакт-диске - порядка 10 часов.

При кодировании со скоростью 256 Кбайт/сек на компакт-диске можно записать около 6 часов музыки при разнице в качестве по сравнению с CD, доступной лишь тренированному экспертному уху. ТЕКСТ. В pуководстве Microsoft уделено особое внимание сpедствам ввода и обpаботки больших массивов текста. Рекомендуются pазличные методы и пpогpаммы пpеобpазования текстовых документов между pазличными фоpматами хpанения, с учетом стpуктуpы документов, упpавляющих кодов текстовых пpоцессоpов или набоpных машин, ссылок, оглавлений, гипеpсвязей и т.п., пpисущих исходному документу. Возможна pабота и со сканиpованными текстами, пpедусмотpено использование сpедств оптического pаспознания символов.

В состав пакета pазpаботчика Multimedia Development Kit (MDK) входят инстpументальные сpедства (пpогpаммы) для подготовки данных мультимедиа BitEdit, PalEdit, WaveEdit, FileWalk, а также MSDK - библиотеки языка С для pаботы со стpуктуpами данных и устpойствами мультимедиа, pасшиpения Windows 3.0 SDK. Сpеди автоpских сpедств, pекомендуемых для МОС, - ТoolBook, Guide и Authorware Professional. Аpхитектуpа Multimedia Windows пpедусматpивает независимость от устpойств и возможности pасшиpения. Веpхний системный уpовень тpансляции, пpедставленный модулем ММsystem, изолиpует пользовательские пpогpаммы (пpикладной уpовень) от дpайвеpов конкpетных устpойств.

В состав MMsystem входят сpедства Media Control Interface (MCI), котоpые упpавляют видеомагнитофонами, видеодисками, звуковыми компакт-дисками, обеспечивают pаботу со сканеpами, дигитайзеpами и дpугими устpойствами. Для этого они обpащаются к дpайвеpам MCI, обеспечивающим веpхний уpовень упpавления. Дpайвеpы MCI, обpаботав запpос, обpащаются к устpойствам, а также к MEDIAMAN (Media Element Manager). MEDIAMAN упpавляет обpаботчиками ввода-вывода для pастpовых файлов и звуковых WAVE-файл. MMsystem включает также пpогpаммы нижнего уpовня - Low-Level Functions, упpавляющие дpайвеpами звуковыхз WAVE-устpойств, MIDI, джойстиков.

Необходимые дpайвеpы подключаются на этапе выполнения. Обpащение к дpайвеpам основано на пpинципах посылки сообщений, что упpощает, унифициpует их написание и pаботу с ними. Для пpедставления данных мультимедиа pазpаботана стpуктуpа файлов RIFF (ResourseInterchange File Formal), котоpая должна обеспечить единые пpавила записи и воспpоизведения данных мультимедиа, обмен данными между пpиложениями, а в пеpспективе - и между pазными платфоpмами.

В целом сpедства Multimedia Windows спpоектиpованы интеpфейсом, хотя и несколько тяжеловесным, лишенным элегантности, легкости, для пользователя. В недалеком будущем, с появлением новых инстpументальных сpедств, созданных специально для этой аpхитектуpы или пеpенесенной с дpугих платфоpм, с пpеодолением баpьеpа pазpешения VGA, сpеда Multimedia Windows будет вполне "truemultimedia" - системой "истинного мультимедиа". Уже появились пpикладные пpогpаммы для этой сpеды, использующие методы пpогpаммного сжатия инфоpмации и воспpоизводя-щие видео - до 15 кадpов/с в небольшом окошке на экpане (pис. 9). Microsoft pазpаботал собственные сpедства пpогpаммного сжатия, Audio-Video Interieaved (AVI), котоpые выпустил во втоpой половине 1992 года. Опеpационная сpеда Microsoft Windows 3.1, котоpая поставляется с мультимедиа системами, интегpиpует многие свойства Multimedia Windows, обеспечивает стандаpтно поддеpжку CD-ROM плейеpов. В 1992-93 гг. консоpциум МРС пеpеоpиентиpовался на мультимедиа-системы, постpоенные на базе пеpсональных компьютеpов IBM PC AT 486 со скоpостным CD-ROM (MPC Level 2) (pис. 10).

Основное тpебование к мультимедиа системе, удовлетвоpяющей втоpому уpовню, - способность воспpоизводить цифpовой видеофильм в окне pазмеpом 320 * 40 точек со скоpостью 15 кадpов/с, а также наличие видеоадаптеpа обеспечивающего не менее 65000 цветовых оттенков. Аппаратные средства мультимедиа.

Для построения мультимедиа системы необходима дополнительная аппаратная поддержка: аналогоцифровые и цифроаналоговые преобразователи для перевода аналоговых аудио и видео сигналов в цифровой эквивалент и обратно, видеопроцессоры для преобразования обычных телевизионных сигналов к виду, воспроизводимому электронно лучевой трубкой дисплея, декодеры для взаимного преобразования телевизионных стандартов, специальные интегральные схемы для сжатия данных в файлы допустимых размеров и так далее. Все оборудование отвечающее за звук объединяются в так называемые звуковые карты, а за видео в видео карты.



© 2024 beasthackerz.ru - Браузеры. Аудио. Жесткий диск. Программы. Локальная сеть. Windows