• Захват, обработка и хранение видео на ПК • 
В этой работе будет рассмотрена задача
Любые материалы, в виде архивов, изображений или в ином виде, которые можно скачать и использовать для работы в каком - либо софте, в монтаже, на компьютере, необходимо, по возможности, заворачивать в тег [spoil_zakon ][/spoil_zakon ].
Теги к теме для индексации ботами поисковых систем. Это стоит заполнять! • Сегодня всем известны преимущества цифровых способов передачи и хранения информации в сравнении с аналоговыми. • Теги к теме для индексации ботами поисковых систем. Это стоит заполнять!

    Захват, обработка и хранение видео на ПК

Сообщение Разместил ABTCES 26 мар 2017, 07:53

Описание задачи
Сегодня всем известны преимущества цифровых способов передачи и хранения информации в сравнении с аналоговыми. Это и возможность создать абсолютно точную копию, и возможность достоверно знать о сбоях при передаче информации, и возможность использовать долговечные носители (CD и DVD могут иметь срок архивного хранения в десятки лет).

В этой работе будет рассмотрена задача преобразования видеозаписи на каком–либо аналоговом носителе (ТВ трансляция, видеокассета VHS, S–VHS и т. п.) или на ненадёжном цифровом (цифровая видеокассета) в набор файлов на жёстком диске компьютера, которые потом можно записать на CD или DVD. При этом во главу угла будет ставиться простота технологии, дешевизна необходимой аппаратуры, а лишь потом качество результата и скорость выполнения процесса. Рассматриваемая методика подготовлена для непрофессионального использования. Такие методы как «обработка видео в реальном времени» не обязательны в рамках поставленной задачи, потому рассматриваться не будут.

Предполагается что читатель не знаком с технологиями обработки видео. Здесь описан очень широкий круг проблем, которые могут возникнуть при построении домашней студии для обработки видео, предложены варианты решения проблем.
О, сколько нам открытий чудных Готовят просвещенья дух, И опыт, сын ошибок трудных, И гений, парадоксов друг!

ABTCES
Доцент форума
Доцент форума 

  Захват, обработка и хранение видео на ПК

Сообщение Разместил ABTCES 26 мар 2017, 08:04

Выбор карты оцифровки видео
При выборе типа карты для оцифровки видео вам нужно ответить на такие вопросы: есть ли у вас уже видеокарта и собираетесь ли вы её заменить? Собираетесь ли вы менять видеокарту в будущем? Обычно видеокарты часто меняют те, кто играет в компьютерные игры: именно в этой области современные видеокарты эволюционируют очень быстро.

Если вы выбираете карту с ТВ–приёмником, то вам необходимо учитывать, что выбранная вами карта должна поддерживать стандарт телевизионного вещания вашей страны.

Если у вас есть видеокарта, и вы не собираетесь её менять; или наоборот — вы собираетесь менять свою видеокарту каждые полгода–год, то вам удобнее будет купить отдельную карту для захвата видео. На сегодня на рынке представлен широкий спектр таких карт по ценам от $30 до $80: разница в цене обусловлена функциональностью (наличие ТВ и радио приёмника, пульта дистанционного управления, поддержка стерео звука), использованным чипом оцифровки видео и именем производителя карты (именитый Aver дороже менее известного K–World). Чип Philips обеспечивает более высокое качество оцифровки видео, чем Conexant bt8x8, особенно для видео в стандарте SECAM. Новый чип Conexant cx2388x очень хорош для PAL и NTSC записей, но уступает чипам Philips на видео в стандарте SECAM. Что до производителя карты оцифровки, то тут многое зависит от личных предпочтений. Карты от Aver выполнены аккуратнее, комплект поставки богаче, в драйверах к ним меньше ошибок, работают они надёжнее и, в силу своей распространённости, они обладают большей совместимостью с различными программами.

Если вы покупаете новый компьютер или как раз собирались поменять видеокарту, то вам удобнее купить видеокарту с возможностью оцифровки видео. Видеокарты с чипом оцифровки видео стоят на $5—10 дороже, чем их аналоги: цена в большой степени определяется ценой самой видеокарты. Если вам не нужен ТВ приёмник, то это будет оптимальным вариантом. На такие видеокарты как правило устанавливают такие же чипы, как и на отдельные карты оцифровки, оговорка про качество оцифровки чипами Philips и Conexant bt8x8 справедлива и здесь. Кроме того, на свои видеокарты ATI часто устанавливает чип собственной разработки Rage Teathre, который получше Conexant bt8x8, но явно хуже чипов следующего поколения.

Видеокарты с чипом оцифровки и ТВ приёмником — как правило самая дорогая и функциональная модель в линейке видеокарт, она дополнительно комплектуется набором игр, комплектом программного обеспечения, пультом дистанционного управления и прочими мало полезными вещами. Возможно, вам будет дешевле купить обычную видеокарту и отдельную карту захвата видео с ТВ приёмником.
О, сколько нам открытий чудных Готовят просвещенья дух, И опыт, сын ошибок трудных, И гений, парадоксов друг!

ABTCES
Доцент форума
Доцент форума 

  Захват, обработка и хранение видео на ПК

Сообщение Разместил ABTCES 26 мар 2017, 08:05

Оцифровка при помощи цифровой камеры
Также нужно упомянуть о возможности оцифровки видео при помощи цифровой видео камеры. Вы подключаете свой аналоговый источник видео к камере и либо включаете оцифровку через меню (у новых моделей), либо записываете видео на кассету, а при воспроизведении получите оцифрованный видео сигнал (см. также Источник цифрового видео сигнала). Не все видео камеры поддерживают такой режим: некоторые видеокамеры требуют доработки, так как такой режим в них умышленно заблокирован производителем. Многие дешёвые камеры последнего поколения вообще лишены возможности оцифровывать аналоговый сигнал. Также помните, что не существует камер, способных работать с видеосигналом в стандарте SECAM (см. Телевизионные стандарты).

Видеокамеры Sony Digital 8 могут также оцифровывать видеокассеты формата Video 8 и Hi 8: вы вставляете кассету, ставите на воспроизведение, а с цифрового выхода камеры снимаете оцифрованный видео сигнал. Однако в начальных моделях последней линейки Digital 8 такая возможность исчезла.

Качество оцифровки видео также сильно разнится от камеры к камере. Цифровые видео камеры достаточно дороги (не меньше $500), потому вряд ли кто–то станет покупать цифровую камеру ради оцифровки видео. Но если у вас есть такая камера, то почему бы не воспользоваться такими её возможностями? Ответ на вопрос «Чем лучше оцифровывать видео — цифровой видеокамерой или компьютерной платой оцифровки?» проще получить экспериментально: слишком велико многообразие как видеокамер, так и карт захвата видео.
О, сколько нам открытий чудных Готовят просвещенья дух, И опыт, сын ошибок трудных, И гений, парадоксов друг!

ABTCES
Доцент форума
Доцент форума 

  Захват, обработка и хранение видео на ПК

Сообщение Разместил ABTCES 26 мар 2017, 08:12

Телевизионные стандарты
Вам необходимо обеспечить совместимость карты захвата с источником видеосигнала по используемому способу передачи видео.

В большинстве стран мира принят один из вещательных телевизионных стандартов: NTSC (Америка и Япония), PAL (Европа) или SECAM (Франция и бывший СССР). В каждой стране продаётся видео техника, способная работать с принятым в этой стране телевизионным стандартом. Если вы используете приобретённую в другой стране технику, обязательно проверьте в документации к вашему оборудованию, что ваш источник видео сигнала и карта захвата способны работать в едином телевизионном стандарте.

Существуют также подтипы ТВ стандартов, как то: PAL–B, PAL–D, PAL–G и так далее. Они отличаются не собственно способом кодирования сигнала, а его параметрами (частотами и ширинами поддиапазонов). Карты захвата обычно способны работать с любым подтипом стандарта, нужно только указать его при настройке карты: либо указывается собственно название подтипа стандарта, либо название страны, где такой подтип стандарта принят для телевизионного вещания.
Ввиду того, что стандарты PAL и SECAM очень похожи: оба передают 25 кадров в секунду и одинаково кодируют яркостную составляющую сигнала (чёрно–белое изображение), подавляющее большинство распространённой у нас видео техники способно работать с обеими стандартами — PAL и SECAM. По этой же причине видеокамеры на нашем рынке работают в стандарте PAL: рынок в бывшем СССР не такой уж большой, чтобы разрабатывать специальную SECAM версию; а раз все наши телевизоры и видеомагнитофоны поддерживают PAL, то это и не нужно.

NTSC использует другой способ кодирования видеосигнала, в частности передаёт 30 кадров в секунду (точнее, 29,97 — хотя существует аппаратура, работающая с частотой кадров ровно 30,00 к/сек). Большинство используемой у нас видеотехники не способно работать с NTSC. Часто выпускаются две версии карт захвата: для работы с PAL/SECAM и отдельно для NTSC. Обязательно проверьте, что ваша карта захвата способна работать с вашим источником видеосигнала.
Низкочастотные блоки всех карт захвата универсальны и способны оцифровать поданный на видеовход видеосигнал любого стандарта: вам лишь нужно указать в настройках правильное значение частоты кадров (25 или 30 для NTSC).

Высокочастотные блоки — ТВ–приёмники — наоборот, специфичны для каждого ТВ–стандарта. Потому ваша карта захвата сможет записывать видео из ТВ–эфира только в том стандарте (одном или нескольких), на который она рассчитана. У нас продают карты с ТВ приёмниками стандарта PAL–D/SECAM–D, который принят в странах бывшего СССР.

Вам не нужно беспокоиться, если вы используете цифровой источник видео: цифровая камера сделает всё за вас. Единственная разница будет в том, что видео оцифрованное с NTSC сигнала будет содержать 30 кадров в секунду вместо 25.

Далее по тексту я для простоты буду считать, что в нашем видео сигнале 25 кадров в секунду. В случае, если в вашем видео 30 кадров в секунду, вам лишь необходимо заменить соответствующие цифры «25» на «30», а также «50» на «60» — остальная информация остаётся в силе.
О, сколько нам открытий чудных Готовят просвещенья дух, И опыт, сын ошибок трудных, И гений, парадоксов друг!

ABTCES
Доцент форума
Доцент форума 

  Захват, обработка и хранение видео на ПК

Сообщение Разместил ABTCES 26 мар 2017, 08:14

Разрешение и чёткость изображения
Следует различать понятия разрешение — которое является характеристикой хранилища видео сигнала в цифровом виде — и чёткость, которое описывает свойства собственно видео сигнала.

Рассмотрим такой пример: нарисуем в графическом редакторе картинку, состоящую из чередующихся белых и чёрных строк.

Пусть её размер по вертикали будет 10 строк. Мы можем сохранить это изображение в графический файл, имеющий 10 пикселей по вертикали.

Также мы можем сохранить это изображение в файл с 20 пикселей по вертикали,

25 пикселей — и в каждом из них мы сможем увидеть лишь 10 линий: 5 белых и 5 чёрных.

Если мы сохраним наше изображение в файл с 8 пикселей по вертикали, то мы сможем рассмотреть не 10 строк, а только 6: 3 белые и 3 чёрные.

Если использовать 9 пикселей по вертикали, то останется только 8 строк (4 белые и 4 чёрные).

Таким образом, на рассмотренном выше примере мы видим, что чёткость изображения (измеряется в количестве линий) не зависит от разрешения файла (измеряется в количестве пикселей), в который это изображение записано, если только разрешение не меньше чёткости изображения. Сохранение изображения в файл с разрешением меньшим, чем чёткость изображения, приводит к уменьшению чёткости. Отсюда следуют два простых правила: с одной стороны разрешение оцифрованного видео должно быть не ниже, чем чёткость исходного видео; с другой стороны не имеет смысл хранить видео с очень высоким разрешением: чёткости это не добавит, а занимать дополнительную память будет.

Чёткость видео в бытовой аппаратуре
Максимальную чёткость, которую способна обеспечить видеоаппаратура, можно измерить при помощи специальных источников сигнала: тестовых таблиц. Приблизительные значения чёткости изображения по горизонтали, которые обеспечивает бытовая аппаратура, примерно равны следующим значениям: видеомагнитофоны и камеры формата VHS: 210—220 линий. Новые качественные камеры и магнитофоны формата VHS, в том числе с 4 или более считывающими головками в состоянии обеспечить чёткость изображения до 240—260 линий. Видеокамеры формата Video8 в состоянии обеспечить до 270—280 линий. Аппаратура форматов Hi8 и S–VHS может обеспечить чёткость до 420—440 линий. Видеокамеры формата DV и DVD в состоянии обеспечить до 540 линий. Количество видимых строк в стандартах PAL и NTSC фиксировано и составляет соответственно 576 и 480.

Пояснение: эти самые линии по горизонтали считаются не на всей длине строки, а на её части, равной высоте экрана, т. е. в квадрате. Таким образом и подсчитан теоретический максимум для DV при нормальном соотношении сторон экрана 4 на 3: 720 пикселей * 3/4 = 540 линий.

Резкость — чёткость границ
Очень часто термин «чёткость» в области обработки изображений (или видео) можно также услышать применительно к операции повышения чёткости границ (sharpen) — резкости изображения. Я призываю вас не путать эти понятия, так как чёткость изображения по вертикали или по горизонтали не имеет ничего общего с резкостью. Операции sharpen и blur увеличивают и уменьшают контрастность изображения вблизи границ объектов, тем самым резкие переходы на изображении подчёркиваются или скрадываются. Это приводит к тому, что объекты на рисунке воспринимаются человеком как более чёткие или более смазанные. Эффект проявляется в силу особенностей зрительного восприятия: мозг в первую очередь пытается выделить на изображении отдельные объекты. Резкость не имеет никакой количественной абсолютной характеристики.
О, сколько нам открытий чудных Готовят просвещенья дух, И опыт, сын ошибок трудных, И гений, парадоксов друг!

ABTCES
Доцент форума
Доцент форума 

  Захват, обработка и хранение видео на ПК

Сообщение Разместил ABTCES 26 мар 2017, 08:15

Чересстрочное и прогрессивное видео
В настоящее время применяется два способа передачи видео: устаревший чересстрочный и более новый прогрессивный. Вещательный телевизионный сигнал по историческим причинам использует чересстрочный способ. Это означает, что кадр (frame) передаётся не целиком, а из двух половинок: сначала передаётся первый полукадр (или поле — field), который отображается в нечётные строки кадра, а потом — второй полукадр, соответственно он отображается в чётные строки.
Прогрессивный кадр содержит все строки: чётные, и нечётные. Компьютерная техника отображает изображение в прогрессивном формате. Прогрессивный кадр лишь недавно стал применяться в видеотехнике, например новые видео DVD содержат кинофильмы записанные с прогрессивной развёрткой. Телевещание и подавляющее большинство современных видеокамер используют чересстрочную развёртку. Видеокамеры с прогрессивной развёрткой завоёвывают всё большую популярность, однако пока на рынке их достаточно мало.

Очевидно, вертикальное разрешение каждого полукадра (количество строк) вдвое меньше разрешения полного кадра.

Особенности чересстрочного видео
Следует понимать, что в ТВ сигнале или при съёмке камерой каждый полукадр содержит изображение, отснятое на 1/50 секунды позже: то есть между первым и вторым полукадром проходит 20 мс. За это время объекты, находящиеся в кадре, могут сместиться. С другой стороны поля — элементы полного кадра, то есть 2–я строка (принадлежащая второму полю) расположена ниже 1–й строки (принадлежащей первому полю), 4–я (2–е поле) — ниже 3–й (1–е поле) и так далее. Таким образом, чётные полукадры находятся выше нечётных. В силу этой особенности полукадры часто называют верхними (top) и нижними (bottom).

Всё сказанное выше справедливо также и для стандарта NTSC, с той только разницей что количество кадров в секунду составляет 30 (точнее, 29,97), соответственно полей в секунду — 60 (59,94). Также различается и порядок следования полей: в PAL верхние поля следуют после (позже) нижних, а в NTSC — наоборот.

Захват чересстрочного видео
При захвате видео компьютеру передаётся набор полных кадров с частотой 25 к/сек, чётные строки кадра содержат одно поле, нечётные — другое. Порядок полей не оговорен стандартами и зависит от аппаратуры: первым может быть как верхнее, так и нижнее поле. Этот метод имеет как свои преимущества, так и ряд недостатков.

Очень важно, чтобы при захвате чересстрочного видео использовалось полное разрешение по вертикали (576 строк для PAL и SEACM, 480 строк для NTSC). В противном случае из–за уменьшения размера по вертикали часть строк будет потеряна; будет нарушено правило «одно поле в чётных строках, другое — в нечётных». Полученную видеозапись никакой алгоритм deinterlace не сможет исправить. Уменьшение размера по вертикали нужно обязательно делать не при захвате, а при обработке видео: после применения deinterlace или же каким–то другим методом, который не нарушит структуры полей.
О, сколько нам открытий чудных Готовят просвещенья дух, И опыт, сын ошибок трудных, И гений, парадоксов друг!

ABTCES
Доцент форума
Доцент форума 

  Захват, обработка и хранение видео на ПК

Сообщение Разместил ABTCES 26 мар 2017, 08:19

Отображение чересстрочного видео на компьютере
Описанная выше структура чересстрочного видео нормально воспринимается при воспроизведении на телевизоре — он имеет невысокое разрешение по вертикали, потому чётные и нечётные строки выводятся практически одна поверх другой. Мы видим все 50 фаз движения в секунду, полукадры всегда отображаются последовательно, один за другим.
Иначе обстоит дело, когда мы пытаемся воспроизвести чересстрочное видео на прогрессивном устройстве, каким является монитор компьютера. Существует ряд способов, как показать на компьютере чересстрочное видео:
показывать только чётные или только нечётные поля, получим 25 кадров в секунду;
показывать все поля по очереди, получим 50 кадров в секунду;
составить полный кадр из двух полей и показывать 25 кадров в секунду.

Оставляем только половину полей
Недостатки первого способа очевидны: мы теряем половину информации из исходного видео. Получаем картинку с половинным разрешением по вертикали и теряем половину фаз движения (половинное разрешение по времени). Этот способ исключительно прост, потому он достаточно распространён. Для восстановления исходных пропорций изображения обычно уменьшается вдвое разрешение по горизонтали, что ещё больше снижает чёткость оцифрованного видео. Безусловно, несложно программно увеличить вдвое разрешение по вертикали, что, конечно же, не добавит чёткости по вертикали.

Сохраняем 50 кадров в секунду
Из 50 полей в секунду можно получить 50 кадров в секунду двумя способами: оставить разрешение кадра равным разрешению поля, то есть половине разрешения кадра; или увеличить разрешение по вертикали вдвое. Первый вариант не так хорош, как кажется: поскольку одно из полей находится ниже другого, то при выводе полукадров последовательно на экран прогрессивного устройства (монитор компьютера) мы увидим мелкое дрожание изображения вверх–вниз (тремор).

Второй вариант позволит сохранить вертикальную чёткость только в том случае, если при увеличении разрешения будет использоваться информация из двух полей (интерполяция), при этом вдвое вырастет время обработки видео и требуемый для хранения объём. Более чем вдвое возрастают требования к мощности компьютера для воспроизведения такого видео.

Реальная необходимость сохранять 50 фаз движения в секунду имеет смысл для записей ТВ трансляций спортивных передач: часто их просматривают в замедленном виде или же вообще покадрово. Также желательно сохранить 50 кадров в секунду для плохо снятых любительских записей видео камерой, когда камера у «оператора» постоянно дрожит.

Подробнее о работе с оцифрованным видео с сохранением 50 фаз движения в секунду вы можете прочесть в статье Виктора Томилова 50 кадров в секунду.

Формируем 25 кадров в секунду — deinterlace
Самый распространённый способ представления оцифрованного видео на компьютере — это составление полного кадра из двух полукадров: в нечётные строки записывается содержимое одного поля, в чётные — другого. Необходимо учитывать то, что разные полукадры могут относиться к разным моментам времени. За 20 мс, которые разделяют два полукадра, объекты в кадре могут сместиться. При выводе прогрессивного видео с частотой 25 кадров в секунду будут заметны дефекты изображения (артефакты), которые очень часто за характерную форму называют «гребёнкой» или «расчёской».

Нужно добавить, что «гребёнка» содержит множество мелких деталей, а это чрезмерно усложняет процесс последующего сжатия видео.

Для устранения эффекта чересстрочности применяются специальные меры, которые называются deinterlace (произносится как «деинтерлейс»). Существует несколько методов deinterlace. Bob deinterlace применяется для вывода 50 фаз движения на прогрессивном устройстве: растягиваем первое поле вдвое по вертикали и при помощи интерполяции смещаем изображение на половину пикселя вниз, растягиваем второе поле вдвое по вертикали и при помощи интерполяции смещаем изображение на половину пикселя вверх. Field deinterlace строит один кадр из двух полукадров, результат обработки имеет 25 кадров в секунду. Способов устранения артефактов чересстрочности несколько: от простого усреднения содержимого двух полей, до сложных алгоритмов детектирования движения в кадре и построения результирующего прогрессивного кадра при помощи интерполяции. В результате применения таких методов несколько снижается чёткость изображения: у готового прогрессивного кадра чёткость практически равна чёткости исходного видеосигнала в статичных сценах, в динамичных сценах она несколько меньше.

Восстановление прогрессивного видео
Иногда прогрессивное видео передаётся посредством чересстрочного сигнала — например кинофильм транслируется по ТВ. В таком случае верхний и нижний полукадры могут попадать в поля одного чересстрочного кадра (…[1в 1н] [2в 2н] [3в 3н] [4в 4н]…), но возможен такой вариант: …[1н 2в] [2н 3в] [3н 4в]… — то есть полукадры смещены на один. При просмотре кадра такого видео будет заметна «гребёнка», характерная для чересстрочного видео. В результате применения deinterlace мы получим гало — полупрозрачную дымку — вокруг всех движущихся объектов, будем видеть два полупрозрачных контура движущихся объектов.

Для того чтобы реконструировать исходное прогрессивное видео нам необходимо сдвинуть поля видеосигнала таким образом, чтобы восстановить их исходный порядок. Необходимыми возможностями обладают наиболее универсальные фильтры для проведения deinterlace.

Восстановление чересстрочного видео
В силу различных причин, описанная выше для прогрессивного видео ситуация может возникнуть и для чересстрочного видео. Алгоритму deinterlace это не помешает, если будет сохранён правильный порядок полей. Но часть аппаратуры по работе с видео (в том числе и некоторые карты захвата видео) грешит тем, что переставляет поля в пределах кадра, реже — ещё как–либо меняет порядок полей или кадров. В случае, если после deinterlace вы получаете гало вокруг движущихся объектов — порядок полей в исходном видео сигнале перепутан.

Чтобы нормально обработать такую видеозапись вам необходимо переставить поля или кадры так, чтобы восстановить исходный порядок полей. Необходимыми возможностями обладают наиболее универсальные фильтры для проведения deinterlace. Комбинацию настроек, скорее всего, вам придётся подбирать экспериментально. Подробнее об этом написано в 4–м разделе статьи Виктора Томилова Захват и обработка аналогового видео с максимальным качеством для сжатия в MPEG–4.

К счастью, описанные выше проблемы появляются не часто: в подавляющем большинстве случаев чересстрочное видео имеет правильный порядок полей.
О, сколько нам открытий чудных Готовят просвещенья дух, И опыт, сын ошибок трудных, И гений, парадоксов друг!

ABTCES
Доцент форума
Доцент форума 

  Захват, обработка и хранение видео на ПК

Сообщение Разместил ABTCES 26 мар 2017, 08:20

Сохраняем чересстрочное видео
Не смотря на то, что монитор компьютера выводит прогрессивное видео, мы можем сохранить наше чересстрочное видео в исходном виде. Потом нам нужно будет или производить deinterlace во время воспроизведения на компьютере, или выводить изображение на телевизор или видеомагнитофон (где артефакты чересстрочного видео не видны).

Проблем при этом подходе несколько. Во–первых на 20—30% вырастают требования к размеру сжатого видео. Вторая проблема — как организовать вывод с компьютера на ТВ «честного» чересстрочного видео: с правильным порядком полей, которые бы сменялись 50 раз в секунду. Некоторые видеокарты с ТВ выходом позволяют это делать (например, ATI Radeon или Matrox), другие — нет.

Описанную выше проблему можно обойти, записав видео в доступном для аппаратных проигрывателей формате. До недавнего времени таким форматом был только MPEG–2 — его сможет воспроизвести любой DVD проигрыватель. Для качественного сжатия видео в формат MPEG–2 необходимы огромные объёмы данных (25—30 минут на CD) — видео в формате MPEG–2 удобно записывать только на DVD. Такой вариант решения на сегодня несколько дороже, хотя он и обладает рядом неоспоримых преимуществ: видео DVD могут быть воспроизведены любым аппаратным DVD–проигрывателем (включая поддержку нескольких звуковых дорожек, субтитров и меню), использование более ёмких дисков позволяет использовать потоки данных большей ширины, чересстрочное видео просто сохраняется в исходном виде (сохраняется исходное разрешение по оси времени). Лично мне не доводилось работать с такой технологией, за подробностями рекомендую обратиться к сайту М. Афанасенкова или к FAQ по созданию и редактированию цифрового видео.

В последнее время начали появляться DVD проигрыватели с возможностью декодирования видео в формате MPEG–4. Последние версии кодеров DivX и XviD имеют режимы для сохранения чересстрочного видео. Но эти режимы пока мало протестированы, даже сами авторы кодеров не рекомендуют их использовать. Сегодняшние версии программных декодеров не позволяют качественно воспроизвести чересстрочное видео на компьютере: DivX производит во время воспроизведения некий вариант field deinterlace, что приводит к «размазыванию» краёв движущихся объектов. Лучше доверить deinterlace более сложному алгоритму на этапе обработки видео, там он не будет стеснён жёсткими временными рамками «40 мс на кадр» и в состоянии обеспечить более высокое качество. Также вы можете использовать аппаратные проигрыватели с возможностью декодирования MPEG–4, например проигрыватель Xoro в состоянии воспроизводить чересстрочное видео, закодированное DivX.

Также видео можно хранить непосредственно в формате DV. Такой вариант позволяет избежать дополнительных потерь при обработке и сжатии видео, с другой стороны — видео в формате DV занимает много места: 13 Гбайт/час. Вы можете хранить DV–записи на DV–кассетах, однако такой вариант достаточно дорог; кроме того кассеты подвержены механическому износу и не обеспечивают быстрого доступа к любому месту записи (в отличие от дисковых носителей).
О, сколько нам открытий чудных Готовят просвещенья дух, И опыт, сын ошибок трудных, И гений, парадоксов друг!

ABTCES
Доцент форума
Доцент форума 

  Захват, обработка и хранение видео на ПК

Сообщение Разместил ABTCES 26 мар 2017, 08:22

Цифровое видео
В этом разделе описаны базовые факты из области цифровой обработки видеоинформации, которые нужны для понимания дальнейшего материала.

Кодирование цвета
Карты захвата видео предоставляют возможность сохранить поток данных в таком же виде, в каком они выходят с чипа оцифровки видео. Эти чипы выдают информацию не в привычном для компьютера формате в виде набора цветовых компонент RGB (red, green, blue), а в виде яркостной и двух цветовых составляющих (YUV). Причём для группы из двух последовательно идущих пикселей сохраняется два значения яркости и по одному значению цветовых компонент, то есть получается 4 байта (32 бита) на 2 пикселя или 16 бит на пиксель. Такой метод называют chroma subsampling, а способ записи называют кодированием цвета YUV2 (или YUYV, или 4:2:2). Из–за особенностей человеческого зрения разницу с обычным RGB представлением увидеть практически невозможно: глаз более чувствителен к яркости, чем к цвету (точнее разрешающая способность глаза по яркости выше, чем по цвету — за счёт разной концентрации колбочек и палочек на сетчатке). Очевидно, такой нехитрый метод позволяет существенно снизить объём информации для оцифрованного видео: если сохранять привычные 24 бита на пиксель вместо 16, то потребуется в 1,5 раза больше места. Поскольку информация с карты захвата поступает уже в YUV2, нет абсолютно никакого смысла записывать на диск RGB.

Также распространён метод кодирования YUV12 (YV12) — в нём общие значения цветовых компонент имеют группы из 4 пикселей (2x2 для PAL или 4x1 для NTSC; метод также называется 4:2:0, либо 4:1:1, соответственно). Для 4 пикселей сохраняется 4 байта яркости, 1 байт цветности U и 1 байт цветности V, в среднем получается 12 бит на пиксель — отсюда название. Подробнее про способы кодирования цвета см. напр. FAQ по оцифровке видео с минимальными затратами. Для нас важно то, что такие способы представления видео информации является традиционным для цифрового видео, они используется практически всеми кодерами видео.

Поток данных (bitrate)
Важно понимать, что означает термин «поток данных» (bitrate, часто используют русскую транскрипцию: битрейт). Поток данных — это количество информации в сжатом виде, приходящееся на единицу времени для какой–либо записи. Существует два способа сжатия информации: с постоянным потоком данных (CBR, constant bitrate) и с переменным потоком данных (VBR, variable bitrate). В первом варианте каждый блок данных сжатого файла (который имеет определённую длительность при воспроизведении) имеет постоянный размер — соответственно поток данных не меняется на протяжении всего файла. В случае переменного потока данных, каждый блок по выбору кодера может иметь больший или меньший размер. Поскольку реальные сигналы имеют постоянно изменяющуюся сложность, метод кодирования с переменным потоком данных оказался существенно эффективнее. Очевидно, чтобы так же качественно закодировать информацию с постоянным потоком данных необходимо всегда использовать максимальный возможный размер блока, что приведёт к перерасходу битов на несложных участках.

Когда поток данных не постоянен, то говоря о ширине потока данных подразумевают среднюю величину потока данных. Усреднение традиционно проводится в течении всей записи.

С точки зрения изменения сложности для сжатия, видеоинформация существенно сложнее, чем звуковая. Статичные сцены, где из кадра в кадр меняется лишь малая часть изображения, сменяются динамичными, где во время взрывов и погонь сложно найти два одинаковых кадра. Первые реализации MPEG кодеров использовали сжатие видео с постоянным потоком данных (в частности — стандарт Video CD, MPEG–1 сжатие). Однако это даёт настолько неудовлетворительные результаты, что сжатие видео с постоянным потоком данных на сегодня не используется нигде. Есть, правда, два исключения: совместимость со старыми стандартами (например Video CD) и цифровое вещание (network broadcasting). Мы же всегда будем использовать сжатие видео с переменным потоком данных.

Ширина потока данных измеряется в битах в секунду или байтах в секунду. Потоки данных при работе с видео достаточно велики, потому чаще встречаются килобиты и мегабиты. Напомню, байт содержит 8 битов, килобайт содержит 1 024 байта, мегабайт равен 1 024 килобайтам, то есть 1 048 576 байтам. С битами не всё так просто: DivX Networks внесли изрядную путаницу, используя соотношение 1 кбит = 1 000 бит в своём кодере.
О, сколько нам открытий чудных Готовят просвещенья дух, И опыт, сын ошибок трудных, И гений, парадоксов друг!

ABTCES
Доцент форума
Доцент форума 

  Захват, обработка и хранение видео на ПК

Сообщение Разместил ABTCES 26 мар 2017, 08:24

Устройство алгоритмов сжатия видео

Типы кадров
Поток данных в формате MPEG (1, 2 и 4) может содержать три типа кадров: ключевые кадры (keyframe, intra–frame, I–frame), промежуточные (predictable, forward predictable, P–frame) и двунаправленные (backward predictable, bi–directional, BiDir, B–frame).

Ключевой кадр содержит всю информацию об изображении в кадре и никак не зависит от других кадров.
Промежуточный кадр может ссылаться на блоки изображения в предыдущем ключевом или предыдущих промежуточных кадрах. Это позволяет делать промежуточные кадры по размеру меньше ключевых: в них записано меньше информации об изображении. Для того чтобы полностью отобразить промежуточный кадр, необходимо взять ближайший перед ним ключевой кадр, а потом последовательно декодировать промежуточные кадры. Очевидно, что такой способ хорош при воспроизведении видео (когда все кадры отображаются последовательно: декодеру нужно лишь сохранять в памяти нужные предыдущие кадры). При монтаже такой способ хранения информации куда как менее удобен: во–первых возрастает среднее время декодирования одного кадра (для декодирования промежуточного кадра нужно декодировать не один, а несколько кадров), во–вторых разрезать и склеивать видеоряд возможно только так, чтобы первый кадр в отрезанном куске видеоряда был ключевым.

Двунаправленный кадр также содержит не всё изображение. Но в отличие от промежуточного кадра, он может ссылаться и на следующий за ним промежутоный кадр: отсюда и происходит его название. Двунаправленные кадры занимают ещё меньше места, чем промежуточные. Способ декодирования двунаправленного кадра ещё сложнее, чем декодирование промежуточного кадра: сначала по описанной выше схеме декодируется следующий за двунаправленным промежуточный кадр; потом, используя информацию о соседних кадрах, декодируется двунаправленный кадр.
Из сказанного выше следует, что чем чаще в видеозаписи расположены ключевые кадры, тем быстрее осуществляется перемотка и доступ к произвольному кадру. Но, поскольку ключевые кадры занимают наибольший размер, тем хуже будет сжатие видеозаписи.

Группы кадров
Группой кадров (GOP, Group Of Pictures) называют последовательность между двумя ключевыми кадрами. Подгруппой кадров (Sub GOP) называют последовательность между двумя промежуточными кадрами. Традиционно у MPEG–1 и MPEG–2 кодеров задаётся длина групп и подгрупп кадров. Типичные параметры для MPEG–кодеров: 15 и 3, что соответствует последовательности кадров I BB P BB P BB P BB P BB I … Простые MPEG–1/2 кодеры используют эти параметры как руководство к действию, более сложные — как рекомендацию.

Очевидно, что когда в видеоряде сменилась сцена — новый кадр содержит абсолютно не похожее на предыдущий кадр изображение — имеет смысл начать новую сцену с ключевого кадра. Алгоритм, который вставляет ключевой кадр в начале новой сцены, называется «определением смены сцены» (scene change detection), он реализован во всех современных MPEG–4 кодерах. Несложные MPEG–1 и MPEG–2 кодеры, которые содержатся в программах для захвата видео, лишены его.

Ввиду особенностей развития MPEG–4 кодеров, поддержка двунаправленных кадров была реализована не сразу. DivX и XviD имеют настройки, которые позволяют включать и выключать использование двунаправленных кадров. В DivX можно ограничить последовательность двунаправленных кадров одним (последовательность кадров вида …IBPBPB…) или двумя (последовательность вида …IBBPBBP…), XviD также позволяет указать допустимое количество идущих подряд В–frame (по умолчанию — 2). И DivX, и XviD содержат параметр, который ограничивает максимальную длину группы кадров — максимальное расстояние между ключевыми кадрами. Поскольку все MPEG–4 кодеры содержат алгоритм обнаружения смены сцены, этот параметр традиционно достаточно велик и равен по умолчанию примерно 10 секундам (240—300 кадров). Ключевые кадры добавляются кодером в случае необходимости, а ограничение длины группы кадров больше нужно для оббеспечения быстрой перемотки.

В случае если вы хотите использовать MPEG сжатие в качестве промежуточного, то вам крайне желательно отключить использование двунаправленных кадров, укоротить длину группы кадров. Это позволит повысить скорость доступа к произвольному кадру вашей видеозаписи, также снизится вычислительная сложность кодирования видео. С другой стороны такой способ сжатия потребует больше места. В идеале нужно заставить кодер сохранять последовательность из одних ключевых кадров, что сделает его подобным методу сжатия MJPEG.
О, сколько нам открытий чудных Готовят просвещенья дух, И опыт, сын ошибок трудных, И гений, парадоксов друг!

ABTCES
Доцент форума
Доцент форума 

  Захват, обработка и хранение видео на ПК

Сообщение Разместил ABTCES 26 мар 2017, 08:25

Развитие MPEG–4 кодеров
За последние несколько лет мы наблюдаем бурное развитие кодеров видео. Сегодня различными разработчиками развивается множество программ, которые позволяют сжимать видео — большая часть основана на технологиях MPEG–4.

Обратите внимание, что не все рассматриваемые кодеры совместимы со стандартом ISO MPEG–4:
DivX 4, DivX 5, XviD, 3ivX, Nero Digital, ffDShow и Mpegable создают видео, полностью соответствующее стандарту MPEG–4 ASP (advanced simple profile);
DivX 3, Microsoft MPEG–4, WMV, VP6 и RealVideo не совместимы со стандартом ISO MPEG–4 — декодировать такие записи можно только специальными декодерами.

3ivX разработала набор кодеров: видео, звук (MPEG–4 AAC) и инструменты для поддержки контейнера MP4 (см. Формат контейнера видеозаписи). Ahead Software для своего пакета записи и копирования CD и DVD дисков создала MPEG–4 кодер Nero Digital (также в комплекте с кодером AAC и поддержкой контейнера MP4). Microsoft продолжает выпускать новые версии кодеров Windows Media Video (WMV), которые также основаны на MPEG–4. Mpegable выпустила свой MPEG–4 кодер, особенно неплохой при небольших потоках данных (см. статью Хорошие и плохие стороны кодека Mpegable MPEG–4, рекомендации и советы по использованию). On2 выпустила очень необычный и многообещающий кодек VP6 (см. статью On2 VP6 6.2 (VP62) — 10 тысяч метров, полет нормальный). Последние версии формата RealVideo — 9–я и 10–я — также основаны на MPEG–4. DivX Networks продолжает развитие своего кодера DivX — пожалуй самого успешного и популярного.

Альтернативная разработка, основанная на исходных кодах старого–доброго OpenDivX — XviD — продолжает развиваться и уже достигла стабильного состояния. XviD на сегодня обеспечивает лучшее качество сжатия видео (см. напр. сравнение кодеров видео на сайте Doom9) и полную совместимость со стандартом MPEG–4. В среде Unix разрабатывается и используется библиотека с открытыми исходными кодами libavcodec — в частности она поддерживает кодирование MPEG–4 видео. Существует реализация этого кодера под Windows: ffDShow. В последнее время на рынке появляется всё больше реализаций кодеров MPEG–4 AVC (H.264) — однако на сегодня они ещё находятся в состоянии бурного развития и пока не рекомендуются к использованию.

Множество пользователей использует разные MPEG–4 кодеры видео, в интернете можно найти множество информации по этому вопросу (см. напр. Информация о MPEG–4 (включая AVC/H.264)). Проводятся тестирования и сравнения — по качеству изображения, скорости работы и т.п. Самый известный на сегодня любительский сайт в области технологий сжатия видео — это Doom9. На этом сайте также действует форум, очень популярный в кругах энтузиастов от цифрового видео. Хозяин и автор сайта, Doom9, регулярно проводит сравнения разных кодеров видео, последнее из них он закончил к Новому 2004 году. Это тестирование выявляет явных аутсайдеров с точки зрения сохранения качества изображения (Windows Media 9, 3ivX, libavcodec, Nero Digital 4.1.4 — последний, правда, исключительно быстрый).
О, сколько нам открытий чудных Готовят просвещенья дух, И опыт, сын ошибок трудных, И гений, парадоксов друг!

ABTCES
Доцент форума
Доцент форума 
Предыдущая страница
Следующая страница

Вернуться в Все, что нам надо для видеоредактирования. О софте



 • Блок вывода аналогичных по названию других тем нашего форума • 
счетчик счетчик счетчик счетчик счетчик
Сегодня всем известны преимущества цифровых способов передачи и хранения информации в сравнении с аналоговыми.