FMUSER Wirless Transmituj wideo i audio łatwiejsze!
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> Afrikaans
sq.fmuser.org -> albański
ar.fmuser.org -> arabski
hy.fmuser.org -> Armeński
az.fmuser.org -> Azerbejdżański
eu.fmuser.org -> baskijski
be.fmuser.org -> białoruski
bg.fmuser.org -> bułgarski
ca.fmuser.org -> kataloński
zh-CN.fmuser.org -> chiński (uproszczony)
zh-TW.fmuser.org -> chiński (tradycyjny)
hr.fmuser.org -> chorwacki
cs.fmuser.org -> czeski
da.fmuser.org -> duński
nl.fmuser.org -> holenderski
et.fmuser.org -> estoński
tl.fmuser.org -> filipiński
fi.fmuser.org -> fiński
fr.fmuser.org -> francuski
gl.fmuser.org -> galicyjski
ka.fmuser.org -> gruziński
de.fmuser.org -> niemiecki
el.fmuser.org -> grecki
ht.fmuser.org -> kreolski haitański
iw.fmuser.org -> hebrajski
hi.fmuser.org -> hindi
hu.fmuser.org -> węgierski
is.fmuser.org -> islandzki
id.fmuser.org -> indonezyjski
ga.fmuser.org -> irlandzki
it.fmuser.org -> włoski
ja.fmuser.org -> japoński
ko.fmuser.org -> koreański
lv.fmuser.org -> łotewski
lt.fmuser.org -> litewski
mk.fmuser.org -> macedoński
ms.fmuser.org -> malajski
mt.fmuser.org -> maltański
no.fmuser.org -> norweski
fa.fmuser.org -> perski
pl.fmuser.org -> polski
pt.fmuser.org -> portugalski
ro.fmuser.org -> rumuński
ru.fmuser.org -> rosyjski
sr.fmuser.org -> serbski
sk.fmuser.org -> słowacki
sl.fmuser.org -> słoweński
es.fmuser.org -> hiszpański
sw.fmuser.org -> suahili
sv.fmuser.org -> szwedzki
th.fmuser.org -> Tajski
tr.fmuser.org -> turecki
uk.fmuser.org -> ukraiński
ur.fmuser.org -> Urdu
vi.fmuser.org -> wietnamski
cy.fmuser.org -> walijski
yi.fmuser.org -> jidysz
(1) Nadmiarowe informacje o sygnale wideo
Biorąc za przykład format komponentu YUV do nagrywania cyfrowego wideo, YUV reprezentuje odpowiednio jasność i dwa sygnały różnicowe kolorów. Na przykład dla istniejącego systemu pal TV częstotliwość próbkowania sygnału luminancji wynosi 13.5 MHz; pasmo częstotliwości sygnału chrominancji stanowi zwykle połowę lub mniej sygnału jasności, czyli 6.75 MHz lub 3.375 MHz. Biorąc na przykład częstotliwość próbkowania 4: 2: 2, sygnał Y przyjmuje 13.5 MHz, sygnał chrominancji U i V są próbkowane z częstotliwością 6.75 MHz, a sygnał próbkowania jest kwantowany przez 8 bitów, a następnie można obliczyć współczynnik kodowania cyfrowego wideo następująco:
13.5 * 8 + 6.75 * 8 + 6.75 * 8 = 216 Mbit / s
Jeśli tak duża ilość danych jest przechowywana lub przesyłana bezpośrednio, trudno będzie zastosować technologię kompresji w celu zmniejszenia szybkości transmisji. Cyfrowy sygnał wideo można kompresować zgodnie z dwoma podstawowymi warunkami:
L. redundancja danych. Na przykład redundancja przestrzenna, redundancja czasowa, redundancja struktury, redundancja entropii informacji itp., To znaczy istnieje silna korelacja między pikselami obrazu. Wyeliminowanie tej nadmiarowości nie prowadzi do utraty informacji i jest to bezstratna kompresja.
L. wizualna redundancja. Niektóre cechy ludzkiego oka, takie jak próg rozróżniania jasności, próg widzenia, różnią się wrażliwością na jasność i nasycenie barwy, co uniemożliwia wprowadzenie odpowiednich błędów w kodowaniu i nie zostaną wykryte. Wizualne cechy ludzkich oczu można wykorzystać do wymiany danych na kompresję z pewnymi obiektywnymi zniekształceniami. Ta kompresja jest stratna.
Kompresja cyfrowego sygnału wideo opiera się na dwóch powyższych warunkach, co powoduje, że dane wideo są silnie kompresowane, co sprzyja transmisji i przechowywaniu. Typowe metody cyfrowej kompresji wideo to kodowanie mieszane, które polega na połączeniu kodowania transformacyjnego, przewidywania ruchu i kompensacji ruchu oraz kodowania entropijnego w celu kompresji kodowania. Zwykle do wyeliminowania nadmiarowości wewnątrzramkowej obrazu stosuje się kodowanie transformacyjne, a przewidywanie ruchu i kompensacja ruchu są wykorzystywane do usuwania nadmiarowości między klatkami obrazu, a kodowanie entropijne jest wykorzystywane do dalszej poprawy wydajności kompresji. Poniżej przedstawiono pokrótce trzy metody kodowania kompresyjnego.
(a) Metoda kodowania kompresji
(b) Kodowanie przekształceń
Funkcją kodowania transformacyjnego jest transformacja sygnału obrazu opisanego w dziedzinie przestrzeni do domeny częstotliwości, a następnie kodowanie transformowanych współczynników. Ogólnie rzecz biorąc, obraz ma silną korelację w przestrzeni, a transformacja do domeny częstotliwości może spowodować dekorelację i koncentrację energii. Wspólna transformata ortogonalna obejmuje dyskretną transformatę Fouriera, dyskretną transformację kosinusową i tak dalej. Dyskretna transformata kosinusowa jest szeroko stosowana w cyfrowej kompresji wideo.
Dyskretna transformata kosinusowa jest nazywana transformacją DCT. Może przekształcić blok obrazu L * l z domeny kosmicznej do domeny częstotliwości. Dlatego w procesie kompresji i kodowania obrazu w oparciu o DCT obraz należy podzielić na nienakładające się bloki obrazu. Załóżmy, że rozmiar obrazu to 1280 * 720, jest on podzielony na bloki obrazu 160 * 90 o rozmiarze 8 * 8 bez nakładania się w postaci siatki. Następnie można przeprowadzić transformację DCT dla każdego bloku obrazu.
Po podzieleniu bloku każdy 8 * 8-punktowy blok obrazu jest wysyłany do kodera DCT, a blok obrazu 8 * 8 jest transformowany z domeny przestrzennej do domeny częstotliwości. Poniższy rysunek przedstawia przykład bloku obrazu 8 * 8, w którym liczba reprezentuje wartość jasności każdego piksela. Na rysunku widać, że wartości jasności każdego piksela w tym bloku obrazu są stosunkowo jednolite, zwłaszcza wartość jasności sąsiednich pikseli nie jest zbyt duża, co wskazuje, że sygnał obrazu ma silną korelację.
Rzeczywisty blok obrazu 8 * 8
Poniższy rysunek przedstawia wyniki transformacji DCT bloku obrazu na powyższym rysunku. Z rysunku widać, że po transformacji DCT, współczynnik niskiej częstotliwości w lewym górnym rogu skupia dużo energii, podczas gdy energia na współczynniku wysokiej częstotliwości w prawym dolnym rogu jest bardzo mała.
Współczynniki bloku obrazu po transformacji DCT
Sygnał należy określić ilościowo po transformacji DCT. Ponieważ ludzkie oczy są wrażliwe na właściwości obrazów o niskiej częstotliwości, takie jak ogólna jasność obiektów, a nie na szczegóły obrazu o wysokiej częstotliwości, więc w procesie transmisji informacje o wysokiej częstotliwości mogą być przesyłane mniej lub nie, tylko część niskoczęstotliwościowa. Proces kwantyzacji ogranicza transmisję informacji poprzez kwantyfikację współczynników obszaru niskich częstotliwości i zgrubną kwantyzację współczynników w obszarze wysokich częstotliwości, co usuwa informacje o wysokich częstotliwościach, które nie są wrażliwe dla ludzkich oczu. Dlatego kwantyzacja jest stratnym procesem kompresji i głównym powodem pogorszenia jakości kodowania kompresji wideo.
Proces kwantyfikacji można wyrazić następującym wzorem:
Wśród nich FQ (U, V) reprezentuje współczynnik DCT po kwantyzacji; f (U, V) reprezentuje współczynnik DCT przed kwantyzacją; Q (U, V) reprezentuje macierz wag kwantyzacji; q jest krokiem kwantyzacji; round odnosi się do konsolidacji, a wartość do wyprowadzenia jest przyjmowana jako najbliższa wartość całkowita.
Wybierz rozsądnie współczynnik kwantyzacji, a wynik po kwantyzacji transformowanego bloku obrazu jest pokazany na rysunku.
Współczynnik DCT po kwantyfikacji
Większość współczynników DCT jest zmieniana na 0 po kwantyzacji, podczas gdy tylko kilka współczynników ma wartości niezerowe. W tej chwili tylko te niezerowe wartości wymagają kompresji i kodowania.
(b) Kodowanie entropii
Kodowanie entropijne jest nazwane, ponieważ średnia długość kodu po zakodowaniu jest bliska wartości entropii źródła. Kodowanie entropii jest realizowane przez VLC (kodowanie o zmiennej długości). Podstawową zasadą jest nadanie krótkiego kodu symbolowi z dużym prawdopodobieństwem w źródle oraz długi kod symbolowi z małym prawdopodobieństwem wystąpienia, tak aby statystycznie otrzymać krótszą średnią długość kodu. Kodowanie o zmiennej długości zwykle obejmuje kod Hoffmana, kod arytmetyczny, kod uruchomienia itp. Kodowanie długości przebiegu jest bardzo prostą metodą kompresji, jego wydajność kompresji nie jest wysoka, ale szybkość kodowania i dekodowania jest duża i nadal jest szeroko stosowana, zwłaszcza po transformacji kodowania, przy użyciu kodowania run-length, daje dobry efekt.
Najpierw należy zeskanować współczynnik AC bezpośrednio po wyjściowym współczynniku DC kwantyzatora w typie Z (jak pokazano na linii strzałki). Skan Z przekształca dwuwymiarowy współczynnik kwantyzacji w jednowymiarową sekwencję, a następnie kontynuuje kodowanie długości serii. Wreszcie, inny kod o zmiennej długości jest używany do kodowania danych po zakończeniu kodowania, na przykład kodowanie Hoffmana. Dzięki tego rodzaju kodowaniu o zmiennej długości efektywność kodowania jest dalej poprawiana.
(c) Przewidywanie ruchu i kompensacja ruchu
Estymacja ruchu i kompensacja ruchu to skuteczne metody eliminowania korelacji kierunku czasu sekwencji obrazów. Opisane powyżej metody transformacji DCT, kwantyzacji i kodowania entropijnego opierają się na jednym obrazie klatki. Dzięki tym metodom można wyeliminować korelację przestrzenną między pikselami obrazu. W rzeczywistości, oprócz korelacji przestrzennej, sygnał obrazu ma korelację czasową. Na przykład w przypadku cyfrowego wideo ze statycznym tłem, takim jak wspólne nadawanie wiadomości i niewielkim ruchem głównej części obrazu, różnica między każdym obrazem jest bardzo mała, a korelacja między obrazami jest bardzo duża. W takim przypadku nie musimy oddzielnie kodować każdego obrazu klatki, a jedynie kodować możemy tylko zmienione części sąsiednich klatek wideo, aby jeszcze bardziej zmniejszyć ilość danych. Ta praca jest realizowana przez przewidywanie ruchu i kompensację ruchu.
Technologia przewidywania ruchu ogólnie dzieli bieżący obraz wejściowy na kilka małych podbloków obrazu, które nie nakładają się na siebie, na przykład rozmiar obrazu klatki wynosi 1280 * 720. Po pierwsze, jest on podzielony na 40 * 45 bloków obrazu z 16 * 16 rozmiarów, które nie nakładają się na siebie w postaci siatki, a następnie, w ramach okna wyszukiwania poprzedniego obrazu lub tego ostatniego obrazu, znajdź blok dla każdego bloku obrazu, aby znaleźć jeden blok obrazu w zakresie okno wyszukiwania Najbardziej podobny blok obrazu. Proces wyszukiwania nazywa się szacowaniem ruchu. Dzięki obliczeniu informacji o położeniu między najbardziej podobnym blokiem obrazu a blokiem obrazu można uzyskać wektor ruchu. W ten sposób bieżący blok obrazu może zostać odjęty od najbardziej podobnego bloku obrazu wskazywanego przez wektor ruchu obrazu odniesienia i można otrzymać blok obrazu szczątkowego. Ponieważ wartość każdego piksela w bloku obrazu resztkowego jest bardzo mała, w kodowaniu kompresji można uzyskać wyższy współczynnik kompresji. Ten proces odejmowania nazywa się kompensacją ruchu.
Ponieważ obraz odniesienia jest potrzebny do przewidywania ruchu i kompensacji ruchu w procesie kodowania, bardzo ważne jest, aby wybrać obraz odniesienia. Ogólnie, koder dzieli wejście obrazu każdej klatki na trzy różne typy zgodnie z różnymi obrazami odniesienia: ramka I (wewnętrzna), ramka B (predykcja naprowadzania) i ramka P (predykcja). Jak pokazano na rysunku.
Typowa sekwencja struktury ramek I, B, P.
Jak pokazano na rysunku, ramka I wykorzystuje tylko dane w ramce do kodowania i nie wymaga przewidywania ruchu i kompensacji ruchu podczas procesu kodowania. Oczywiście, ponieważ ramka I nie eliminuje korelacji kierunku czasu, współczynnik kompresji jest stosunkowo niski. W procesie kodowania ramka P wykorzystuje przednią ramkę I lub ramkę P jako obraz odniesienia do kompensacji ruchu, w rzeczywistości koduje różnicę między bieżącym obrazem a obrazem odniesienia. Tryb kodowania ramki B jest podobny do ramki P, jedyną różnicą jest to, że musi on wykorzystywać przednią ramkę I lub ramkę P i późniejszą ramkę I lub ramkę P do przewidywania podczas procesu kodowania. Zatem każde kodowanie ramki P musi wykorzystywać jeden obraz klatki jako obraz odniesienia, podczas gdy ramka B potrzebuje dwóch ramek jako odniesienia. Natomiast ramka B ma wyższy współczynnik kompresji niż ramka P.
(d) Kodowanie mieszane
W artykule przedstawiono kilka ważnych metod kompresji i kodowania wideo. W praktyce metody te nie są rozdzielane i zwykle łączy się je w celu uzyskania najlepszego efektu kompresji. Poniższy rysunek przedstawia model kodowania hybrydowego (tj. Kodowanie transformacyjne + przewidywanie ruchu i kompensacja ruchu + kodowanie entropijne). Model jest szeroko stosowany w standardach MPEG1, MPEG2, H.264 i innych. Z rysunku widać, że bieżący obraz wejściowy musi być najpierw podzielony na bloki, blok obrazu uzyskany przez blok należy odjąć od przewidywany obraz po kompensacji ruchu w celu uzyskania obrazu różnicowego x, a następnie transformacja DCT i kwantyzacja są przeprowadzane dla bloku obrazu różnicowego. Kwantowane dane wyjściowe mają dwa różne miejsca: jednym jest wysłanie ich do kodera entropijnego w celu zakodowania, a zakodowany strumień kodu jest wysyłany do pamięci podręcznej Zapisz w urządzeniu i czekaj na transmisję. Innym zastosowaniem jest zliczanie ilościowe i odwrócenie zmiany sygnału x ', który dodaje wyjście bloku obrazu z kompensacją ruchu w celu uzyskania nowego sygnału obrazu prognozowania i wysyła nowy blok obrazu prognozowania do pamięci ramki.
|
Wpisz e-mail, aby otrzymać niespodziankę
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> Afrikaans
sq.fmuser.org -> albański
ar.fmuser.org -> arabski
hy.fmuser.org -> Armeński
az.fmuser.org -> Azerbejdżański
eu.fmuser.org -> baskijski
be.fmuser.org -> białoruski
bg.fmuser.org -> bułgarski
ca.fmuser.org -> kataloński
zh-CN.fmuser.org -> chiński (uproszczony)
zh-TW.fmuser.org -> chiński (tradycyjny)
hr.fmuser.org -> chorwacki
cs.fmuser.org -> czeski
da.fmuser.org -> duński
nl.fmuser.org -> holenderski
et.fmuser.org -> estoński
tl.fmuser.org -> filipiński
fi.fmuser.org -> fiński
fr.fmuser.org -> francuski
gl.fmuser.org -> galicyjski
ka.fmuser.org -> gruziński
de.fmuser.org -> niemiecki
el.fmuser.org -> grecki
ht.fmuser.org -> kreolski haitański
iw.fmuser.org -> hebrajski
hi.fmuser.org -> hindi
hu.fmuser.org -> węgierski
is.fmuser.org -> islandzki
id.fmuser.org -> indonezyjski
ga.fmuser.org -> irlandzki
it.fmuser.org -> włoski
ja.fmuser.org -> japoński
ko.fmuser.org -> koreański
lv.fmuser.org -> łotewski
lt.fmuser.org -> litewski
mk.fmuser.org -> macedoński
ms.fmuser.org -> malajski
mt.fmuser.org -> maltański
no.fmuser.org -> norweski
fa.fmuser.org -> perski
pl.fmuser.org -> polski
pt.fmuser.org -> portugalski
ro.fmuser.org -> rumuński
ru.fmuser.org -> rosyjski
sr.fmuser.org -> serbski
sk.fmuser.org -> słowacki
sl.fmuser.org -> słoweński
es.fmuser.org -> hiszpański
sw.fmuser.org -> suahili
sv.fmuser.org -> szwedzki
th.fmuser.org -> Tajski
tr.fmuser.org -> turecki
uk.fmuser.org -> ukraiński
ur.fmuser.org -> Urdu
vi.fmuser.org -> wietnamski
cy.fmuser.org -> walijski
yi.fmuser.org -> jidysz
FMUSER Wirless Transmituj wideo i audio łatwiejsze!
Kontakt
Adres:
Nr 305 Pokój HuiLan Budynek nr 273 Huanpu Road Guangzhou Chiny 510620
Kategorie
Newsletter