FMUSER Wirless Transmituj wideo i audio łatwiejsze!
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> Afrikaans
sq.fmuser.org -> albański
ar.fmuser.org -> arabski
hy.fmuser.org -> Armeński
az.fmuser.org -> Azerbejdżański
eu.fmuser.org -> baskijski
be.fmuser.org -> białoruski
bg.fmuser.org -> bułgarski
ca.fmuser.org -> kataloński
zh-CN.fmuser.org -> chiński (uproszczony)
zh-TW.fmuser.org -> chiński (tradycyjny)
hr.fmuser.org -> chorwacki
cs.fmuser.org -> czeski
da.fmuser.org -> duński
nl.fmuser.org -> holenderski
et.fmuser.org -> estoński
tl.fmuser.org -> filipiński
fi.fmuser.org -> fiński
fr.fmuser.org -> francuski
gl.fmuser.org -> galicyjski
ka.fmuser.org -> gruziński
de.fmuser.org -> niemiecki
el.fmuser.org -> grecki
ht.fmuser.org -> kreolski haitański
iw.fmuser.org -> hebrajski
hi.fmuser.org -> hindi
hu.fmuser.org -> węgierski
is.fmuser.org -> islandzki
id.fmuser.org -> indonezyjski
ga.fmuser.org -> irlandzki
it.fmuser.org -> włoski
ja.fmuser.org -> japoński
ko.fmuser.org -> koreański
lv.fmuser.org -> łotewski
lt.fmuser.org -> litewski
mk.fmuser.org -> macedoński
ms.fmuser.org -> malajski
mt.fmuser.org -> maltański
no.fmuser.org -> norweski
fa.fmuser.org -> perski
pl.fmuser.org -> polski
pt.fmuser.org -> portugalski
ro.fmuser.org -> rumuński
ru.fmuser.org -> rosyjski
sr.fmuser.org -> serbski
sk.fmuser.org -> słowacki
sl.fmuser.org -> słoweński
es.fmuser.org -> hiszpański
sw.fmuser.org -> suahili
sv.fmuser.org -> szwedzki
th.fmuser.org -> Tajski
tr.fmuser.org -> turecki
uk.fmuser.org -> ukraiński
ur.fmuser.org -> Urdu
vi.fmuser.org -> wietnamski
cy.fmuser.org -> walijski
yi.fmuser.org -> jidysz
H.264 lub MPEG-4 Part 2003 (AVC, Advanced Video Coding) to najnowsza generacja standardów kompresji wideo, wprowadzona wspólnie przez Departament Międzynarodowej Normalizacji Telekomunikacyjnej ITU-T i Międzynarodową Organizację Normalizacyjną ISO / IEC w 264 r. Obecnie standard H.XNUMX jest szeroko stosowany w przewodowym / bezprzewodowym zdalnym monitorowaniu wideo, interaktywnych mediach sieciowych, telewizji cyfrowej i wideokonferencjach itp.
Chińska nazwa H.264 + alias MPEG-4 część 10 Standardowy czas kompresji wideo wysokiej jakości w 2003 r
spis treści
1 Podstawowe wprowadzenie
2 Najważniejsze informacje techniczne
Porównanie wydajności 3
Podstawowe wprowadzenie
H.264 to nowe cyfrowe wideo opracowane przez wspólny zespół wideo (JVT: wspólny zespół wideo) VCEG (Video Coding Experts Group) ITU-T i MPEG (Moving Picture Coding Experts Group) ISO / IEC
Serwer wideo
Serwer wideo
Standard kodowania, jest to zarówno ITU-T H.264, jak i ISO / IEC MPEG-4 część 10. Pozyskiwanie projektów rozpoczęto w styczniu 1998 r. Pierwsza wersja została ukończona we wrześniu 1999 r. Model testowy TML-8 został opracowany w maju 2001. Zarząd FCD H.264 został przyjęty na 5. posiedzeniu JVT w czerwcu 2002 r.. Oficjalnie wydany w marcu 2003 roku. Podobnie jak poprzedni standard, H.264 jest również hybrydowym trybem kodowania DPCM plus kodowanie transformacyjne. Jednak przyjmuje prostą konstrukcję „powrotu do podstaw”, bez wielu opcji i uzyskuje znacznie lepszą wydajność kompresji niż H.263 ++; wzmacnia zdolność adaptacji do różnych kanałów, przyjmuje strukturę i składnię przyjazną dla sieci, Sprzyja przetwarzaniu błędów i utracie pakietów; szeroki zakres zastosowań w celu zaspokojenia potrzeb związanych z różnymi prędkościami, różnymi rozdzielczościami i różnymi okazjami do transmisji (przechowywania); jego podstawowy system jest otwarty i do użytkowania nie są wymagane prawa autorskie. Z technicznego punktu widzenia standard H.264 ma wiele zalet, takich jak ujednolicone kodowanie symboli VLC, wysoce precyzyjne, wielomodowe oszacowanie przemieszczenia, transformacja liczb całkowitych oparta na blokach 4 × 4 oraz warstwowa składnia kodowania. Środki te sprawiają, że algorytm H.264 ma bardzo wysoką wydajność kodowania, przy tej samej jakości zrekonstruowanego obrazu może zaoszczędzić około 50% współczynnika kodowania niż H.263. Struktura strumienia kodu H.264 ma dużą zdolność adaptacji do sieci, zwiększa możliwości odzyskiwania po błędzie i może dobrze dostosować się do aplikacji IP i sieci bezprzewodowych.
Najważniejsze informacje techniczne
Projekt warstwowy
Algorytm H.264 można koncepcyjnie podzielić na dwie warstwy: warstwa kodowania wideo (VCL: Video Coding Layer) odpowiada za wydajną reprezentację treści wideo, a warstwa abstrakcji sieci (NAL: Network Abstraction Layer) odpowiada za odpowiedni sposób wymagane przez sieć Spakuj i prześlij dane. Interfejs oparty na pakietach jest zdefiniowany między VCL i NAL, a pakowanie i odpowiednia sygnalizacja są częścią NAL. W ten sposób zadania związane z wysoką wydajnością kodowania i przyjaznością dla sieci są wykonywane odpowiednio przez VCL i NAL. Warstwa VCL zawiera hybrydowe kodowanie kompensacji ruchu oparte na blokach i kilka nowych funkcji. Podobnie jak poprzednie standardy kodowania wideo, H.264 nie zawiera w wersji roboczej funkcji, takich jak przetwarzanie wstępne i przetwarzanie końcowe, co może zwiększyć elastyczność standardu. NAL jest odpowiedzialny za enkapsulację danych przy użyciu formatu segmentu sieci bazowej, w tym ramkowania, sygnalizacji kanałów logicznych, wykorzystania informacji o taktowaniu lub sygnałów końca sekwencji. Na przykład NAL obsługuje formaty transmisji wideo w kanałach z komutacją łączy i obsługuje formaty transmisji wideo w Internecie przy użyciu protokołu RTP / UDP / IP. NAL zawiera własne informacje nagłówkowe, informacje o strukturze segmentu i informacje o rzeczywistym obciążeniu, to znaczy dane VCL wyższej warstwy. (Jeżeli stosowana jest technologia segmentacji danych, dane mogą składać się z kilku części).
Precyzyjne przewidywanie ruchu w wielu trybach
H.264 obsługuje wektory ruchu z dokładnością do 1/4 lub 1/8 piksela. Przy dokładności 1/4 piksela można zastosować filtr 6-odczepowy w celu redukcji szumów o wysokiej częstotliwości. W przypadku wektorów ruchu z dokładnością do 1/8 piksela można zastosować bardziej złożony filtr 8-punktowy. Podczas wykonywania przewidywania ruchu koder może również wybrać „ulepszone” filtry interpolacyjne, aby poprawić efekt przewidywania. W przewidywaniu ruchu w H.264, makroblok (MB) można podzielić na różne podbloki, jak pokazano na rysunku 2, tworząc rozmiary bloków 7 różnych trybów. Ten wielomodowy elastyczny i szczegółowy podział jest bardziej odpowiedni dla kształtu rzeczywistych obiektów poruszających się na obrazie, co znacznie poprawia dokładność przewidywania ruchu. W ten sposób do każdego makrobloku można dołączyć 1, 2, 4, 8 lub 16 wektorów ruchu. W H.264 koder może używać więcej niż jednej poprzedniej ramki do szacowania ruchu, co jest tak zwaną technologią odniesienia wieloramkowego. Na przykład, jeżeli 2 lub 3 ramki są tylko zakodowanymi ramkami odniesienia, koder wybierze lepszą ramkę predykcji dla każdego docelowego makrobloku i wskaże dla każdego makrobloku, która ramka jest używana do przewidywania.
Transformacja liczb całkowitych
H.264 jest podobny do poprzedniego standardu, wykorzystując kodowanie transformacji blokowej dla reszty, ale transformacja jest operacją na liczbach całkowitych, a nie operacją na liczbach rzeczywistych, a jej proces jest zasadniczo podobny do DCT. Zaletą tej metody jest to, że w koderze i dekoderze dozwolone są takie same transformacje precyzyjne i transformacje odwrotne, a także wygodne jest stosowanie prostych operacji na punktach stałych. Innymi słowy, nie ma „odwrotnego błędu transformacji”. Jednostką transformacji są bloki 4 × 4, zamiast powszechnie stosowanych w przeszłości bloków 8 × 8. Ponieważ rozmiar bloku transformacji jest zmniejszony, podział poruszającego się obiektu jest dokładniejszy, dzięki czemu nie tylko wielkość obliczeń transformacji jest mniejsza, ale również znacznie zmniejsza się błąd zbieżności na krawędzi poruszającego się obiektu. Aby metoda transformacji bloku o małym rozmiarze nie generowała różnicy w skali szarości między blokami w większym gładkim obszarze obrazu, współczynnik DC 16 4 × 4 bloków danych jasności makrobloku wewnątrzramkowego (każdy mały blok Jeden , łącznie 16) wykonuje drugą transformację bloku 4 × 4 i wykonuje transformację bloku 2 × 2 na współczynnikach DC 4 bloków 4 × 4 danych chrominancji (po jednym dla każdego małego bloku, łącznie 4).
Aby poprawić zdolność H.264 do sterowania szybkością, zmiana wielkości kroku kwantyzacji jest kontrolowana na poziomie około 12.5%, zamiast stałego wzrostu. Normalizacja amplitudy współczynnika transformacji jest przetwarzana w procesie odwrotnej kwantyzacji w celu zmniejszenia złożoności obliczeniowej. Aby podkreślić wierność koloru, przyjęto mniejszy rozmiar kroku kwantyzacji dla współczynnika chrominancji.
Ujednolicone VLC
Istnieją dwie metody kodowania entropijnego w H.264, jedna polega na użyciu ujednoliconego VLC (UVLC: Universal VLC) dla wszystkich symboli, które mają być zakodowane, a druga polega na użyciu binarnego kodowania arytmetycznego z adaptacją treści (CABAC: Context-Adaptive Binary Kodowanie arytmetyczne). CABAC jest opcjonalny, a jego wydajność kodowania jest nieco lepsza niż UVLC, ale złożoność obliczeniowa jest również wyższa. UVLC używa zestawu słów kodowych o nieograniczonej długości, a struktura projektu jest bardzo regularna, a różne obiekty mogą być kodowane za pomocą tej samej tabeli kodów. Ta metoda może łatwo wygenerować słowo kodowe, a dekoder może łatwo zidentyfikować prefiks słowa kodowego, a UVLC może szybko uzyskać ponowną synchronizację, gdy wystąpi błąd bitowy.
Przewidywanie Intra
W poprzednich standardach serii H.26x i MPEG-x stosowane są metody predykcji międzyramkowej. W H.264 przewidywanie wewnątrzklatkowe jest dostępne podczas kodowania obrazów Intra. Dla każdego bloku 4 × 4 (z wyjątkiem specjalnego traktowania bloku krawędzi) każdy piksel można przewidzieć za pomocą innej ważonej sumy 17 najbliższych wcześniej zakodowanych pikseli (niektóre wagi mogą wynosić 0), to znaczy ten piksel 17 pikseli w lewym górnym rogu bloku. Oczywiście ten rodzaj predykcji wewnątrzramkowej nie jest oparty na czasie, ale algorytmem kodowania predykcyjnego wykonywanym w dziedzinie przestrzennej, który może usunąć przestrzenną nadmiarowość między sąsiednimi blokami i osiągnąć bardziej efektywną kompresję.
Jak pokazano na rysunku 4, a, b, ..., p w kwadracie 4 × 4 to 16 pikseli do przewidzenia, a A, B, ..., P to piksele, które zostały zakodowane. Na przykład wartość punktu m można przewidzieć za pomocą wzoru (J + 2K + L + 2) / 4 lub wzoru (A + B + C + D + I + J + K + L) / 8, itp. Zgodnie z wybranymi punktami odniesienia predykcji, istnieje 9 różnych trybów jasności, ale tylko 1 tryb do przewidywania nasycenia barwy.
Do środowisk IP i bezprzewodowych
Wersja robocza H.264 zawiera narzędzia do eliminacji błędów w celu ułatwienia transmisji skompresowanego wideo w środowisku z częstymi błędami i utratą pakietów, takie jak niezawodność transmisji w kanałach mobilnych lub kanałach IP. Aby przeciwdziałać błędom transmisji, synchronizacja czasu w strumieniu wideo H.264 może być zrealizowana przy użyciu odświeżania obrazu wewnątrzklatkowego, a synchronizacja przestrzenna jest obsługiwana przez kodowanie o strukturze plastra. Jednocześnie, aby ułatwić ponowną synchronizację po błędzie bitowym, w danych wideo obrazu zapewniony jest również pewien punkt ponownej synchronizacji. Ponadto, wewnątrzramkowe odświeżanie makrobloków i wiele makrobloków odniesienia pozwalają koderowi brać pod uwagę nie tylko wydajność kodowania, ale także charakterystykę kanału transmisyjnego podczas określania trybu makrobloku.
Oprócz wykorzystania zmiany rozmiaru kroku kwantyzacji w celu dostosowania do współczynnika kodowania kanału, w H.264 często stosuje się metodę segmentacji danych, aby poradzić sobie ze zmianą współczynnika kodowania kanału. Mówiąc ogólnie, koncepcja segmentacji danych polega na generowaniu danych wideo z różnymi priorytetami w koderze w celu wspierania jakości usług QoS w sieci. Na przykład, metoda partycjonowania danych oparta na składni jest stosowana w celu podzielenia danych z każdej ramki na kilka części zgodnie z ich ważnością, co pozwala na odrzucenie mniej ważnych informacji w przypadku przepełnienia bufora. Można również zastosować podobną metodę czasowego podziału danych, która jest realizowana przy użyciu wielu ramek odniesienia w ramkach P i B.
W zastosowaniu komunikacji bezprzewodowej możemy obsługiwać duże zmiany przepływności kanału bezprzewodowego poprzez zmianę precyzji kwantyzacji lub rozdzielczości przestrzenno-czasowej każdej ramki. Jednak w przypadku multiemisji nie można wymagać, aby koder odpowiadał na różne szybkości transmisji. Dlatego w przeciwieństwie do metody FGS (Fine Granular Scalability) używanej w MPEG-4 (z niższą wydajnością), H.264 wykorzystuje ramki SP z przełączaniem strumienia zamiast kodowania hierarchicznego.
Porównanie wydajności
TML-8 to test dla H.264. PSNR dostarczony przez wyniki testów wyraźnie pokazał, że w porównaniu z wydajnością MPEG-4 (ASP: Advanced Simple Profile) i H.263 ++ (HLP: High Latency Profile), wyniki H.264 mają oczywiste zalety.
PSNR H.264 jest oczywiście lepszy niż MPEG-4 (ASP) i H.263 ++ (HLP). W teście porównawczym 6 prędkości PSNR H.264 jest średnio o 2 dB wyższy niż MPEG-4 (ASP). Jest średnio o 3dB wyższy niż H.263 (HLP). Sześć szybkości testowych i związane z nimi warunki to: szybkość 6 kbit / s, szybkość klatek 32 f / s i format QCIF; Szybkość 10 kbit / s, szybkość klatek 64f / s i format QCIF; Szybkość 15 kbit / s, szybkość klatek 128f / s i format CIF; Szybkość 15 kbit / s, szybkość klatek 256f / s i format QCIF; Szybkość 15 kbit / s, szybkość klatek 512f / s i format CIF; Szybkość 30 kbit / s, szybkość klatek 1024f / s i format CIF.
|
Wpisz e-mail, aby otrzymać niespodziankę
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> Afrikaans
sq.fmuser.org -> albański
ar.fmuser.org -> arabski
hy.fmuser.org -> Armeński
az.fmuser.org -> Azerbejdżański
eu.fmuser.org -> baskijski
be.fmuser.org -> białoruski
bg.fmuser.org -> bułgarski
ca.fmuser.org -> kataloński
zh-CN.fmuser.org -> chiński (uproszczony)
zh-TW.fmuser.org -> chiński (tradycyjny)
hr.fmuser.org -> chorwacki
cs.fmuser.org -> czeski
da.fmuser.org -> duński
nl.fmuser.org -> holenderski
et.fmuser.org -> estoński
tl.fmuser.org -> filipiński
fi.fmuser.org -> fiński
fr.fmuser.org -> francuski
gl.fmuser.org -> galicyjski
ka.fmuser.org -> gruziński
de.fmuser.org -> niemiecki
el.fmuser.org -> grecki
ht.fmuser.org -> kreolski haitański
iw.fmuser.org -> hebrajski
hi.fmuser.org -> hindi
hu.fmuser.org -> węgierski
is.fmuser.org -> islandzki
id.fmuser.org -> indonezyjski
ga.fmuser.org -> irlandzki
it.fmuser.org -> włoski
ja.fmuser.org -> japoński
ko.fmuser.org -> koreański
lv.fmuser.org -> łotewski
lt.fmuser.org -> litewski
mk.fmuser.org -> macedoński
ms.fmuser.org -> malajski
mt.fmuser.org -> maltański
no.fmuser.org -> norweski
fa.fmuser.org -> perski
pl.fmuser.org -> polski
pt.fmuser.org -> portugalski
ro.fmuser.org -> rumuński
ru.fmuser.org -> rosyjski
sr.fmuser.org -> serbski
sk.fmuser.org -> słowacki
sl.fmuser.org -> słoweński
es.fmuser.org -> hiszpański
sw.fmuser.org -> suahili
sv.fmuser.org -> szwedzki
th.fmuser.org -> Tajski
tr.fmuser.org -> turecki
uk.fmuser.org -> ukraiński
ur.fmuser.org -> Urdu
vi.fmuser.org -> wietnamski
cy.fmuser.org -> walijski
yi.fmuser.org -> jidysz
FMUSER Wirless Transmituj wideo i audio łatwiejsze!
Kontakt
Adres:
Nr 305 Pokój HuiLan Budynek nr 273 Huanpu Road Guangzhou Chiny 510620
Kategorie
Newsletter