H264 podstawowe zasady

Przedmowa
Algorytm kompresji wideo H264 jest obecnie niewątpliwie najczęściej używaną i najpopularniejszą ze wszystkich technik kompresji wideo. Wraz z wprowadzeniem bibliotek open source, takich jak x264 / openh264 i ffmpeg, większość użytkowników nie musi już przeprowadzać zbyt wielu badań nad szczegółami H264, co znacznie obniża koszty osób używających H264.

Aby jednak dobrze wykorzystać H264, musimy jeszcze zrozumieć podstawowe zasady H264. Dzisiaj przyjrzymy się podstawowym zasadom H264.

Technologia kompresji H264 wykorzystuje głównie następujące metody kompresji danych wideo. zawierać:

Kompresja z predykcją wewnątrzklatkową rozwiązuje problem nadmiarowości danych przestrzennych.
Kompresja predykcji międzyramkowej (szacowanie i kompensacja ruchu) rozwiązuje problem nadmiarowości danych w dziedzinie czasu.
Całkowita dyskretna transformata kosinusowa (DCT), która przekształca korelację przestrzenną na nieistotne dane w dziedzinie częstotliwości, a następnie ją kwantyzuje.
Kompresja CABAC.
Skompresowana ramka jest podzielona na: ramkę I, ramkę P i ramkę B:

Klatka I: klatka kluczowa, wykorzystująca technologię kompresji wewnątrzramkowej.
Ramka P: ramka odniesienia do przodu, podczas kompresji, odnosi się tylko do poprzednio przetworzonej ramki. Użyj technologii kompresji dźwięku ramki.
Ramka B: dwukierunkowa ramka odniesienia. Podczas kompresji odnosi się do poprzedniej klatki i następnej klatki. Korzystanie z technologii kompresji międzyramkowej.
Oprócz ramek I / P / B istnieją również sekwencje obrazów GOP.

GOP: Pomiędzy dwiema klatkami I znajduje się sekwencja obrazów, aw sekwencji obrazów jest tylko jedna klatka I. Jak pokazano niżej:

Technologia kompresji H264
Podstawowa zasada działania H264 jest w rzeczywistości bardzo prosta, opiszmy pokrótce proces kompresji danych H264. Klatki wideo przechwycone przez kamerę (obliczane przy 30 klatkach na sekundę) są wysyłane do bufora kodera H264. Koder musi najpierw podzielić makrobloki dla każdego obrazu.

Makroblok partycji
H264 domyślnie używa obszaru 16X16 jako makrobloku i można go również podzielić na rozmiar 8X8.

Analogicznie obliczana jest wartość piksela każdego makrobloku w obrazie, a wszystkie makrobloki są przetwarzane w następujący sposób.

Podblok
H264 wykorzystuje makrobloki 16X16 dla stosunkowo płaskich obrazów. Jednak w celu uzyskania wyższego stopnia kompresji mniejsze podbloki można również podzielić na makrobloki 16X16. Rozmiar podbloku może wynosić 8X16, 16X8, 8X8, 4X8, 8X4, 4X4, co jest bardzo elastyczne.

Na powyższym obrazku większość makrobloków 16X16 w czerwonej ramce ma niebieskie tło, a część obrazu trzech orłów jest narysowana w tym makrobloku. Aby lepiej przetworzyć częściowe obrazy trzech orłów, H264 Wiele podbloków podzielono na makrobloki 16X16.

W ten sposób, po kompresji wewnątrzramkowej, można uzyskać wydajniejsze dane. Poniższy rysunek jest wynikiem kompresji powyższych makrobloków przy użyciu odpowiednio mpeg-2 i H264. Lewa połowa jest wynikiem kompresji po podziale na podblok MPEG-2, a prawa połowa jest wynikiem kompresji podbloku H264. Widać, że metoda podziału H264 ma więcej zalet.

Po podzieleniu bloku makr, wszystkie obrazy w buforze kodera H264 można pogrupować.

Grupowanie ramek
W przypadku danych wideo występują głównie dwa typy nadmiarowości danych, jeden to redundancja danych w czasie, a drugi to redundancja danych w przestrzeni. Wśród nich największa jest redundancja danych w czasie. Porozmawiajmy najpierw o problemie redundancji czasu danych wideo.

Dlaczego nadmiar czasu jest największy? Zakładając, że kamera rejestruje 30 klatek na sekundę, dane z tych 30 klatek są w większości powiązane. Możliwe jest również, że ponad 30 ramek danych, dziesiątki ramek lub setki ramek danych jest szczególnie ściśle powiązanych.

W rzeczywistości dla tych bardzo ściśle powiązanych ramek musimy zapisać tylko jedną ramkę danych, a inne klatki można przewidzieć na podstawie tej ramki zgodnie z określonymi regułami, więc dane wideo mają największą nadmiarowość czasową.

Aby to osiągnąć, odpowiednie klatki kompresują dane metodą predykcji, konieczne jest pogrupowanie klatek wideo. Jak więc ustalić, że pewne klatki są blisko spokrewnione i można je grupować? Spójrzmy na przykład. Poniżej znajduje się przechwycona klatka wideo przedstawiająca grupę w ruchu kul bilardowych. Kule bilardowe toczą się z prawego górnego rogu do lewego dolnego rogu.

Koder H264 za każdym razem pobierze dwie sąsiednie ramki, aby porównać makrobloki w celu obliczenia podobieństwa tych dwóch ramek. Jak pokazano niżej:

Poprzez skanowanie makrobloków i wyszukiwanie makrobloków można stwierdzić, że korelacja między dwiema ramkami jest bardzo wysoka. Ponadto stwierdzono, że stopień korelacji tej grupy ramek jest bardzo wysoki. Dlatego powyższe ramki można podzielić na jedną grupę. Algorytm jest następujący: na sąsiednich obrazach piksele, które są ogólnie różne, mieszczą się w granicach 10%, różnica jasności nie przekracza 2%, a różnica chromatyczności zmienia się tylko w granicach 1%. Myślimy, że wykresy można grupować razem.

W takiej grupie ramek po zakodowaniu zachowujemy tylko pełne dane z pierwszego postu, a pozostałe ramki obliczamy odwołując się do poprzedniej ramki. Pierwszą ramkę ramki IDR / I nazywamy ramką, a inne ramki nazywamy ramką P / B, więc grupę zakodowanych ramek danych nazywamy GOP.

Szacowanie ruchu i kompensacja
Po zgrupowaniu ramek w koderze H264 należy obliczyć wektory ruchu obiektów w grupie ramek. Biorąc jako przykład powyższą ruchomą bilardową klatkę wideo, przyjrzyjmy się, jak oblicza ona wektor ruchu.

Koder H264 najpierw pobiera kolejno dwie klatki danych wideo z nagłówka bufora, a następnie wykonuje skanowanie makrobloków. W przypadku znalezienia obiektu na jednym ze zdjęć wyszukiwanie odbywa się w pobliżu drugiego zdjęcia (w oknie wyszukiwania). Jeśli obiekt znajduje się w tym momencie na innym obrazie, można obliczyć wektor ruchu obiektu. Poniższy rysunek przedstawia pozycję kuli bilardowej po przeszukaniu.

Poprzez różnicę między położeniami kul bilardowych na powyższym obrazku można obliczyć kierunek i odległość obrazu stołu. H264 rejestruje po kolei odległość i kierunek ruchu piłki w każdej klatce i wygląda następująco.

Po obliczeniu wektora ruchu ta sama część (czyli część zielona) jest odejmowana w celu uzyskania danych kompensacji. W końcu musimy tylko skompresować i zapisać dane kompensacji, a następnie oryginalny obraz można przywrócić podczas dekodowania. Skompresowane dane muszą zawierać tylko niewielką ilość danych. Następująco:

Wektor ruchu i kompensację nazywamy technologią kompresji międzyklatkowej, która rozwiązuje problem nadmiarowości danych w klatkach wideo w czasie. Oprócz kompresji międzyramkowej kompresja danych musi być również wykonywana w ramce. Kompresja danych wewnątrzramkowych rozwiązuje nadmiarowość danych przestrzennych. Teraz przedstawimy technologię kompresji wewnątrzramkowej.

Przewidywanie Intra
Oko ludzkie ma pewien stopień rozpoznawania obrazu, jest bardzo wrażliwe na jasność o niskiej częstotliwości i nie jest zbyt wrażliwe na jasność o wysokiej częstotliwości. Dlatego, na podstawie niektórych badań, dane, które nie są wrażliwe na ludzkie oczy, można usunąć z obrazu. W ten sposób proponowana jest technologia przewidywania intra.

Kompresja wewnątrzklatkowa H264 jest bardzo podobna do JPEG. Po podzieleniu obrazu na makrobloki, każdy makroblok można przewidzieć w 9 trybach. Znajdź tryb przewidywania, który jest najbliższy oryginalnemu obrazowi.

Poniższy obraz przedstawia proces przewidywania każdego makrobloku na całym obrazie.

Porównanie obrazu po przewidywaniu intra z obrazem oryginalnym wygląda następująco:

Następnie odejmuje się obraz pierwotny i obraz przewidywany w czasie, aby otrzymać wartość rezydualną.

Następnie zapisz informacje o trybie przewidywania, które otrzymaliśmy wcześniej, abyśmy mogli przywrócić oryginalny obraz podczas dekodowania. Efekt jest następujący:

Po kompresji wewnątrzklatkowej i międzyklatkowej, chociaż ilość danych jest znacznie zmniejszona, wciąż jest miejsce na optymalizację.

Wykonaj DCT na pozostałych danych
Pozostałe dane mogą zostać poddane całkowitej dyskretnej transformacji kosinusowej w celu usunięcia korelacji danych i dalszej kompresji danych. Jak pokazano na poniższym rysunku, lewa strona to makroblok oryginalnych danych, a prawa strona to makroblok obliczonych danych resztkowych.

Makroblok pozostałych danych jest digitalizowany, jak pokazano na poniższym rysunku:

Po zakończeniu DCT to nie wystarczy, a CABAC jest potrzebny do bezstratnej kompresji.

KABAK
Powyższa kompresja wewnątrzklatkowa jest techniką kompresji stratnej. Innymi słowy, po skompresowaniu obrazu nie można go całkowicie przywrócić. CABAC to technologia bezstratnej kompresji.

Technologia kompresji bezstratnej może być najbardziej znana każdemu to kodowanie Huffmana, krótki kod dla słów o wysokiej częstotliwości, długi kod dla słów o niskiej częstotliwości, aby osiągnąć cel kompresji danych. VLC używany w MPEG-2 jest tego rodzaju algorytmem, bierzemy AZ jako przykład, A należy do danych o wysokiej częstotliwości, a Z do danych o niskiej częstotliwości. Zobacz, jak to się robi.

CABAC to także krótki kod dla danych o wysokiej częstotliwości i długi kod dla danych o niskiej częstotliwości. Jednocześnie kompresuje się na podstawie kontekstu, co jest znacznie wydajniejsze niż VLC. Efekt jest następujący:

Z powyższego obrazu jasno wynika, że schemat bezstratnej kompresji wykorzystujący CACBA jest znacznie wydajniejszy niż VLC.

streszczenie
W tym momencie zakończyliśmy zasadę kodowania H264. W tym artykule omówiono głównie następujące kwestie:
1. Jianyin przedstawił kilka podstawowych pojęć w H264. Takich jak ramka I / P / B, GOP.
2. Szczegółowo wyjaśnił podstawowe zasady kodowania H264, w tym:

Podział makr
Grupowanie obrazów
Zasada technologii kompresji wewnątrzramkowej
Zasada technologii kompresji międzyramkowej.
DCT
Zasada kompresji CABAC.

Jak daleko (długie) pokrywy nadajnika?

Zasięg transmisji zależy od wielu czynników. Prawdziwy odległość jest oparta na antenie instalowania wysokość, wzmocnienia anteny, przy użyciu środowiska jak budowa i inne przeszkody, czułość odbiornika, anteny odbiornika. Instalacja anteny wyższsokiego i używania na wsi, odległość będzie znacznie bardziej daleko.

Przykład 5W Nadajnik FM używać w mieście i rodzinnego:

Mam użytku klienta 5W nadajnik FM z anteną GP USA w swoim rodzinnym mieście, a on przetestować go z samochodu, to pokrycie 10km (6.21mile).

Przetestować nadajnik FM 5W z anteną GP w moim rodzinnym mieście, to pokrycie około 2km (1.24mile).

Przetestować nadajnik FM 5W z anteną GP w mieście Guangzhou, obejmować tylko o 300meter (984ft).

Poniżej przedstawiamy przybliżony zakres różnych nadajników FM moc. (Zakres wynosi średnica)

0.1W ~ 5W Nadajnik FM: 100M ~ 1KM

5W ~ 15W FM Ttransmitter: 1KM ~ 3KM

15W ~ 80W Nadajnik FM: 3KM ~ 10KM

80W ~ 500W Nadajnik FM: 10KM ~ 30KM

500W ~ 1000W Nadajnik FM: 30KM ~ 50KM

1KW ~ 2KW Nadajnik FM: 50KM ~ 100KM

2KW ~ 5KW Nadajnik FM: 100KM ~ 150KM

5KW ~ 10KW Nadajnik FM: 150KM ~ 200KM

Jak się z nami skontaktować dla nadajnika?

Zadzwoń do mnie + 8618078869184 LUB
Napisz do mnie [email chroniony]
1.How ile chcesz na pokrycie średnicy?
2.How wieża wysoki z was?
3.Where jesteś?
A my daje bardziej profesjonalnej porady.

O nas

FMUSER.ORG to firma zajmująca się integracją systemów, koncentrująca się na bezprzewodowej transmisji radiowej / studyjnym sprzęcie audio wideo / transmisji strumieniowej i przetwarzaniu danych. Zapewniamy wszystko, od doradztwa i doradztwa, poprzez integrację szaf, po instalację, uruchomienie i szkolenie.

Oferujemy nadajnik FM, nadajnik telewizji analogowej, cyfrowy nadajnik telewizyjny, nadajnik VHF UHF, anteny, koncentryczne złącza kablowe, STL, przetwarzanie na powietrzu, produkty nadawcze dla Studio, monitorowanie sygnałów RF, kodery RDS, procesory audio i jednostki zdalnego sterowania, Produkty IPTV, koder / dekoder wideo / audio, zaprojektowane tak, aby spełniać potrzeby zarówno dużych międzynarodowych sieci nadawczych, jak i małych stacji prywatnych.

Nasze rozwiązanie obejmuje stację radiową FM / analogową stację telewizyjną / cyfrową stację telewizyjną / sprzęt do studia audio-wideo / łącze nadajnika studyjnego / system telemetrii nadajnika / system telewizji hotelowej / IPTV nadawanie na żywo / transmisja strumieniowa na żywo / konferencja wideo / system transmisji CATV.

Korzystamy z zaawansowanych technologicznie produktów dla wszystkich systemów, ponieważ wiemy, że wysoka niezawodność i wysoka wydajność są tak ważne dla systemu i rozwiązania. Jednocześnie musimy upewnić się, że nasz system produktów jest w bardzo rozsądnej cenie.

Mamy klientów nadawców publicznych i komercyjnych, operatorów telekomunikacyjnych i organów regulacyjnych, a także oferujemy rozwiązania i produkty wielu setkom mniejszych, lokalnych i społecznościowych nadawców.

FMUSER.ORG eksportuje od ponad 15 lat i ma klientów na całym świecie. Dzięki 13-letniemu doświadczeniu w tej dziedzinie mamy profesjonalny zespół do rozwiązywania wszelkiego rodzaju problemów klientów. Poświęciliśmy się dostarczaniu wyjątkowo rozsądnych cen profesjonalnych produktów i usług. Kontaktowy adres e-mail: [email chroniony]

Nasza fabryka

Praca IT modernizacja fabrycznie. Zapraszamy do odwiedzenia naszej fabryki, gdy przyjdziesz do Chin.

Obecnie, nie są już klienci 1095 dookoła świata odwiedził nasze biuro Guangzhou Tianhe. Jeśli przyjdziesz do Chin, zapraszamy do odwiedzenia nas.

Na targach

To jest nasz udział w 2012 globalne źródeł Hong Kong Electronics Fair . Klienci z całego świata wreszcie mamy szansę razem.

Gdzie jest Fmuser?

Możesz wyszukiwać te numery " 23.127460034623816,113.33224654197693 ”na mapie google, możesz znaleźć nasze biuro fmuser.

biuro FMUSER Guangzhou znajduje się w dzielnicy Tianhe, który jest centrum Kantonu , Bardzo Blisko do Canton Fair , dworzec kolejowy w Kantonie, xiaobei drogowego i dashatou , potrzebuje tylko 10 minut jeśli wziąć TAXI , Witamy przyjaciół z całego świata do odwiedzenia i negocjować.

Kontakt: Sky Blue
Telefon komórkowy: + 8618078869184
WhatsApp: + 8618078869184
Wechat: + 8618078869184
E-mail: [email chroniony]
QQ: 727926717
Skype: sky198710021
Adres: No.305 pokoju Huilan budynku No.273 Huanpu drogowe Guangzhou Chiny Kod pocztowy: 510620

Język angielski: Akceptujemy wszystkie płatności, takie jak PayPal, karta kredytowa, Western Union, Alipay, Money Bookers, T / T, LC, DP, DA, OA, Payoneer, jeśli masz jakiekolwiek pytania, skontaktuj się ze mną [email chroniony] lub WhatsApp + 8618078869184

PayPal.  www.paypal.com

Zalecamy używanie Paypal kupić nasze przedmioty, PayPal to bezpieczny sposób na zakup w Internecie.

Każdy element naszej listy na górze strony dolnej posiada paypal logo, aby zapłacić.

Karta kredytowa.Jeśli nie masz paypal, ale nie masz karty kredytowej, możesz także kliknąć żółty przycisk PayPal, aby zapłacić kartą kredytową.

-------------------------------------------------- -------------------

Ale jeśli nie masz karty kredytowej i nie mają konta PayPal lub trudne do GOT paypal rozliczeniowej, można użyć następujących:
Western Union.  www.westernunion.com

Zapłać przez Western Union do mnie:

Imię / Imię: Yingfeng
Nazwisko / imię / nazwisko: Zhang
Pełne imię i nazwisko: Yingfeng Zhang
Kraj: Chiny
Miasto: Guangzhou

-------------------------------------------------- -------------------

T / T.  Płacić przez T / T (przelew / telegraficzny transferu / Przelew)
Pierwsze INFORMACJE BANKOWE (KONTO FIRMY):

SWIFT BIC: BKCHHKHHXXX
Nazwa banku: BANK OF CHINY (HONG KONG) LIMITED, HONG KONG
Adres banku: BANK OF CHINA TOWER, 1 GARDEN ROAD, CENTRAL, HONG KONG
KOD BANKU: 012
Nazwa konta: FMUSER INTERNATIONAL GROUP LIMITED
Nr konta. : 012-676-2-007855-0

-------------------------------------------------- -------------------
DRUGA DANE BANKU (KONTO FIRMY):
Beneficjent: Fmuser International Group Inc
Numer konta: 44050158090900000337
Bank beneficjenta: China Construction Bank Guangdong Branch
Kod SWIFT: PCBCCNBJGDX
Adres: NO.553 Tianhe Road, Guangzhou, Guangdong, dystrykt Tianhe, Chiny
**Uwaga: Kiedy przelewasz pieniądze na nasze konto bankowe, NIE WPISZ niczego w polu uwag, w przeciwnym razie nie będziemy mogli otrzymać płatności ze względu na politykę rządu dotyczącą handlu międzynarodowego.

* To zostanie wysłany w 1-2 dni roboczych gdy zapłata jasna.

* Wyślemy go do paypal adres. Jeśli chcesz zmienić adres, prosimy o przesłanie poprawnego adresu i numeru telefonu na mojego maila [email chroniony]

* W przypadku pakietów jest poniżej 2kg będziemy wysłane pocztą zwykłą pocztą lotniczą, to zajmie około 15-25days do ręki.

Jeśli pakiet jest więcej niż 2kg, wysyłamy przez EMS, DHL, UPS, FedEx szybka dostawa ekspresowa, zajmie około 7 ~ 15days do ręki.

Jeśli pakiet ponad 100kg wyślemy za pośrednictwem DHL lub frachtu lotniczego. To zajmie około 3 ~ 7days do ręki.

Wszystkie pakiety są formą Chiny Guangzhou.

* Paczka zostanie wysłana jako "prezent" i zadeklaruj jak najmniej, kupujący nie musi płacić za "PODATEK".

* Po statku, wyślemy Ci wiadomość e-mail, a dam wam tropi liczbę.

Gwarancja.
Skontaktuj się z nami --- >> Zwróć przedmiot do nas --- >> Odbierz i wyślij kolejną wymianę.

Nazwa: Liu Xiaoxia
Adres: 305Fang HuiLanGe HuangPuDaDaoXi 273Hao TianHeQu Guangzhou Chiny.
Pocztowy: 510620
Telefon: + 8618078869184

Proszę zwrócić na ten adres i napisz swój paypal adres, nazwa, problem na notatki: