600 likes | 727 Views
MPEG-4 Ein Überblick. Vortrag in der Projektgruppe „Verteilte Multimedia-Serversysteme“ WS 00/01. Gliederung. Einführung. Visual. Audio. DMIF. Systems. Profiles. Wiederholung. Technik von MPEG-2: Intraframe-Codierung DCT, RLE Interframe-Codierung Motion Compensation
E N D
MPEG-4Ein Überblick Vortrag in der Projektgruppe „Verteilte Multimedia-Serversysteme“ WS 00/01
Gliederung Einführung Visual Audio DMIF Systems Profiles
Wiederholung • Technik von MPEG-2: • Intraframe-Codierung • DCT, RLE • Interframe-Codierung • Motion Compensation • I-, P-, B-Frames • hierarchische Codierung • Base Layer • Enhancement Layer Einführung Visual Audio DMIF Systems Profiles
Überblick (1) • offizielle Bezeichnung: ISO/IEC 14496 • Lizenzierung kostenpflichtig • Tools auf CD-ROM für $40 erhältlich • fertiggestellt im Oktober 1998 • Anfang 1999: internationaler Standard • Ende 1999: MPEG-4 Version 2 • nur Erweiterungen, keine Veränderungen • neue Erweiterungen in Arbeit Einführung Visual Audio DMIF Systems Profiles
Überblick (2) • MPEG2 Kompression von Videodaten • MPEG4 erweiterte Funktionalität • Kompression • Flexibilität • keine Festlegung auf bestimmtes Verfahren • oft nur Interfaces standardisiert • stattdessen: Sammlung verschiedener Tools Einführung Visual Audio DMIF Systems Profiles
Anwendungen • Videos • Fußball im Pay-TV • nicht bezahlt: kein Ball • bezahlt: Ball erscheint • Mobilfunk • Internettelefonie • Interaktive Videospiele • Videokonferenzen Einführung Visual Audio DMIF Systems Profiles
Zielgruppen • Autoren • Wiederverwendbarkeit • Flexibilität • Rechteverwaltung • Netzwerkbetreuer • Framework - „Unterbau“ muss vom Netzwerkbetreiber bereitgestellt werden • Endbenutzer • hohes Maß an Interaktivität • Qualität auch bei niedrigen Bitraten • Fehlerrobustheit mobil Einführung Visual Audio DMIF Systems Profiles
Grundidee • Szene wird in „Einheiten“ unterteilt • Media Objects • Zusammensetzung der Media Objects wird gespeichert • Szenengraph Einführung Visual Audio DMIF Systems Profiles
Media Objects • Video Objects • Natural • Kamera • Synthetic • computergeneriert • Audio Objects • Natural • Mikrofon • Synthetic • computergeneriert Einführung Visual Audio DMIF Systems Profiles
scene Person 2D Background Video voice picture Szenengraph (1) • Szenengraph sorgt für korrekte Positionierung der Media Objects • räumlich • zeitlich • Realisiert durch gerichteten, azyklischen Graphen Einführung Visual Audio DMIF Systems Profiles
Szenengraph (2) • jedes Media Object besitzt ein eigenes Koordinatensystem • Szenengraph verfügt selbst auch über ein Koordinatensystem • durch Berechnung: „virtuelle Kamera“ möglich • Blickwinkel • Ausschnitt Einführung Visual Audio DMIF Systems Profiles
„komplette“ Person Hierarchie • Media Objects einer Szene sind hierarchisch sortiert • Blätter: Primitive Media Objects • Still Images - unbewegte Bilder (z. B. Hintergrund) • Video Objects (z. B. Person) • Audio Objects (z. B. Stimme) Bild einer Person Stimme einer Person Einführung Visual Audio DMIF Systems Profiles
Streams • MPEG-Standards basieren auf Datenströmen (Streams) • in MPEG-2 drei Arten von Streams • Packetized Elementary Stream • Audio- oder Videostrom (in Pakete aufgeteilt) • Program Stream • „Programme“ codiert als PES • Anwendungen ohne Fehler (DVD, ...) • Transport Stream • für unsichere Übertragungskanäle Einführung Visual Audio DMIF Systems Profiles
Übertragung • Sender • Objekte komprimieren • 1 Primitive Media Object 1 Stream • Zusammenfassen zu einem Stream (Multiplex) • Empfänger • Stream trennen (Demultiplex) • in Elementary Streams zerlegen • Objekte einlesen (Decode) • Szenengraph einlesen • 1 Elementary Stream (Decode) • Zusammensetzen (Composition) und Aufbauen (Rendering) der Szene Einführung Visual Audio DMIF Systems Profiles
Aufbauen der Szene Decompression Layer Synchronisation Layer Delivery Layer Schichtenmodell Dekodieren der Datenströme Zeitstempel Fehlerkorrektur Datenempfang Demultiplex Netzwerk / CD / Kabel
. . . Scene Graph Aufbauen einer Szene Media Objects Composition Rendering Synchronisation Layer Einführung Visual Audio DMIF Systems Profiles
Gliederung Einführung Visual Audio DMIF Systems Profiles
Visual • Kodierung von visuellen Objekten in natürlichen und synthetischen, bewegten Bildern • Verknüpfung mit Ton möglich • Ziel: • breites Anwendungsfeld • effiziente Komprimierung erreichen Einführung Visual Audio DMIF Systems Profiles
Videoformate • Bitraten • min. 5kbit/s • max. 10 Mbit/s • Formate • progressive • interlaced • Auflösungen • min. sub-QCIF (172 x 144 Pixel) • max. > HDTV (1440 x 1152 Pixel) Einführung Visual Audio DMIF Systems Profiles
„Content-based“ Funktionalität • Video Objects einzeln kodiert • Random Access auf einzelnen Objekten • play, pause, forward, ... • Manipulation einzelner Video Objects • Bsp.: Text auf sich bewegendes Video Object legen Einführung Visual Audio DMIF Systems Profiles
Skalierbarkeit (1) • Complexity Scalability (Encoder) • Streams verschiedener Komplexität erzeugen • Complexity Scalability (Decoder) • festen Stream in verschiedenen Komplexitätsstufen abspielen • schwache Decoder decodieren nur Teil des Streams Einführung Visual Audio DMIF Systems Profiles
Skalierbarkeit (2) • Spatial Scalability (Decoder) • Auflösung einzelner Video Objects skalierbar • Temporal Scalability (Decoder) • nicht alle Frames werden wiedergegeben • Quality Scalability (Encoder) • Benutzung verschiedener Layer (s. MPEG-2) Einführung Visual Audio DMIF Systems Profiles
Natural Video Objects • natürliches Video Object besteht aus folgenden Informationen: • Form (shape) • Texturen (texture) • Bewegungsinformationen (motion) • zusätzliche Kompressionsmöglichkeit: • Sprite Coding Einführung Visual Audio DMIF Systems Profiles
0 0 0 255 0 0 0 0 0 255 255 255 0 0 0 255 255 255 255 255 0 255 255 255 255 255 255 255 Shape Coding • Binary Shape Coding • Matrix (Binary Alpha Map) • definiert, ob Pixel zu Objekt gehört • 0 - liegt nicht drin • 255 - liegt drin • Alpha Shape Coding • definiert Transparenz • Wert zwischen 0 (transparent) und 255 (undurchsichtig) Einführung Visual Audio DMIF Systems Profiles
Texture Coding • gleiche Kodierung wie bei MPEG-2 • Diskrete Kosinustransformation (DCT) • Quantisierung • Mapping auf 2D-/3D-Oberflächen möglich • spezielle Transformation (Wavelet) Einführung Visual Audio DMIF Systems Profiles
Zeit Motion Coding • Motion Compensation • Ähnlichkeiten in Bildfolgen ausnutzen P-VOP B-VOP I-VOP Einführung Visual Audio DMIF Systems Profiles
Sprite Coding • Hintergrund (Sprite) wird nur einmal übertragen • auf Decoder-Seite in Buffer gespeichert • nur noch Kamerapositionen werden geändert • gute Kompressionsrate Einführung Visual Audio DMIF Systems Profiles
Synthetic Video Objects • Facial Animation - Animation von Gesichtern • Body Animation • 2D Meshes • 3D Meshes • View-dependent Scalability Einführung Visual Audio DMIF Systems Profiles
Facial Animation • Form, Textur und Gesichtsausdruck werden nur durch Parameter übergeben • Facial Definition Parameters (FDP) • Gesicht wird durch 84 FDPs beschrieben • FDPs werden vom Decoder in Gesicht umgesetzt • Animation: • Facial Animation Parameters • Gesichtsausdrücke Body Animation analog Einführung Visual Audio DMIF Systems Profiles
2D Meshes • Aufteilung des 2-dimensionalen Raumes in Polygone • in MPEG-4 nur Dreiecke • Textur wird über das Gittermodell gelegt • Texture Mapping • Animation • Verschieben der Knotenpunkte Einführung Visual Audio DMIF Systems Profiles
View-dependent Scalability • wird in 3D-Welten benutzt • ermöglicht Übertragung von Texturen • nur sichtbare Informationen werden übertragen • spart Bandbreite • Berechnung auf Encoder- und Decoder-Seite • Rückkanal erforderlich Einführung Visual Audio DMIF Systems Profiles
Gliederung Einführung Visual Audio DMIF Systems Profiles
Audio • Tools für • Repräsentation (Sprache, Musik) • Kompression • Skalierbarkeit • Effekte • künstliche Herstellung • Daten in Textform übergeben • Effekte (Widerhall, ...) • meistens nur Interface • konkrete Implementierung flexibel Einführung Visual Audio DMIF Systems
Natural Audio Objects • Sprache • spezielle Standards für Sprachoptimierung • geringer Frequenzbereich • geringe Bitrate • Musik • TwinVQ • besser als MP3 • MPEG-2 Advanced Audio Coding (AAC) Einführung Visual Audio DMIF Systems Profiles
Synthesized Speech • Text To Speech (TTS)-Interface • Decoder wandelt Text in gesprochene Sprache um • extrem niedrige Bitraten • Unterstützung für • phonetische Parameter • Synchronisation mit Lippenbewegungen • pause, resume, jump forward/backward • Dialekte, Sprachunterstützung Einführung Visual Audio DMIF Systems Profiles
Synthesized Audio • MIDI (Musical Instrument Digital Interface) • Synthesizer auf Decoder-Seite • nur Noten und Information über Instrument werden übertragen • spart Bandbreite • Erweiterung: SAOL (Structured Audio Orchestra Language) • Funktionalität von MIDI • Definition des Instrumentes kann im Stream mitgeschickt werden • Decoder setzt Instrumente und Noten zusammen Einführung Visual Audio DMIF Systems Profiles
Gliederung Einführung Visual Audio DMIF Systems Profiles
Streaming • MPEG-4 Standard stellt flexibles Handling für Streams zur Verfügung • kann auf beliebige Protokolle aufsetzen • Verschiedenste Nutzungsarten möglich • Internet • Broadcast • DVD, CD etc. Einführung Visual Audio DMIF Systems Profiles
DMIF • Delivery Multimedia Integration Framework • Sitzungsprotokoll • Framework • ähnlich FTP • Unterschied: statt Daten werden Pointer übertragen, wo zu streamende Daten zu finden sind • stellt Interface für Applikationen zur Verfügung • DMIF Application Interface (DAI) Einführung Visual Audio DMIF Systems Profiles
ESI ... ... SL SL DAI DMIF layer FlexMux DNI TransMux layer RTP UDP/IP MPEG-2 TS Datei Aufbau des DMIF synchronisation layer delivery layer Einführung Visual Audio DMIF Systems Profiles
Local DMIF Remote DMIF Application Application 4 1 3 DMIF DMIF 2 DMIF Ablauf • App. (local) DMIF (local) • spricht DAI an • Aufbau Sitzung zwischen DMIF und Applikation • DMIF (local) DMIF (remote) • Kommunikation über DNI • baut Netzwerksitzung auf • DMIF (remote) App. (remote) • Aufbau Sitzung zwischen DMIF und App. (lokal) • App. (remote) App. (local) • Kommunikation über 1, 2 und 3 Einführung Visual Audio DMIF Systems Profiles
Gliederung Einführung Visual Audio DMIF Systems Profiles
Systems • Sammlung von Tools • beschreiben Verhältnis zwischen den Objekten einer Szene • Verhältnis wird auf 2 Ebenen beschrieben • Binary Format for Scenes (BIFS) • Object Descriptors (ODs) • beschreiben Verhältnis der Streams eines Objektes • zusätzliche Informationen (URL, Intellectual Property, ...) Einführung Visual Audio DMIF Systems Profiles
Zusätzliche Themen • User Interaction • FlexMux Tool • s. DMIF • MPEG-4 File Format • MPEG-J • Transportschicht-Unabhängigkeit • s. DMIF • Intellectual Property-Verwaltung Einführung Visual Audio DMIF Systems Profiles
BIFS (1) • Sprache zur Beschreibung von 3D-Szenen • komplett abgeleitet aus VRML (Virtual Reality Modeling Language) • Möglichkeit zur Gruppierung von MOs • Szenenbeschreibung • Position der MOs in Raum und Zeit • Änderung der Attribute Einführung Visual Audio DMIF Systems Profiles
BIFS (2) • Andere Manipulationen • Ereignismodell • Userinteraktion • vorgefertige Funktionen zur Konstruktion von Szenen • Graphics Primitives • Advanced BIFS (Version 2) • Advanced Sound Environment Modeling • Widerhall, ... • und mehr Einführung Visual Audio DMIF Systems Profiles
User Interaction • muss explizit vom Autor erlaubt werden • client-seitige Interaktion • Änderung des Inhalts erfolgt beim Endbenutzer • Größenänderung • Sichtbarkeit • Position, ... • durch Events (Mausklick, Tastatur) • server-seitige Interaktion • ähnlich, jedoch erfolgen Änderungen beim Sender • Rückkanal (back channel) erforderlich Einführung Visual Audio DMIF Systems Profiles
Intellectual Property (1) • Management und Schutz von geistigem Eigentum (intellectual property) • schnelle Entwicklung dieses Gebietes • stellt nur System zur Verfügung, keine konkrete Implementierung • in einem MO kann eine Intellectual Property Identification (IPI) gespeichert werden • Inhalt • Art des Inhalts • Rechteinhaber Einführung Visual Audio DMIF Systems Profiles
Intellectual Property (2) • Version 2: Schnittstelle für Intellectual Property Management and Protection (IPMP) System • kann die Daten aus IPIs benutzen • Funktionen, die vom IPMP System unterstützt werden: • kontrollierter Zugang zu geistigem Eigentum; Kontrolle erfolgt vom Provider • Verifikation der Authentizität des Senders • Verifikation Integrität des IPs • Schutz vor Raubkopien Einführung Visual Audio DMIF Systems Profiles
Stream flow controller MPEG-4 Stream IPMPS Intellectual Property Schema Szenen- graph Demux MO Decode Composition Rendering Objekt- deskriptoren Einführung Visual Audio DMIF Systems Profiles