I sistemi di trasmissione video via Web

Massimo Boaron – www.euroteam.it

Questa nota ha lo scopo di chiarire le differenze funzionali fra i diversi tipi di servizi di trasmissione di video via Internet e quindi le diverse tecnologie che devono essere utilizzate per gestirli.

Gli utenti senza adeguata conoscenza tecnica in materia spesso confondono i diversi servizi disponibili per la gestione del video via internet: questo può generare malintesi e portare alla fornitura di soluzioni che non soddisfano le necessità dell’utente.

Al concetto generico di “video” si associa spesso l'idea molto semplicistica di immagini in movimento: invece ogni tipo di applicazione richiede una propria modalità di distribuzione e di fruizione del flusso video, che implica una tecnica specifica. Volendo fare un paragone banale, sarebbe come richiedere un intervento medico, senza precisare se serve un pediatra, un dentista, un chirurgo o altro.

Le principali classificazioni delle trasmissioni video in Rete sono le seguenti:

  • Video On Demand (VOD): una raccolta di file video è memorizzata in un server; ogni utente può scegliere e vedere il video desiderato selezionandolo da un menu pubblicato su pagine web (è come scegliere e vedere una videocassetta in remoto, con l’ausilio della rete, con possibilità di fermarla, ripartire e ricominciare)

  • Web-TV a palinsesto (broadcasting): consente di trasmettere una sequenza di contenuti video, definiti da un palinsesto, che possono comprendere file memorizzati su server e riprese in diretta (video live). Gli utenti che si collegano a questo tipo di web-tv vedono le immagini trasmesse in quel momento: è come una trasmissione televisiva classica, l'utente può vedere solo quanto il gestore decide di trasmettere, senza interagire con la sequenza dei contenuti; i video possono essere registrati se non vi sono vincoli di "right management".

  • IPTV: è sinonimo di Web-TV, ma spesso questo termine viene usato per trasmissioni in Internet con protocolli proprietari che si possono ricevere con "set-top-box" collegati al televisore, mentre la Web-TV è di solito associata alla ricezione con PC

  • Videoconferenza: più utenti si vedono e si parlano reciprocamente (caso particolare è la conferenza fra 2 punti)

  • Digital Signage: soluzione ottimale per gestire contenuti multimediali pubblicitari trasmessi a PC remoti, che li visualizzano su grandi display installati in ambienti aperti al pubblico (hall, supermercati, strade, ...)

  • Videosorveglianza: una rete di telecamere invia in tempo reale le immagini a un punto centrale; funzioni aggiuntive, spesso essenziali: registrazione del video e registrazione solo se c’è movimento (motion detection)

Le principali differenze fra questi servizi, che portano a tecnologie diverse, dipendono da:

  • topologia delle connessioni trasmittente-ricevente - nel video on demand e live si ha un server in trasmissione e molti browser in ricezione: quando ci sono molti utenti c'è l'esigenza di molta banda sul server (con seri problemi di costo); nella videoconferenza si ha una trasmissione magliata in cui ogni punto trasmette a tutti, e ognuno riceve da tutti: qui l’immagine si moltiplica in tutti i punti e spesso viene usato un server centrale che riceve e rimanda tutti i canali video; nella videosorveglianza al centro convergono i canali di molte telecamere che operano come server (N trasmittenti, 1 ricevente: quindi problemi di banda al centro)

  • trasmissione in tempo reale o meno (e cosa si intende per tempo reale) - se la videoconferenza ha un ritardo superiore al mezzo secondo, il dialogo diventa innaturale e sgradevole; la videosorveglianza può avere ritardo maggiore, ma psicologicamente un ritardo elevato è negativo; il video on demand o il video live possono avere ritardi ben superiori senza creare problemi (è più importante la qualità)

  • qualità dell’immagine - nella videosorveglianza di solito si inviano immagini di 320x240 pixel: di più non servirebbe, e si aumenterebbe di molto la banda con relativi costi; nella videoconferenza le esigenze sono molto variabili a seconda del livello formale della riunione, da 320x240 pixel in su; nel video l’elemento di paragone è la televisione (con una buona compressione l’immagine a 300 kbps in Internet assomiglia all'immagine della televisione)

Compressione

Una normale trasmissione televisiva digitale richiede molti mega di banda per ciascun utente, cosa economicamente inaccettabile in Internet. Quindi qualunque sia il tipo di servizio la trasmissione video in Internet deve essere molto compressa. Per Internet si utilizza solitamente lo standard MPEG4 (in molte versioni proprietarie): l’unico standard che dà una qualità ragionevole con una banda non eccessiva, compatibile con l’ADSL.

Gli standard di fatto sono Microsoft Media Player 9 e Flash, che sono già presenti in tutti i PC con Windows, quindi sono immediatamente usabili dal 95% degli utenti. Il nuovo standard H264 è poco usato perché ha ancora qualche problema pratico, ma la sua qualità è veramente notevole, quindi è auspicabile che si possa diffondere rapidamente.

I software di compressione sono molto comuni e per lo più gratuiti, quindi chiunque può comprimere video. Tutttavia per ottenere un risultato ottimale è necessario effettuare un corretto set-up dei molti parametri presenti in questi programmi: se si usano i valori di default la qualità è spesso mediocre, problema comune alla maggior parte dei video che si vedono in Internet.

Caratteristiche delle diverse applicazioni

Video on demand

E’ una trasmissione:
  • 1 a 1 come contenuto: 1 server invia una specifica trasmissione video all’utente che l’ha richiesta; un eventuale secondo utente che voglia vedere lo stesso video avrà una trasmissione a lui dedicata, con lo stesso contenuto ma con un diverso inizio, quindi sfasata nel tempo e del tutto indipendente dalla prima

  • 1 a molti come struttura di rete: 1 stesso server deve servire molti utenti allo stesso tempo

Questo implica che per ogni utente che si collega si deve creare un canale virtuale server-utente per la specifica trasmissione e quindi la banda richiesta in uscita dal server è pari alla somma di tutte le bande dei clienti attivi. Es. se al server sono collegati 100 utenti che vedono vari video a 150 kbit per secondo (150 kbps), il server dovrà avere una connessione a Internet superiore a 100x150 = 15.000 kbps ( = 15 Mega) per poter gestire in parallelo tutto questo traffico senza interruzioni per mancanza di banda (*).

Di qui i problema di costi molto elevati per la necessità di molta banda e molta potenza del server (il problema è ancora più critico nel live, dove chi non riesce a collegarsi ha perso lo spettacolo, mentre nell’on-demand se un utente trova la banda sovraccarica può riprovare più tardi). Quindi nei contratti relativi a questo servizio il numero massimo di utenti contemporanei gestiti è un elemento importante per definire le tariffe.

Il video-on-demand ha una gamma molto ampia di applicazioni, che vanno dalla pubblicità in Rete, all’e-Learning, ai videocataloghi. In www.turismedia.it vi è una serie di esempi, che possono essere interessanti per vedere la qualità video che si può ottenere su Internet: passando il video a schermo pieno, a 1-2 metri dal monitor si osserva che la qualità è simile a quella televisiva (solo i video di maggiori dimensioni: gli altri sono convertiti da videocassette, quindi hanno di per se una qualità di registrazione non ottimale).

La trasmissione di contenuti registrati in precedenza dà luogo a un certo numero di soluzioni particolari per ridurre i costi di cui le più importanti sono:

  • Streaming server - la soluzione professionale per un vasto pubblico, basata su un server molto potente con software specializzato per inviare i video a richiesta. I più sofisticati gestiscono canali adattivi a banda variabile: inviano immagini più piccole quanto più il collegamento Internet è lento

  • Download progressivo - il file è inserito in un server web e viene scaricato sul PC: per la visualizzazione non è necessario averlo già scaricato tutto: il video è visualizzato praticamente mentre arriva (questa è una tecnologia Microsoft)

  • Caching su server locali - in molti casi il server centrale e la rete non sarebbero in grado di gestire la banda necessaria per trasmettere il video in diretta. Quindi si installano dei piccoli server in ogni luogo periferico in cui trasferire poco a poco copia dei contenuti centrali: ad es. il sistema centrale scarica di notte gli aggiornamenti sul PC di caching, che quindi possono trasmettere senza problemi ai PC locali mediante LAN.

Web-TV

E’ una trasmissione 1 a molti (come la televisione) e questo può introdurre una semplificazione nella rete: il server che trasmette potrebbe inviare 1 solo canale video, basta che questo venga duplicato nei nodi intermedi di rete (routers): questa tecnica è detta “multicast”. La funzione di duplicazione è già prevista nei router, ma purtroppo quasi nessun Gestore la attiva, perché in programmi di successo può generare una quantità di traffico in Rete non prevedibile.

Nel Video-On-Demand non "live" e nella Web-TV la compressione viene fatta negli studi dopo il montaggio dei film, mentre nel caso "live" deve essere fatta in diretta.

Nel primo caso non ci sono problemi di tempo, quindi si possono usare algoritmi di compressione molto potenti, che a parità di banda danno immagini migliori; di solito il video viene compresso in più passate per ottimizzare la compressione tenendo conto delle caratteristiche di tutto il film. Questo può richiedere per 1 minuto di video alcuni minuti o decine di minuti di elaborazione.

Nel secondo la compressione non può essere fatta più lentamente del film e deve essere obbligatoriamente a 1 passata. A differenza della videoconferenza o della videosorveglianza importa poco se la trasmissione è ritardata di qualche secondo, perché non ci sono problemi critici di interazione: questo consente di usare algoritmi più sofisticati che introducono sfasamenti temporali di 5-10 secondi o più.

In conclusione "non-live", "live" e videosorveglianza/conferenza hanno problemi diversi di fruibilità temporale, che implicano complessità di elaborazione e qualità progressivamente decrescenti, pur basandosi sullo stesso tipo di algoritmo, di solito derivato dalllo standard MPEG4.

In generale tutte le trasmissioni di tipo televisivo su Rete (live o on-demand), che possiamo chiamare Web-TV, richiedono elevata qualità e sistemi in grado di gestire eventuali problemi di banda per evitare interruzioni.

IPTV

Web-TV e IPTV di fatto hanno lo stesso significato, ma è invalsa l'abitudine di chiamare Web-TV un servizio di trasmissione video in Internet destinato alla ricezione con PC e IPTV un servizio per trasmissione video codificato in modo particolare, ricevibile mediante set-top-box collegato al televisore. A parte la codifica proprietaria, caratteristiche e vincoli trasmissivi sono gli stessi della Web-TV.

Un set-tp-box è un sistema hardware, che contiene le funzioni principali di accesso ai servizi internet. Di fatto è una specie di PC specializzato e semplificato al massimo per ridurne i costi. Spesso l'IPTV è pensata come futuro sistema per erogare servizi video interattivi a pagamento.

Digital Signage

Il Digital Signage è un particolare tipo di sistema, che consente di trasmettere contenuti multimediali pubblicitari su una rete di schermi remoti installati in ambienti aperti al pubblico (hall, supermercati, strade, ...).

Questa applicazione è caratterizzata da contenuti che vengono decisi con molto anticipo e non vengono aggiornati spesso, quindi non è necessario trasmettere i contenuti in tempo reale dal server centrale: è possibile scaricare lentamente contenuti multimediali anche molto pesanti (video di buona qualità) sul disco dei PC remoti che gestiscono gli schermi. Invece si può inviare più frequentemente il palinsesto, un file molto leggero con la lista oraria dei contenuti da visualizzare. Questa soluzione è quindi molto economica: con una ADSL di scarsa qualità si possono scaricare molte decine di video ad alta risoluzione, che vengono poi trasmessi ciclicamente per molti giorni.

Sistemi che utilizzano tecniche analoghe sono utilizzati per la proiezione di video a pagamento negli hotel: in questo caso nel server dell'hotel vengono scaricati tutti i film e un sistema locale collegato a quello centrale gestisce i pagamenti elettronici.

Videosorveglianza

La videosorveglianza richiede immagini di risoluzione e dimensioni non elevate. Il Centro di controllo è il punto critico perché vi si possono concentrare decine o centinaia di canali. Tuttavia non è pensabile di avere molti video sempre controllati a vista: in molte applicazioni è preferibile registrare tutto e poi eventualmente rivedere cosa è successo.

Per la videosorveglianza dove non vi è nessuno che si muova (es. uffici di notte, case disabitate, ..) è utile la funzione di Motion Detection, tipica di questa applicazione: solo quando la telecamera registra un movimento (come differenza fra 2 immagini successive) invia il segnale al Centro.

Per effettuare la compressione MPEG4 è necessaria una forte velocità e potenza di calcolo, quindi si richiede l’uso di un PC a cui si collega un apparato tipo webcam (nel caso della videoconferenza di qualità il PC appare come un’unità hardware dedicata per semplificare i comandi).

Nella telesorveglianza non è pensabile installare dei PC nei soffitti o su pali nelle strade, quindi alla webcam si integra un’unità hardware di compressione. Solitamente queste hanno poca potenza e quindi lacompressione è fatta con uno standard meno sofisticato, il Motion JPEG: questo manda la sequenza dei fotogrammi comprimendo ogni singolo fotogramma in modo indipendente. L’MPEG invece invia un fotogramma compresso ogni tanto, mentre per i fotogrammi intermedi invia solo le parti che cambiano: la compressione è circa 10 volte superiore al MPEG, ed è migliore se le parti in movimento sono piccole.

Esistono pochissime telecamere di sorveglianza con compressione MPEG integrata (un esempio è la Smartcam - www.euroteam.it ): hanno lo stesso costo delle altre, ma richiedono reti e apparati di registrazione circa 10 volte meno potenti.

Questo è un elemento fondamentale di scelta tecnica fra le 2 soluzioni: se le telecamere e il Centro Controllo sono nello stesso edificio non vi è una sensibile differenza nel tipo di compressione: a meno che non ci siano molte decine di telecamere, la LAN può accettare anche una banda molto ampia per ciascuna telecamera. Se si deve mettere una telecamera per riprendere un campo da sci va benissimo il Motion-JPEG, che può anche mandare immagini grandi a intervalli di decine di secondi: non si vedranno gli sciatori muoversi, ma si vedrà benissimo com’è la neve.

Invece se si deve effettuare un monitoraggio continuo su punti remoti la compressione MPEG4 è d’obbligo: si può avere un canale di uscita di 64-128 kbps e ricevere almeno 5-10 immagini al secondo. Non sarebbe accettabile usare telecamere con Motion JPEG, perché su ADSL possono trasmettere solo un’immagine ogni qualche secondo, oppure richiedono una linea diretta a larga banda, decuplicando i costi di rete. Purtroppo spesso venditori non corretti o clienti poco esperti adottano telecamere MotionJPEG che poi non vengono mai messe in funzione per questa ragione: molti comuni hanno reti di telesorveglianza ferme per questa ragione o hanno dovuto installare costosissime fibre ottiche per fornire la banda.

Videoconferenza

La videoconferenza può essere realizzata effettuando tanti collegamenti bilaterali, ma di solito, per esigenze di pianificazione e gestione, si usa un server centrale che raccoglie ciascuna trasmissione e rimanda a ciascuno le immagini degli altri.

Questo implica una banda asimmetrica, ogni punto trasmette 1 canale e ne riceve N: questo è ben compatibile con l’ADSL che ha proprio la banda asimmetrica con parte entrante molto superiore a quella uscente. Il server invece deve avere una banda elevata in entrambi i sensi, e quindi deve essere installato in un punto servito con connettività Internet professionale.

Il caso di videoconferenza a 2 diventa invece molto più semplice perché non richiede il server, quindi si possono anche usare soluzioni free reperibili in Internet (es. Messenger).

E’ importante ricordare che nella videoconferenza si devono usare programmi o apparati specifici, perché è l’unico caso di trasmissione bidirezionale: non sono quindi utilizzabili apparati per videosorveglianza o per web-TV, ma si deve avere una integrazione di queste due funzioni.

Tecnologie e prodotti proposti

Euroteam attraverso una serie di partnership può offrire la gamma completa di soluzioni, quindi non ha interesse a proporre soluzioni non adeguate:

  • Grandi portali Video-On-Demand e Web-TV: per le maggiori applicazioni propone Media-Ibox come piattaforma di gestione e distribuzione di contenuti multimediali, la più avanzata oggi disponibile, con referenze come Disney, Blockbuster, Kataweb, Radio DJ: malgrado questa piattaforma integri funzioni molto avanzate di Content Management System con un potente ambiente di gestione e distribuzione audio/video e funzioni di Right Management, il suo costo è di molto inferiore alle soluzioni più note. Questo sistema è usato anche per il controllo di reti con centinaia o migliaia di PC che realizzano una gestione locale dei contenuti (interattivi o solo proiezioni)

  • Siti con Video-On-Demand e Web-TV: per applicazioni più semplici Euroteam propone sistemi di streaming e di progressive download convenzionali accoppiati a ottimi ambienti CMS di basso costo.

  • Tecnologie per il risparmio di banda: per ridurre la banda utilizzata, che rappresenta la quota maggiore di costo, Euroteam propone una tecnologia di "multicast virtuale"; inoltre, ove possibile propone sistemi di compressione proprietaria sensibilmente migliori di Media Player 9, che oggi è il top fra gli standard di fatto.

  • Videosorveglianza: Euroteam propone Smartcam, che sono state storicamente le prime telecamere MPEG4 presenti sul mercato

  • Videoconferenza: Euroteam offre il sistema XcommunicationPRO, che ha ottime prestazioni soprattutto con banda limitata. Questo consente anche di realizzare applicazioni di tipo "panel", o tavola rotonda, via web.

Tutte queste soluzioni sono ovviamente utilizzabili su Internet e intranet, cioè in generale per reti di tipo IP. Euroteam non commercializza soluzioni per altre reti, che tendono a sparire perché non competitive.

______________________________________________

(*) - NOTA

Il flusso di dati e quindi la velocità di Internet non dipende solo dalla portata (la cosiddetta "banda") della linea finale, ma anche dalla gestione dell'intera rete: spesso internet è lento non perché il collegamento finale dell'utente non ha banda abbastanza larga, ma perché ci sono intasamenti nei nodi di rete o nel server che deve erogare il servizio richiesto. O più frequentemente perché il provider non compra abbastanza connettività verso la rete Internet mondiale per soddisfare le esigenze di tutti gli utenti e quindi questi si devono spartire quella disponibile. In questo senso la famosa “larga banda” proposta all’utente è spesso un’operazione di marketing per convincere l'utente a pagare di più, ma non corrisponde a un servizio come quello propagandato: spesso chi ha un contratto ADSL da 2 mega o più è fortunato se ha in ricezione una banda da 1 mega. Con www.internetfrog.com o siti simili si può controllare in prima approssimazione la banda realmente erogata dal carrier.

A questo proposito è bene sfatare la leggenda della banda garantita: chi ha firmato un contratto che parla di banda garantita è stato semplicemente preso in giro, perché in reti IP (come quella usata da Internet) non è tecnicamente possibile garantire la banda. Solo il tratto finale della linea (i 2-3 km fra l'ultima centrale e l’utente) si può garantire perché è fisso (la velocità è data dal modem che la gestisce), ma questa può consegnare solo la banda che arriva all'ultimo nodo di rete, condividendola con tutti gli utenti che vi sono connessi.

Ciò è molto semplice da spiegare: Internet è una rete magliata in cui i flussi di traffico seguono percorsi del tutto casuali. Quindi non può essere determinato a priori il traffico nei tratti che di volta in volta collegano il cliente al server usato al momento, perchè vi passano casualmente dati di molti utenti. In relazione a ciò il carrier non può garantire lo stato dei canali, e soprattutto quando il server è esterno non può garantire lo stato delle reti esterne che la comunicazione deve attraversare. Vi sono altre reti molto diverse da Internet (es. ATM) che invece sono progettare per garantire una banda fissa: esse sono usate per altre applicazioni più critiche.

Un esempio tipico di questo errore concettuale è la convinzione che un abbonamento a una rete in fibra (es. Fastweb) garantisca una navigazione in Internet enormemente più veloce di una ADSL. Quando dall’interno di questa rete si esce su Internet si ricade nel problema di cui sopra, anzi nasce un problema in più: i gestori di queste reti non possono avere una banda infinita verso Internet, perché devono pagarla ai grandi carrier. Quindi se molti utenti cercano di vedere contenuti molto pesanti su siti esterni si crea un collo di bottiglia in entrata da Internet e la rete in fibra può diventare più lenta di una rete ADSL.