Anno Accademico 2000-2001

Commenti

Transcript

Anno Accademico 2000-2001
Politecnico di Milano
Anno Accademico 2001-2002
Corso di Informatica Medica II V.O.
Prof. Francesco Pinciroli
Autoproduzione da parte del docente
- diretta, interoperabile, a basso costo di materiale di insegnamento fruibile anche a distanza
A cura dello studente:
Ludovico Luca Andrea
Matr. 630614
e-mail: [email protected]
Indice
Sommario
pag.
4
Legenda
pag.
5
pag.
6
7
10
11
12
Capitolo 1
Scenari e problematiche
1.1 La fruizione a distanza
1.2 L’ambiente classico della lezione frontale
1.3 Fruizione in presenza e a distanza
1.4 Strumenti disponibili
Capitolo 2
Modello di riferimento per le modalità di erogazione
2.1 Definizione del modello attraverso esempi
2.2 Definizione del modello per enumerazione dei vincoli
2.3 Composizione del materiale didattico
pag. 15
16
17
18
Capitolo 3
Due prodotti a confronto
3.1 Il prodotto Sony PCS-DS150/DS150P
3.2 Il prodotto TechSmith Camtasia
3.3 Schede delle prestazioni dichiarate
pag. 19
20
23
26
Capitolo 4
Test su TechSmith Camtasia
4.1 Uso simultaneo di diversi programmi
4.2 Compressione audio
4.3 Sincronizzazione audio/video
4.4 Codec video a confronto: sequenza di immagini statiche
4.5 Codec video a confronto: immagini in movimento
4.6 Formati e player video
4.7 Test di lunga durata
pag. 28
29
30
32
34
35
36
37
Appendice A
Manuale d’uso di TechSmith Camtasia
A.1 Caratteristiche di Camtasia Recorder
A.2 Documentazione, FAQ e download
A.3 Requisiti di sistema
A.4 Tipi di file supportati
A.5 Il codec proprietario TSCC
pag. 38
39
40
51
52
53
Appendice B
Tecniche di compressione e standard multimediali
B.1 Tecniche di compressione e codec
pag. 54
55
2
B.2 Standard per il segnale video
B.3 Standard per il segnale audio
57
59
Bibliografia
pag. 61
Ringraziamenti
pag. 62
3
Sommario
La presente relazione ha lo scopo di indagare le problematiche tecniche, organizzative ed economiche
legate all’autoproduzione da parte del docente di materiale di insegnamento fruibile a distanza.
Essa rappresenta l’elaborato finale del corso di Informatica Medica II tenuto nell’Anno Accademico
2001/2002 dal prof. Francesco Pinciroli presso il Politecnico di Milano.
La relazione si compone di quattro Capitoli e due Appendici.
Il Capitolo 1 – “Scenari e problematiche” rappresenta un’introduzione al problema trattato. Si parte da
considerazioni di natura generale sulla fruizione a distanza, per poi addentrarsi nella materia con un
approccio sperimentale, andando cioè a descrivere situazioni e problematiche reali, evinte
dall’esperienza personale.
Il Capitolo 2 – “Modello di riferimento per le modalità di erogazione” prende spunto da quanto rilevato
nel corso del primo capitolo, ma con un obiettivo ben preciso: definire un modello di riferimento del
problema che possa guidare nella scelta di implementazioni assonanti.
Poiché in questa sede si vuole soprattutto fornire una risposta concreta ai problemi sollevati, il Capitolo
3 – “Due prodotti a confronto” presenta due soluzioni attualmente reperibili in commercio (Sony PCSDS150/DS150P e TechSmith Camtasia), ne evidenza peculiarità, modo d’uso e prestazioni dichiarate
dai produttori. Tali prodotti sono ragionevolmente adatti ai requisiti del modello di erogazione
precedentemente definito. Al termine del processo di valutazione e comparazione, il software
TechSmith si rivelerà lo strumento più adeguato alle esigenze della didattica universitaria.
Nel Capitolo 4 – “Test su TechSmith Camtasia” vengono presentate e commentate alcune prove ideate
dall’autore. Lo scopo di tali test è duplice: da un lato esemplificare le possibilità di utilizzazione di
Camtasia in ambito didattico; dall’altro evidenziare eventuali carenze del prodotto e mettere in luce le
difficoltà che si possono incontrare nel suo uso.
L’Appendice A rappresenta un manuale ragionato su TechSmith Camtasia. In tale parte della relazione
si consente al lettore di approfondire la conoscenza del prodotto, anche grazie a numerosi documenti
tratti dal sito del produttore e riportati anche in formato digitale nel CD-ROM allegato.
L’Appendice B, infine, chiarisce alcuni concetti citati nella relazione ma non approfonditi nel corso
della trattazione in quanto non direttamente attinenti al problema trattato. Ci si sofferma in particolare
sulla compressione e sugli standard per la codifica e la trasmissione del segnale audio e video.
Il CD-ROM allegato alla relazione ne è parte integrante, in quanto vi sono raccolti tutti i filmati di test
descritti e commentati nel corso del Capitolo 4. Nel CD-ROM è inoltre presente la documentazione
ufficiale su TechSmith Camtasia, scaricata dal sito del produttore.
4
Legenda
Nel seguito della relazione verranno adottate le seguenti convenzioni tipografiche:
Arial
per i nomi di file e directory del CD-ROM allegato;
Times New Roman grassetto
per i menù e i comandi di Camtasia;
Courier New grassetto sottolineato per gli indirizzi di pagine web.
Infine, i passi citati dal sito del produttore sono riportati in carattere a corpo ridotto all’interno di
cornici.
5
CAPITOLO 1
Scenari e problematiche
Questo capitolo evidenzia con chiarezza gli obiettivi che ci si prefigge quando si parla di
autoproduzione del materiale di insegnamento.
Quali sono i vantaggi e gli svantaggi di una fruizione delle lezioni a distanza o in differita? Quali sono
gli scenari di lezione e di interazione tra docenti e studenti di cui si deve tener conto? Quali sono le
problematiche pratiche, didattiche e tecniche che possono insorgere quando si crea un meccanismo di
fruizione a distanza spaziale e temporale?
Questi ed altri interrogativi troveranno risposta nelle pagine del Capitolo 1.
6
1.1 La fruizione a distanza
Quando si parla di fruizione a distanza, si sottintendono due concetti diversi: fruizione a distanza in
senso spaziale e fruizione asincrona.
La fruizione a distanza spaziale consente comunque una forma di interazione, seppure limitata dalle
condizioni contingenti. Si pensi alle sessioni di videoconferenza, ove è possibile interagire in tempo
reale almeno da un punto di vista verbale e visivo. Numerosi sono i problemi legati al vincolo di real
time: tra questi la scelta della frequenza di campionamento audio-video, la disponibilità di banda, la
perdita di sincronizzazione,… Questo tipo di fruizione limita poi le possibilità di interazione: ad
esempio, non è fisicamente possibile per i relatori passarsi fogli o altri oggetti di mano in mano.
Bisogna comunque riconoscere uno sforzo da parte di progettisti e programmatori per risolvere, almeno
parzialmente, alcuni problemi legati a questo approccio: esistono ad esempio applicativi di editing
distribuito che consentono di apporre righe di commento su documenti comuni o di firmarli “in
remoto”.
La fruizione asincrona comporta altri problemi di interazione: se in una videoconferenza è possibile
per i soggetti coinvolti interagire tra di loro, ad esempio per chiedere delucidazioni o ulteriori rapporti e
documenti, questo non è possibile nel caso di un oggetto (sia esso una presentazione, un filmato,…)
preconfezionato in un certo istante di tempo per essere visualizzato in seguito. Di qui sorgono svariate
esigenze: chiarezza e completezza nell’esposizione, adozione da parte del relatore di tecniche visuali e
sonore per tener desta l’attenzione del fruitore, possibilità di interrompere la visualizzazione per
visitare altri documenti correlati,…
Nel caso in esame, la fruizione avviene a distanza spaziale ed è asincrona. Si deve cioè immaginare che
il docente registri le proprie lezioni in aula e in un certo istante di tempo, mentre lo studente le segua da
un altro luogo (tipicamente da casa, o da postazioni multimediali approntate allo scopo) e in un altro
momento, successivo a quello di creazione del materiale.
Esiste un’altra classificazione che è necessario affrontare prima di procedere nella produzione di
materiale: in gergo informatico si parla di fruizione on-line ed off-line, intendendo sottolineare con
questi termini l’utilizzo rispettivamente della rete o di supporti multimediali per diffondere i contenuti.
La soluzione off-line consiste nel memorizzare il materiale prodotto su memorie di massa. A questo
proposito citiamo i supporti magnetici (quali i floppy disc e gli hard disc), i supporti magneto-ottici
(cartucce da 3.5” ad alta capacità, DAT,…) ed i supporti ottici (CD-ROM, DVD).
La grande capacità di tali supporti e l’elevato bit-rate nella comunicazione tra le periferiche destinate
alla lettura e alla visualizzazione dei dati rende possibile memorizzarvi qualsiasi tipo di dato
multimediale (audio, immagini statiche, filmati,…), anche senza disporre di hardware particolarmente
performante. A questo proposito si veda la tabella sottostante, aggiornata al Settembre 2002, che
confronta le tecnologie a basso costo attualmente più utilizzate per l’archiviazione e la diffusione dei
dati.
Nome del supporto
Floppy disc da 3.5”
Hard disc EIDE
Hard disc SCSI
CD-ROM
DVD-ROM
Tecnologia di I/O
magnetica
magnetica
magnetica
ottica
ottica
Capacità
1,44 MB
da 40 a 80 GB
da 18 a 74 GB
650 o 700 MB
da 4.7 a 17 GB
7
Bit-rate massimo
circa 500 Kbit/sec
100 MB/sec
80 MB/sec
7200 KB/s (48x)
21640 KB/s (16x)
La tabella presentata è in realtà indicativa e fotografa la situazione attuale tralasciando le tecnologie
troppo costose o dedicate ad applicazioni molto specifiche (quali la componentistica per server o
sistemi dedicati). Ad esempio, è possibile reperire in commercio hard disc assai più capienti di 80 GB:
citamo il Maxtor E 5400 U/133, che permette di archiviare fino a 160 GB di dati. Ma si tratta di
prodotti destinato ad un’utenza molto specifica. Analogamente, si sottolinea che i transfer rate riportati
sono valori di punta, raggiunti solo dai lettori più veloci e solo nelle aree più interne del supporto.
Un filmato con audio e video di buona qualità occupa solitamente uno spazio dell’ordine delle
centinaia di MB o al più di qualche GB. Su questo punto non è possibile essere quantitativamente
precisi, in quanto tale valore dipende dalla durata del filmato stesso, dalla tecnica di compressione
adottata, dalle caratteristiche dell’immagine e via dicendo… In ogni caso, risulta chiaro che anche un
prodotto multimediale completo quale un filmato (audio + immagini in movimento) trova spazio
sufficiente su CD-ROM o su DVD-ROM, mentre la sua trasmissione via rete pubblica risulta ancora
lenta e difficile, e presumibilmente imporrebbe un drastico ridimensionamento della risoluzione e della
qualità dell’immagine. A questo proposito si rimanda alla tabella di pagina 7, in cui sono riassunte le
caratteristiche delle reti locali e geografiche di intercomunicazione.
Al giorno d’oggi, masterizzare un CD-ROM è un’operazione tecnicamente semplice, poco costosa e
alquanto veloce, grazie ai progressi raggiunti dai masterizzatori e dal software dedicato. I più recenti
masterizzatori sono in grado di scrivere su supporti di tipo CD-R alla velocità massima di 48x, cui
corrisponde un bit rate teorico di 7200 KB/sec, e di risolvere le interruzioni del flusso di dati
(prevenzione del buffer underrun) grazie a tecniche di buffering e riposizionamento del laser.
Rimane irrisolto il problema della diffusione del materiale, sia da un punto di vista pratico che legale. I
destinatari del prodotto finale sono potenzialmente molti, e quindi si dovrebbe mettere a loro
disposizione un buon numero di copie del materiale; è quindi necessario prevedere un centro preposto
alla diffusione dei supporti.
La diffusione di un CD-ROM pone il problema del rispetto delle leggi sul copyright, che impongono in
molti casi la registrazione presso la Società Italiana Autori ed Editori (SIAE) e l’adozione del relativo
bollino sulla confezione. L’articolo 181-bis della recente legge sul diritto d'autore recita: "1. Ai sensi
dell’articolo 181 e agli effetti di cui agli articoli 171-bis e 171-ter, la Società italiana degli autori ed
editori (SIAE) appone un contrassegno su ogni supporto contenente programmi per elaboratore o
multimediali." Nella directory Documenti è riportato integralmente il testo della legge sul diritto
d'autore n° 633/1941 e delle “Nuove norme di tutela del diritto d’autore” (legge n° 248/2000), testi
scaricati dal sito della SIAE (www.siae.it). L’applicazione della legge sui diritti d’autore al campo
informatico è tuttora questione molto incerta e dibattuta anche fra gli esperti del settore. Nel caso in
oggetto la registrazione presso la SIAE non dovrebbe essere necessaria, dato che la diffusione non
riguarda un programma, bensì si mette a disposizione un archivio di dati a fini didattici, ma il
condizionale in questo campo è d’obbligo.
Passiamo in rassegna ora quelli che sono gli svantaggi legati alla soluzione off-line, che rappresentano
poi i punti di forza per la diffusione on-line.
Innanzi tutto, la distribuzione dei supporti potrebbe risultare un’operazione complicata: a chi affidare la
consegna dei CD-ROM? Secondo quali modalità e in che orari? Come tutelarsi in merito alla loro
restituzione? Quante copie produrre? Quest’ultimo interrogativo solleva poi problemi economici ed
organizzativi. Ad esempio, se masterizzare un solo CD-ROM è un’operazione veloce, che al limite può
essere compiuta in pochi minuti al termine della lezione stessa, la realizzazione di molte copie richiede
quasi certamente un intervento in outsourcing.
Una consegna centralizzata del supporto vanifica poi un vantaggio fondamentale della fruizione a
distanza: obbliga infatti il fruitore – nel nostro caso lo studente - a recarsi nel punto di distribuzione, ad
esempio la segreteria di dipartimento. L’obiettivo sarebbe invece realizzare una fruizione a distanza
8
spaziale e temporale, cioè consentire allo studente di seguire la lezione rimanendo fisicamente a casa
propria. La creazione di un corso on-line si potrebbe così inserire in un più ampio progetto di
formazione a distanza, campo nel quale il Politecnico di Milano si sta già cimentando da anni.
La distribuzione on-line risolve inoltre qualsiasi diatriba di carattere legale: non esiste ancora una legge
che regolamenti la diffusione di software in rete. Ad esempio, sempre nella legge sul diritto d’autore
precedentemente citata, viene prevista una deroga proprio in merito al download dei programmi dalla
rete. In altre parole, se il software viene diffuso su supporto ottico, il bollino SIAE è assolutamente
obbligatorio; se al contrario viene scaricato da Internet, tale obbligo decade. Questo dovrebbe risolvere
i dubbi precedentemente sollevati in merito alla natura del materiale diffuso (software multimediale per
cui è richiesto il bollino o semplice archiviazione di dati?).
Il maggior deterrente per un modello di erogazione on-line è costituito dalla velocità, dai costi e dai
disagi legati alle connessioni attualmente disponibili. L’utente italiano medio dispone di una
connessione a Internet di tipo analogico, attraverso un modem a 56.6 kbps. Questo si traduce in un bit
rate di punta di circa 7 kB/sec, in realtà raramente superiore ai 5 kB/sec e comunque decisamente
inferiore a quello consentito dalla fruizione off-line (si veda la tabella di pagina 5). I costi sono quelli
della telefonata urbana, secondo la tariffa oraria imposta dall’operatore di telefonia con cui ci si
connette alla rete. Tra i disagi più comuni citiamo la caduta della connessione e la mutua esclusione tra
la possibilità di uso del telefono e la connessione di rete. Bisogna però considerare che in futuro un
numero sempre maggiore di utenti sarà raggiunto da nuove tecnologie di rete, il che consentirà
connessioni più veloci e un abbattimento dei costi e dei disagi. A questo proposito si riporta una tabella
indicativa e aggiornata a Settembre 2002 sulle tecnologie attualmente disponibili.
•
•
•
•
•
Connessione analogica
ISDN
ADSL
Fibra ottica
Rete Ethernet (LAN)
56,6 kbps
128 kbps
640Kbit/s in entrata (downstream), 128 in uscita (upstream)
10 Mbps
10-100 Mbps
In conclusione, a nostro parere il modello di erogazione che si imporrà in un futuro prossimo è bastao
sulla fruizione on-line del materiale didattico, ma il presente è ancorato alla fruizione off-line. Infatti le
soluzioni proposte nel Capitolo 3, pur consentendo in linea teorica una diffusione on-line dei contenuti,
sono incentrate sulla creazione di supporti multimediali analogici (ad esempio videocassette VHS) o
digitali (ad esempio CD-ROM).
9
1.2 L’ambiente classico della lezione frontale
In questo paragrafo verranno sottolineati i problemi logistici legati all’ambiente che costituisce il tipico
scenario della cosiddetta lezione frontale. La “lezione frontale” è un modello di erogazione assai
diffuso a livello didattico, e di questo modello si parlerà estesamente nel Capitolo 2, proprio prendendo
spunto dalle considerazioni che emergeranno nel corso di questo paragrafo.
Quando si vuole produrre materiale di insegnamento fruibile a distanza, si deve necessariamente tener
conto delle condizioni ambientali tipiche del luogo naturalmente deputato alla lezione: l’aula. L’analisi
degli scenari di lezione è fondamentale, in quanto se ne evincono valide indicazioni per ottenere un
efficace risultato finale, indipendentemente dagli strumenti e dalla tecnologia prescelta.
Nel corso della trattazione si trascureranno alcuni casi particolari, sostanzialmente irrilevanti per i
nostri scopi. Tra questi, ad esempio, la predica ex cathedra (soltanto orale e da una sorta di pulpito),
l’animazione sensorialmente immersiva (nella quale l’attenzione è totalmente focalizzata sui contributi
video) e le lezioni che richiedono scenari estremamente inusuali (ad esempio i corsi di anatomia o di
strumento musicale).
La tipica aula universitaria è un ambiente idealmente concepito per soddisfare le esigenze di
apprendimento degli studenti. Spesso lo strumento didattico centrale è la lavagna, utilizzata di norma
per eseguire disegni, formulare dimostrazioni, tracciare grafici ed annotare frasi di particolare
importanza. Si evidenzia che, anche nella configurazione minimale che preveda solo una lavagna,
l’aula consentirebbe comunque di fornire agli studenti messaggi ricchi da un punto di vista
multimediale, composti da contributi audio (la spiegazione vocale del docente) e video (le immagini
sulla lavagna, la gestualità del professore,…).
Al giorno d’oggi nelle aule universitarie si trovano di frequente anche strumenti tecnologici: la lavagna
luminosa per lucidi, il videoproiettore, un elaboratore multimediale, e via dicendo. Queste
apparecchiature ampliano notevolmente il numero e la natura dei contributi che possono essere
presentati agli studenti: ad esempio, migliorano le possibilità di visualizzare immagini statiche
predisposte e consentono di presentare animazioni e filmati. Un collegamento ad Internet, vincolato
alla presenza in aula di un PC, aggiunge la possibilità di accedere a siti web, banche dati ed
informazioni multimediali.
10
1.3 Fruizione in presenza e a distanza
Scopo del paragrafo è evidenziare le differenze più evidenti e significative tra la fruizione in presenza
(cioè la partecipazione personale alla lezione) e quella a distanza, indipendentemente dallo strumento
tecnologico con cui questa verrà realizzata.
Innanzi tutto, l’aula non è solo il teatro del modello di lezione frontale di cui si è parlato nel paragrafo
1.2; essa è anche un ambiente in cui è consentita una forte interazione tra docente e studenti, e tra
studente e studente. Ad esempio, se gli uditori non colgono qualche frase, non comprendono le
spiegazioni o semplicemente desiderano ulteriori approfondimenti, l’”ambiente aula” consente di
interrompere la lezione e chiedere delucidazioni al professore, o di rivolgersi al compagno di banco.
Questo aspetto di comunicazione ed interazione non va tralasciato. Infatti la fruizione a distanza crea
una sorta di barriera per le comunicazioni interpersonali: solitamente si tratta di fruizione privata, in cui
l’utente è sostanzialmente isolato. Sarà dunque necessario ricercare strumenti integrativi e sostitutivi,
basati su tecnologie ormai comunemente disponibili: ad esempio, la possibilità di inviare e-mail al
docente con richiesta di chiarimenti, o la creazione di forum di discussione tra studenti di uno stesso
corso.
Per quanto riguarda le condizioni ambientali, quelle proprie della fruizione a distanza sono spesso
ottimali rispetto a quelle di un’aula universitaria. L’aula è infatti un ambiente tipicamente rumoroso,
non sempre ben illuminato, in cui gli studenti in ultima fila spesso faticano a vedere e sentire il docente.
Il televisore o il monitor di un computer, al contrario, possono essere regolati a piacimento (messa a
fuoco, luminosità, contrasto,…), e questo vale anche per i diffusori acustici. La visione e l’ascolto
risultano dunque molto più chiari, nell’ipotesi che ogni passo della catena di registrazione e
memorizzazione sia stato effettuato a regola d’arte.
La fruizione a distanza consente inoltre un numero virtualmente infinito di ripetizioni dei concetti della
lezione. E’ ben noto ad ogni studente il freno psicologico che spesso lo trattiene dall’interrompere le
spiegazioni del docente per confessare pubblicamente, davanti ad un’aula gremita, di non aver
compreso. Nel caso di fruizione privata, al contrario, è sufficiente interrompere la visualizzazione,
riportarla nel punto desiderato ed avviarla per poter ascoltare nuovamente l’illustrazione del docente,
sempre uguale a se stessa, concentrandosi sugli aspetti meno capiti.
11
1.4 Strumenti disponibili
Per motivi di varia natura (economici, pratici, contenutistici), il materiale didattico deve essere prodotto
nel proprio ambiente naturale, cioè in aula e in contemporanea con la lezione rivolta agli studenti
presenti. Questo comporta a sua volta la ricerca di soluzioni a impatto minimo sul normale svolgimento
della lezione.
Ma quale deve essere la dotazione minima di un’aula deputata a questa operazione?
Uno dei requisiti che ci si è posti fin dall’inizio è indicare soluzioni compatibili con lo scenario
preesistente. E’ ovvio che, disponendo dei mezzi tecnologici e finanziari, si potrebbe registrare una
lezione in uno studio dotato di tutte le apparecchiature multimediali, commissionando animazioni
tridimensionali a esperti di grafica, adottando una valida regia, usando telecamere multiple,
rivolgendosi a tecnici delle luci, a ingegneri del suono e così via… Senza dubbio il risultato sarebbe di
notevole impatto visivo, e forse anche più efficace da un punto di vista didattico. Ma ci si deve
confrontare con la realtà, e i mezzi ed i sussidi tecnici ed economici che una struttura universitaria
fornisce sono solitamente quanto mai modesti, se paragonati alle apparecchiature degli studi televisivi e
cinematografici.
Per riprendere l’intera lezione in un’aula dotata solo di lavagna sarebbe sufficiente una comune
videocamera. Con essa è infatti possibile catturare suoni e immagini, e dunque le parole, i gesti e le
annotazioni del professore. Tale soluzione a videocamera singola si è da tempo rivelata inefficiente, in
quanto non adeguata agli scopi prefissi. Ad esempio, si dovrebbe continuamente regolare lo zoom per
riprendere ora la gestualità del professore, ora il suo volto, ora i contenuti della lavagna e così via. Una
volta effettuata la registrazione, ci sarebbe poi il problema della pubblicazione e diffusione del nastro:
si potrebbero fare delle copie, oppure utilizzare una periferica di acquisizione per riversare i contenuti
del videotape in un computer e quindi rielaborarli. In ciascuno dei due casi, è necessario disporre di
apparecchiature aggiuntive e non facilmente reperibili in ambiente universitario; presumibilmente si
dovrebbe procedere nel loro acquisto.
Giudicata insufficiente la soluzione di usare una sola videocamera, torniamo all’interrogativo
precedente. Qual’è la dotazione ottimale di un’aula in cui tenere lezione e contemporaneamente
produrre materiale didattico fruibile a distanza?
Un elenco minimale di strumenti hardware e software indispensabili allo scopo è il seguente:
- Videocamera, con uscita analogica o digitale, assolutamente indispensabile per catturare il
volto ed i gesti del professore. Ancor meglio sarebbe avere a disposizione una seconda
periferica di acquisizione video da puntare sulla lavagna, piuttosto che sfruttare un’unica
videocamera per inquadrare la persona del docente e i contenuti della lavagna.
- Microfono; posto vicino al docente, ne cattura con chiarezza le parole e minimizza il rumore
ambientale. La soluzione ottimale sarebbe disporre inoltre di un secondo microfono portatile da
far girare per l’aula per le domande poste dagli studenti.
- PC multimediale, dotato di lettore CD-ROM, masterizzatore CD o DVD, diffusori,
necessariamente collegato ad un sistema di videoproiezione. Questo consentirebbe di presentare
agli studenti contenuti multimediali complessi, come ad esempio animazioni preparate al
computer.
- Collegamento ad Internet
- Software adeguato, che potremmo classificare in general purpose (Microsoft Office, Acrobat
Reader, Windows Media Player, viewer per i formati proprietari RealMedia, Shockwave,
12
Flash,…) e specifico (nel caso di Informatica Medica, potrebbe trattarsi di un atlante anatomico,
di una raccolta di biosegnali o bioimmagini, di un database medico,…).
Tutti i requisiti elencati non sono eccessivamente costosi, e spesso nelle strutture universitarie esistono
aule che contengono già le tecnologie richieste.
Altre caratteristiche dell’aula di cui tener conto sono:
- fattori architettonici
l’aula è solitamente a pianta è rettangolare, la lavagna e la cattedra si trovano sul lato corto del
rettangolo, i banchi sono di fronte ad essa, posti a file parallele su uno stesso livello (più
raramente sono disposti a piani digradanti o ad anfiteatro). Tale struttura è ben adeguata ad una
lezione di tipo frontale, ex cathedra, nella quale protagonista e centro dell’attenzione è il
professore, mentre gli studenti interpretano solitamente il ruolo di uditori. Le considerazioni
sulla morfologia dell’aula può influenzare la scelta del numero e della disposizione delle
telecamere;
- fattori ambientali
l’illuminazione dell’aula può essere naturale o artificiale (solitamente lampade al neon), e va
tenuta sotto controllo per evitare effetti di riverbero e di riflesso. L’acustica non è sempre
ottimale, ma per ovviare il problema è di solito sufficiente l’uso di un microfono collegato ad
un sistema di amplificazione;
- apparecchiature preesistenti
di quali strumenti sono già dotate le aule? Ad esempio, la presenza di una videocamera per la
teleconferenza, di un microfono per l’amplificazione, di una postazione multimediale collegata
ad un proiettore sono elementi da sfruttare e valorizzare nella realizzazione del materiale
didattico. Ma di questo si parlerà con maggior dettaglio più avanti nel paragrafo;
- valutazioni economiche
in mancanza di alcuni oggetti tecnologici ritenuti indispensabili per la produzione del materiale
didattico, le possibilità economiche dell’università ne consentono l’acquisto?
- fattori organizzativi
se esiste un’aula approntata con dispositivi multimediali, può il professore accedervi ogni qual
volta lo ritiene necessario per tenervi la propria lezione? O dovrà condividerla con altri colleghi
e con altri possibili utilizzi? Tale aspetto non può essere trascurato: se il professore è l’unica
persona ad aver accesso all’aula, allora sarà sufficiente eseguire il tuning ambientale una sola
volta, o al più ricontrollare periodicamente pochi parametri; se al contrario l’ambiente è
multifunzionale, e quindi la telecamera viene spostata, regolata ed orientata diversamente, la
postazione multimediale viene smontata,… allora il ripristino delle apparecchiature e dei
parametri dovrà essere eseguito prima di ogni lezione, con evidente perdita di tempo.
Prima di registrare la lezione, indipendentemente dalle scelte tecnologiche ed implementative, sarà
necessario un tuning ambientale al fine di ottenere un risultato ottimale. Se si vuole catturare la voce, la
gestualità e l’uso della lavagna da parte del docente, si dovranno preventivamente regolare con
attenzione le luci dell’aula, la posizione della videocamera, i livelli di luminosità, contrasto e colore, il
volume della cattura audio e così via…
Numerosi sono poi i problemi tecnici e pratici da considerare: ad esempio, evitare riflessi luminosi
sulla lavagna, predisporre un microfono portatile per registrare eventuali domande, e via dicendo. E’
molto difficile prevedere ogni possibile scenario, e in questo spesso è di aiuto solamente l’esperienza.
Per prevenire possibili problemi ed inconvenienti va quindi previsto un periodo più o meno lungo di
training.
13
C’è poi la necessità di integrare i differenti contributi multimediali per realizzare un prodotto finale che
comprenda tutti gli aspetti della lezione. Proprio in questa ottica si introdurrà nel prossimo capitolo un
modello di erogazione ad hoc.
Infine, non sono da escludere interventi di editing video a posteriori per migliorare il risultato finale.
14
CAPITOLO 2
Modello di riferimento per le modalità di erogazione
Nel primo capitolo sono stati evidenziati alcuni aspetti pratici dell’autoproduzione di materiale
didattico. Ad esempio: quali sono i vantaggi e gli svantaggi della fruizione on-line ed off-line? Quali le
maggiori differenze tra la fruizione “in presenza” della lezione e quella differita? Quali i parametri da
considerare e tenere sotto controllo quando si decide di realizzare materiale didattico fruibile a
distanza? La risposta a questi e ad altri interrogativi posti nel corso del primo capitolo porterà ad
effettuare scelte implementative ben precise.
Ma per poter intraprendere questo passo manca un anello fondamentale della catena: l’individuazione
di un modello di riferimento per le modalità di erogazione. Tale modello rappresenta la sintesi, operata
in maniera organica e metodica, di quanto detto finora; un’implementazione assonante del modello
dovrebbe dunque costituire la risposta al problema.
15
2.1 Definizione del modello attraverso esempi
Un primo approccio al problema della definizione di un modello consiste nel considerare possibili
scenari implementativi e dedurre le proprietà ed i vincoli del modello a partire da tali esempi concreti
attraverso un procedimento di astrazione e semplificazione. La semplificazione, nel nostro caso, non
consiste nel trattare il problema in termini generici, ma nel coglierne solo gli aspetti significativi. Ad
esempio, un’aula consente molte forme di interazione, dallo studente che utilmente pone un domanda al
docente all’inutile chiacchiericcio tra i presenti. Il nostro modello includerà solo le forme di interazione
utili ai fini didattici.
La sequenza di eventi caratteristici di una lezione, nel caso di produzione immediata di materiale
didattico, può essere sinteticamente descritta in questo modo: il professore
1. entra in aula;
2. predispone le apparecchiature per la registrazione ed esegue il tuning ambientale;
3. avvia la registrazione della lezione;
4. tiene la propria lezione di fronte agli studenti
4.1 parla
4.2 scrive
4.3 indica
4.4 …
5. al termine della lezione, interrompe la registrazione;
6. esce dall’aula con il supporto multimediale contenente la registrazione.
Questa scaletta è generica ed incompleta: ad esempio non tiene conto di sospensioni temporanee della
lezione, di interruzioni nella registrazione, di fasi finali di montaggio del prodotto multimediale e via
dicendo. Però a grandi linee essa rappresenta la più comune successione temporale degli eventi.
Ciò detto, si ipotizzi uno scenario basato su tale scaletta. Per evidenziare le corrispondenze, verrà
utilizzata la stessa numerazione già adottata sopra: il professore
1. entra in un’aula attrezzata ai fini della registrazione;
2. predispone le telecamere (posizione, orientamento, messa a fuoco,…), collega ed imposta il
microfono, prepara i contributi multimediali da presentare tramite lavagna luminosa,
videoproiettore o PC;
3. schiaccia il tasto REC di un’apparecchiatura, hardware o software, deputata alla registrazione;
4. tiene la propria lezione, considerando i limiti ed i vincoli imposti dalla registrazione in corso; ad
esempio, se la videocamera è puntata sul suo volto, egli cercherà di minimizzare gli
spostamenti;
5. schiaccia il tasto STOP del sistema di registrazione;
6. esce dall’aula con il CD-ROM o la videocassetta contenente la registrazione.
Prendendo spunto da questa descrizione esemplificativa, nel prossimo paragrafo si definirà un modello
di riferimento per le modalità di erogazione per enumerazione dei vincoli.
16
2.2 Definizione del modello per enumerazione dei vincoli
Nel definire il modello si cerca ora di evidenziarne alcune caratteristiche fondamentali ed enumerarne i
vincoli irrinunciabili. Come già accennato nel corso del precedente paragrafo, l’attenzione è rivolta a
sottolineare gli aspetti principali del problema, tralasciando elementi ritenuti privi di rilevanza
didattica, che potrebbero rappresentare piuttosto una causa di inefficienza (dispendio di risorse in
termini economici, in termini di spazio occupato sul supporto multimediale, in termini di banda usata
per la trasmissione a distanza e via dicendo…)
Il modello di erogazione che verrà ora definito servirà come punto di riferimento per le considerazioni
del Capitolo 3, in cui ci si sposterà al piano implementativo.
Procediamo dunque nell’enumerazione di quei vincoli ritenuti irrinunciabili per il modello:
autoproduzione diretta da parte del docente
Il docente deve disporre dei mezzi tecnici e deve acquisire facilmente le conoscenze per utilizzare il
prodotto scelto. Quindi lo strumento che implementa il modello deve essere:
• di facile apprendimento;
• di facile configurazione (sul luogo di lezione);
• di facile uso;
• utilizzabile dal docente senza la necessaria presenza di altri operatori.
L’aggettivo “diretta”, poi, riassume differenti aspetti; significa infatti:
• senza intermediari, ossia senza avvalersi dell’aiuto di operatori, di collaboratori e di tecnici;
• senza appoggiarsi a strutture terze, evitando cioè qualunque forma di outsourcing;
• immediata dal punto di vista temporale; l’obiettivo è consentire al docente di uscire dall’aula al
termine della lezione con il prodotto multimediale pressoché finito.
produzione a basso costo
Questa specifica impone il rispetto di vincoli economici. Apparentemente si tratta di un problema
pratico che influenza più la scelta dell’implementazione che il modello. In ogni caso il modello deve
consentire implementazioni a basso costo.
materiale fruibile a distanza
L’obiettivo dichiarato non è quello di rendere più comprensibile, interessante o valida la lezione fruita
“in presenza”. Anzi, da questo punto di vista il modello deve influenzare in misura minima lo
svolgimento della lezione stessa, lasciando piena libertà al docente sulla scelta dei tempi e degli
strumenti ritenuti più validi per trasmettere il messaggio didattico. Lo scopo è la produzione di
materiale fruibile a distanza, cioè riuscire a catturare in una lezione tutti quegli elementi ritenuti
importanti a fini didattici, minimizzando così gli svantaggi di una fruizione a distanza.
17
2.3 Composizione del messaggio didattico
Messaggio audiovisivo
monoaudio monoscena
PARTE VIDEO
PARTE AUDIO
OR
Audio
Scena
XOR
Docente
(illustrazione)
XOR
Studenti
(domande)
Immagini
statiche
Filmati
Audio
preregistrato
XOR
Da memoria
Dal vivo
- annotazioni a mano
- disegni
- fotografie
- grafici
- testi stampati
XOR
Da mem. digitale
(deposito)
- disegni
- fotografie
- grafici
- presentazioni
- testi digitali
Da mem. analogica
(protolavagna)
- pre-annotazioni
- disegni
- fotografie
- grafici
- testi stampati
XOR
Da memoria
- filmati analogici
(TV, VHS & C.)
- filmati digitali
(HD, CD, DVD,
Web)
Dal vivo
- mimica facciale
- altri movimenti
(corpo, mani,…)
- esperimenti
Legenda:
parte audio
parte video
Schema del modello di erogazione di un messaggio didattico frontale
18
CAPITOLO 3
Due prodotti a confronto
Nel corso dei precedenti capitoli sono stati evidenziati vincoli e problematiche da tenere in
considerazione quando ci si pone il problema di realizzare materiale di insegnamento fruibile a
distanza.
L’interrogativo iniziale alla base dell’intera relazione era: come autoprodurre in modo semplice,
efficace ed economico materiale didattico fruibile a distanza? Finora si è fornita una risposta di stampo
teorico: il risultato può essere ottenuto identificando, catturando ed integrando i molteplici contributi
multimediali ritenuti significativi a scopi didattici. In estrema sintesi, la produzione deve essere
interoperabile, dinamica e a basso costo, e deve realizzare concretamente il modello di erogazione
descritto nel Capitolo 2.
In questo terzo capitolo si cerca invece una soluzione pratica al problema. Ci si chiede: quali strumenti
tecnologici sono oggi commercialmente disponibili per integrare in un unico prodotto finale immagini
statiche, filmati, voce e altri contributi sonori? Quali prodotti meglio interpretano e concretizzano il
modello di cui si è parlato nel precedente capitolo? Il campo delle alternative è davvero vasto, e spazia
dai packages di videoconferenza al software delle schede di acquisizione video. La scelta viene però
facilitata dall’aver individuato un preciso modello di erogazione da implementare, e da considerazioni
aggiuntive di carattere economico, pratico ed organizzativo.
In definitiva, tra i prodotti recenti e meno recenti assonanti al modello più volte citato, ve ne sono un
paio che meritano particolare attenzione: Sony PCS-DS150/DS150P e TechSmith Camtasia. A
testimonianza della varietà di soluzioni, si evidenzia fin d’ora che le strade intraprese dai due prodotti
sono nettamente differenti: il primo implementa una soluzione di tipo hardware, mentre l’approccio del
secondo è di tipo software.
Nel corso dei primi paragrafi si avrà modo di descrivere nel dettaglio tali prodotti e le loro
caratteristiche, mentre il terzo paragrafo riporterà le prestazioni dichiarate dai produttori, il che
consentirà un confronto diretto tra i prodotti, eseguito sulla base delle caratteristiche dichiarate per
ciascuno di essi.
19
3.1 Il prodotto Sony PCS-DS150/DS150P
Sony PCS-DS150/DS150P è un hardware di selezione manuale
istantanea tramite levetta di ingressi analogico-digitali verso un’uscita
analogica di tipo MONITOR OUT. L’unità è stata ideata sia per il
funzionamento indipendente, sia per essere integrata nel package per
videoconferenze Sony PCS-1500/1500P. L’aspetto dell’apparecchio è
estremamente compatto, cosa che lo rende facilmente trasportabile.
I connettori degli ingressi (RGB IN, AUX IN) e dell’uscita
(MONITOR OUT) sono sulla base. Un ulteriore ingresso, che non ha
bisogno di connettore, è la testa dell’unità, che contiene una
videocamera multiuso; essa può essere agevolmente richiusa, in modo
da evitare danneggiamenti e contenere ulteriormente le dimensioni. Il
braccio che connette la testa al corpo è snodabile e può essere adattato
a diverse esigenze: acquisizione di documenti su superficie piana,
ripresa di soggetti vicini,… Per semplificare ulteriormente l’acquisizione di contributi appoggiati su
superfici piane o mantenuti in posizione verticale, la lente della videocamera può essere ruotata e
adeguarsi dunque all’orientamento del foglio.
Alla base dell’apparecchio si trovano le porte di entrata ed uscita per i segnali video (RGB IN, AUX
IN, MONITOR OUT), i pulsanti per il funzionamento (accensione e spegnimento, selezione della
sorgente di input,…) e le regolazioni della videocamera (luminosità, messa a fuoco, zoom, controlli
RGB).
Un’ulteriore uscita è quella consentita dalla sfera posta in cima al corpo, un emettitore di raggi
infrarossi esplicitamente concepito per la connessione wireless con il proiettore Sony PCS-1500/1500P.
Nello schema seguente, tratto dal manuale di istruzioni in formato cartaceo, sono illustrati i possibili
collegamenti con sorgenti in input.
20
Si torni a considerare il modello di erogazione ideale descritto nel Capitolo 2. Immergendosi in uno
scenario didattico, il PCS-DS150/DS150P sarebbe in grado di catturare la gestualità e la mimica
facciale del professore, le immagini della lavagna acquisite con la videocamera, i documenti cartacei
presentati nel corso della lezione e ripresi dalla videocamera proprietaria e perfino le schermate di un
PC eventualmente utilizzato a sussidio degli altri strumenti. Apparentemente le possibilità di
interconnessione e quindi di integrazione di elementi multimediali sono dunque soddisfacenti, ma ad
un’analisi più dettagliata questa impressione scompare. Innanzi tutto, si nota la possibilità di acquisire
solo segnali video. Volendo procedere ad una registrazione audio, indispensabile per la comprensione
dei contenuti didattici, il montaggio andrebbe effettuato a posteriori, con problemi di sincronizzazione
tra i due stream. Ci si dovrebbe inoltre dotare di un’ulteriore apparecchiatura dedicata all’audio. Un
altro problema che balza all’occhio è dato dall’unica uscita, per di più di tipo analogico televisivo.
Questa implementazione, particolarmente adeguata alla fruizione immediata attraverso proiettori o
schermi televisivi, risulta invece problematica se si vuole procedere nella registrazione: in pratica,
viene forzato l’uso di un comune videoregistratore, che non consente fasi di ulteriore montaggio o
editing a posteriori; l’alternativa è l’adozione di un sistema di acquisizione video montato all’interno di
un elaboratore, in cui mandare in input l’uscita del PCS-DS150/DS150P.
Non si deve dimenticare, infine, che i diversi canali in ingresso sono in alternativa e non possono
coesistere contemporaneamente nel segnale di uscita: come precedentemente evidenziato, il prodotto
Sony è un hardware di selezione degli ingressi e non di missaggio. Ad esempio, la visualizzazione delle
schermate del PC implica una temporanea sospensione nella visione della lavagna e dei documenti
cartacei poggiati alla base dell’unità. Il montaggio del segnale di uscita è perciò estremamente
rudimentale; in pratica consiste nella scelta istantanea di quale canale mandare in output tra quelli in
input, scelta che deve essere effettuata in real time durante la lezione. Tutta l’informazione scartata
attraverso la selezione della sorgente non potrà mai essere recuperata, neppure prevedendo sessioni di
editing a posteriori.
In definitiva, l’unità Sony PCS-DS150/DS150P è di semplice configurazione e di pratico utilizzo. I
collegamenti sono molto intuitivi, così come l’uso del pannello di controllo in dotazione. La trattazione
del segnale acquisito tramite videocamera incorporata è completa, e prevede funzioni sofisticate di
zoom e di messa a fuoco automatica. Il controllo del segnale permette di superare condizioni ambientali
difficili, quali ad esempio la scarsa luminosità. Tutte queste impostazioni sono gestibili in automatico o
manualmente. L’unità è inoltre maneggevole e compatta, e può essere integrata con facilità all’interno
di sistemi più evoluti di videoproiezione.
L’apparecchio presenta però alcuni aspetti negativi che non possono essere trascurati: costo d’acquisto
elevato, mancanza di una sezione audio, montaggio rudimentale del segnale video in uscita, necessità
di operare una scelta della sorgente in real time, bassa risoluzione del segnale video generato.
Per quanto riguarda le caratteristiche del segnale in uscita (segnale analogico televisivo), si rimanda al
paragrafo B.2.1 dell’Appendice tecnica.
21
Monitor OUT
Uscita
wireless
Legenda:
parte audio
parte video
connettori fisici o funzioni
Messaggio audiovisivo
monoaudio monoscena
PARTE VIDEO
OR
Audio
Scena
PARTE AUDIO
ASSENTE
XOR
Docente
(illustrazione)
XOR
Studenti
(domande)
Immagini
statiche
Filmati
Audio
preregistrato
XOR
Da memoria
Fotocamera
integrata
Dal vivo
XOR
RGB IN
Da mem. digitale
(deposito)
- disegni
- fotografie
- grafici
- presentazioni
- testi digitali
Videocamera
esterna aggiuntiva
connessa a
AUX IN
- annotazioni a mano
- disegni
- fotografie
- grafici
- testi stampati
Da mem. analogica
(protolavagna)
- pre-annotazioni
- disegni
- fotografie
- grafici
- testi stampati
RGB IN
Da memoria
- filmati analogici
(TV, VHS & C.)
- filmati digitali
(HD, CD, DVD,
Web)
XOR
Videocamera
esterna aggiuntiva
connessa a
AUX IN
Dal vivo
- mimica facciale
- altri movimenti
(corpo, mani,…)
- esperimenti
Etichettatura dello schema del modello di erogazione di un messaggio didattico frontale
secondo le funzioni gestibili con l’hardware Sony PCS-DS150/DS105P
22
3.2 Il prodotto TechSmith Camtasia
TechSmith Camtasia è un software di selezione e fusione manuale – tramite il mouse – di canali digitali
provenienti da packages preinstallati sul PC e di segnali analogico/digitali provenienti da periferiche di
acquisizione collegate al PC stesso. Tutto quanto viene visualizzato a video ed emesso dai diffusori
rappresenta un input per la registrazione.
Camtasia include una raccolta di pacchetti software: tra essi, evidenziamo la presenza di un registratore
(Camtasia Recorder), un viewer (Camtasia Standalone Player), un software di editing (Camtasia
Producer), un codec audio-video del quale la parte video è proprietaria (TSCC, TechSmith Screen
Capture Codec) e strumenti di supporto (tra cui Camtasia Recovery Tool, per recuperare i filmati in
caso di crash del sistema).
Per rispondere alle esigenze di produzione del materiale didattico secondo le modalità descritte nel
Capitolo 2, il software in esame deve necessariamente avvalersi di componenti hardware adeguate.
Sarà dunque indispensabile la presenza di una postazione multimediale con sistema operativo
Windows, di una videocamera in ingresso all’elaboratore e di un microfono. A questa configurazione
minimale potrebbero poi essere aggiunte ulteriori periferiche (videocamera e microfono aggiuntivi,
lettore DAT,…), che comunque devono interfacciarsi con il PC sia da un punto di vista hardware che
software.
Camtasia è infatti un programma di cattura audio e video che ha l’obiettivo di memorizzare con una
certa frequenza di campionamento le schermate di un elaboratore, sincronizzando il flusso video con
l’audio catturato da sorgenti interne o esterne al PC. Tutto quello che viene presentato a video,
indipendentemente dalla sua origine, diventa parte del filmato prodotto da Camtasia. Da qui la
necessità di disporre non solo delle apparecchiature hardware, ma anche dei programmi per
visualizzare correttamente sul desktop le informazioni che queste producono. In realtà si tratta di un
finto problema: praticamente tutte le periferiche che si interfacciano direttamente con il PC hanno in
dotazione il software in questione, o sono supportate da programmi annessi al sistema operativo.
L’elaboratore riveste dunque un ruolo centrale: attraverso le proprie possibilità di gestire input e output,
esso fornisce all’intero sistema un’elasticità notevole. Tra gli ingressi più comuni, troviamo sulla
scheda audio la presa jack per il microfono (MIC IN), la porta MIDI e un generico jack AUX IN per
connettere altre sorgenti, tra cui l’impianto HI-FI, un lettore CD, MiniDisc o DAT (Digital Audio
Tape) e via dicendo; è talvolta presente un ingresso digitale, per evitare la doppia conversione D/A e
A/D in uscita da dispositivi digitali. Per quanto riguarda gli input video esterni al PC, ci si deve affidare
a schede di acquisizione video dedicate e quasi mai presenti nella configurazione base di un
elaboratore. Gli ingressi sono in vari formati e consentono di importare segnali analogici e digitali,
provenienti da videocamere, televisori, antenne televisive,…
Abbiamo ora analizzato alcuni possibili input da sorgente esterna. Ma non dobbiamo dimenticare che,
dal punto di vista di Camtasia Recorder, tutto quanto viene visualizzato a video ed emesso dai diffusori
rappresenta un input per la registrazione. Quindi, ai contributi audio e video elencati vanno aggiunte
tutte le possibilità “endogene” tipiche di una postazione multimediale: documenti in formato elettronico
(DOC, PDF, XLS, MDB,…), esecuzione di file audio (WAV, VOC, AU, AIFF, MIDI, MP3,…),
immagini statiche (BMP, GIF, TIFF, JPG,…), filmati (MPEG, AVI, RealMedia,…), presentazioni,
animazioni, pagine web e via dicendo.
Il quadro complessivo è notevolmente articolato e complesso, e le numerose combinazioni rendono
possibile la creazione di materiale didattico ad hoc per le esigenze più particolari. Ipotizziamo alcuni
scenari inusuali: in un seminario di musica contemporanea vanno privilegiati i contributi audio, e
23
quindi all’elaboratore potrebbero essere collegati tutti i dispositivi necessari ad una riproduzione
ottimale del materiale sonoro (DAT, lettore CD, lettore DVD, apparecchiature di sound processing,…);
nel caso della presentazione di un avveniristico film con effetti speciali, invece, l’attenzione si focalizza
sulle immagini, e questo comporterebbe un maggior peso delle apparecchiature di riproduzione video.
In entrambi i casi descritti, se supportato da apparecchiature hardware adeguate, Camtasia si comporta
in modo soddisfacente.
L’approccio software del prodotto TechSmith è molto flessibile; bisogna però interrogarsi sulle reali
capacità di cattura di Camtasia. Finora infatti si è parlato unicamente di possibilità teoriche; ma con
quale frequenza Camtasia riesce a campionare i canali audio e video? Con quale bit-rate e frame-rate?
Questi argomenti saranno trattati diffusamente nel capitolo di test del software (Capitolo 4) e
nell’appendice dedicata (Appendice A).
In definitiva, TechSmith Camtasia non impone alcun limite teorico alle possibilità di integrazione di
elementi multimediali: tutto ciò che è possibile visualizzare sul monitor e sentire dai diffusori può
comparire nel risultato finale della registrazione.
Trattandosi di un software di cattura delle schermate, la presenza contemporanea di più finestre (e
quindi di più documenti e di più input video) viene correttamente gestita. Analogamente, per quanto
riguarda l’acquisizione audio la sovrapposizione di più sorgenti non crea alcun problema e viene
fedelmente registrata.
La qualità video del prodotto finale è garantita dall’adozione di codec ad hoc, configurabili a seconda
delle esigenze. Ad esempio, la risoluzione video può essere spinta a valori anche molto alti, che
penalizzano però le dimensioni del filmato finale. Un audio non compresso o l’adozione del codec
audio MP3 garantiscono una fedeltà sonora paragonabile agli standard CD-audio.
Trattandosi di software, è assolutamente indispensabile la presenza in aula di un PC su cui installare
Camtasia. La soluzione Sony contemplava il collegamento con un elaboratore, ma si trattava di una
possibilità e non di un’esigenza. I sistemi operativi supportati da Camtasia sono solo quelli della
famiglia Windows (Windows 95, 98, ME, NT, 2000 e XP); è prevista a breve una release per Linux.
Il prodotto finale della registrazione è un file multimediale, che può essere ulteriormente editato a
posteriori. La memorizzazione su supporti ottici è operazione particolarmente semplice (subordinata
alla presenza di un masterizzatore all’interno del PC), così come l’eventuale diffusione via Web.
Il costo dell’intero pacchetto è decisamente inferiore a quello del Sony PCS-DS150/DS150P, ma su
questa valutazione incide la necessità di dotarsi di alcune apparecchiature hardware aggiuntive (almeno
la scheda di acquisizione video). Nella valutazione economica delle due soluzioni, non si deve
tralasciare il fatto che l’unità Sony fornisce anche una videocamera integrata, seppure rudimentale.
24
Legenda:
parte audio
parte video
ingressi o funzioni
canale proveniente da PC
Camtasia Producer
Camtasia Recorder
Camtasia Recovery Tool
Digital holder
Messaggio audiovisivo
monoaudio monoscena
Codec overall
PARTE AUDIO
PARTE VIDEO
OR
Audio
Scena
Codec audio
Codec video
XOR
Microfoni esterni
di studenti
Microfono esterno
di docente*
Docente
(illustrazione)
XOR
Studenti
(domande)
Immagini
statiche
Filmati
Audio
preregistrato**
XOR
* = eventualmente incorporato in
videocamera esterna
** = colonna sonora anche da
filmato; voce; suono
cardiaco, polmonare,…
Videocamera
esterna
Da memoria
Dal vivo
XOR
Fotocamera
esterna
Da mem. digitale
(deposito)
- disegni
- fotografie
- grafici
- presentazioni
- testi digitali
Da mem. analogica
(protolavagna)
- pre-annotazioni
- disegni
- fotografie
- grafici
- testi stampati
- annotazioni a mano
- disegni
- fotografie
- grafici
- testi stampati
Da memoria
- filmati analogici
(TV, VHS & C.)
- filmati digitali
(HD, CD, DVD,
Web)
XOR
Videocamera
esterna
Dal vivo
- mimica facciale
- altri movimenti
(corpo, mani,…)
- esperimenti
Etichettatura dello schema del modello di erogazione di un messaggio didattico frontale
secondo le funzioni gestibili con il package TechSmith Camtasia.
Lo schema evidenzia anche le periferiche di cattura di cui Camtasia ha bisogno.
25
3.3 Schede delle prestazioni dichiarate
3.3.1 Caratteristiche generali
Produttore
Sito del produttore
Tipo di approccio
Prezzo al pubblico*
Prodotto finale
PCS-DS150/DS150P
Sony
www.sony.com
hardware
2120.00 US$
filmato analogico
Camtasia
TechSmith
www.techsmith.com
software
149.95 US$
filmato nei formati AVI, ASF,
GIF animata,
RM (RealMedia),
MOV (Quick Time),
WMV (WindowsMedia)
sì
digitale su memoria di massa
monitor PC
(800x600 px, 1024x768 px,…)
Richiede uso PC
no
Formato di registrazione
analogico su nastro VHS
Risoluzioni di output
segnale analogico TV
supportate
(460 o 470 righe)
* il prezzo al pubblico riportato è quello consigliato dai rispettivi produttori per acquisti unitari al dettaglio
3.3.2 Input supportati
Ingresso video analogico
Ingresso video digitale
Ingresso audio analogico
Ingresso audio digitale
PCS-DS150/DS150P
sì
sì
no
no
Camtasia
sì (richiede scheda acquisizione)
sì (richiede scheda acquisizione)
sì (richiede scheda audio)
sì (richiede scheda audio)
PCS-DS150/DS150P
no
Camtasia
sì
no
sì
in real-time
no
in real-time
sì
3.3.3 Editing audio e video
Supporta compresenza nel
filmato di più sorgenti audio
Supporta compresenza nel
filmato di più sorgenti video
Selezione sorgenti input
Post-editing
3.3.4 Supporto all’uso del PC
L’uso del PC è del tutto naturale in Camtasia, dato che si tratta di software e perciò richiede di girare su
un elaboratore. Di conseguenza, tutti i file multimediali supportati dal PC in uso possono essere
catturati da Camtasia.
Per quanto riguarda il Sony PCS-DS150/DS150P, esso non richiede l’uso del PC. La presenza
dell’elaboratore in ingresso (vedi schema del paragrafo 3.1) è però indispensabile se si vuole registrare
un’animazione, un filmato o qualsiasi altro documento presente sul PC.
26
3.3.5 Conclusioni
Lo scenario per il quale valutiamo i due prodotti è ben definito: si tratta dell’autoproduzione di
materiale di insegnamento da parte del docente, fruibile anche a distanza. Come illustrato nel corso del
Capitolo 1, la lezione è un momento didattico articolato: molti sono i segnali che il docente lancia agli
studenti, attraverso le parole, il tono di voce, i gesti, i disegni, le annotazioni, il materiale scelto per
l’esposizione e così via… Il nostro scopo è catturare tutti questi segnali, cercando di integrarli tra loro
in maniera efficace. In questa ottica, l’unità Sony si rivela assai più carente se confrontata con il
software TechSmith. Grazie alla sua flessibilità, Camtasia consente un gran numero di combinazioni
multimediali, anche contemporanee, e si adatta ad ogni esigenza didattica. L’unità Sony, invece, appare
più adeguata a scenari quali la videoconferenza, in cui un canale audio e uno video sono solitamente
sufficienti.
Il prezzo delle due soluzioni è notevolmente diverso, ed anch’esso favorevole a Camtasia. Seguire
questa strada impone però l’acquisto di periferiche hardware abbastanza costose (videocamera digitale,
scheda di acquisizione video,…) e solitamente non incluse nella dotazione di default di un PC
multimediale.
La facilità d’uso propende invece a favore del prodotto Sony: è più immediato collegare tre cavi alle
porte del PCS-DS150 piuttosto che configurare un PC ed apprendere l’utilizzo di un software. Questo
vantaggio viene però pagato in termini di limitatezza di combinazioni consentite dall’unità Sony. Va
poi detto che l’interfaccia di Camtasia rievoca fedelmente quella di ogni apparato di
riproduzione/registrazione hardware (registratore di cassette, videoregistratore, DAT, MiniDisc,…) e
software (registratore di suoni, Windows Media Tools, WinAmp,…). Gli standard legati a questo tipo
di interfaccia rendono immediatamente operativo l’utente di Camtasia.
27
CAPITOLO 4
Test su TechSmith Camtasia
In questo capitolo vengono presentati alcuni test mirati a verificare determinate caratteristiche di
TechSmith Camtasia. Le prove sono tali da ridurre al minimo il numero di variabili in gioco, proprio
per evidenziare peculiarità ben precise del prodotto.
Tutti i filmati ottenuti sono presenti nel CD allegato, nella directory test. Ciascuno di essi viene
descritto e commentato in un paragrafo dedicato.
Sono stati eseguiti 2 tipi di test:
1. prove singole per verificare le capacità e l’affidabilità di Camtasia. E’ il caso di test_01.avi,
nel quale vengono aperte svariate applicazioni contemporaneamente per sondare il
comportamento di Camtasia quando ci si alterna tra diversi programmi e diversi tipi di file.
2. prove comparative, nelle quali vengono svolte le stesse operazioni variando singoli parametri e
testandone l’impatto sulla registrazione. Ad esempio, lo stesso filmato viene realizzato con
differenti codec di compressione video, o con differenti formati audio, o variando la risoluzione
dello schermo. Per garantire la massima uniformità nelle prove comparative, le operazioni in
sequenza non vengono eseguite manualmente ma sono affidate a macro preventivamente
registrate.
Le prove presentate nel corso del capitolo, pur rappresentando casi molto particolari e talvolta estremi
di utilizzo, simulano realisticamente il comportamento “sul campo” di Camtasia; il loro esito può
influenzare le scelte da operare poi in contesto applicativo. Ad esempio, si vedrà il notevole impatto
che ha il codec sulla qualità dell’immagine e sull’occupazione di memoria di massa.
Gli elaboratori su cui sono stati effettuati i test, chiamati in seguito per brevità ELA1 ed ELA2,
vengono descritti nel dettaglio nel paragrafo A.3 dedicato ai requisiti di sistema di TechSmith
Camtasia. Essi differiscono per caratteristiche hardware (ELA1 è un PC di fascia entry-level di circa 3
anni fa, mentre ELA2 presenta una configurazione recente dalle elevate prestazioni) e software (su
ELA1 è installato il sistema operativo Microsoft Windows 2000, su ELA2 Microsoft XP).
Alcune avvertenze fondamentali:
• per visualizzare correttamente i filmati è consigliato l’utilizzo di Windows Media Player (la
versione 7.1 è allegata nel CD); è inoltre necessario aver installato i codec con cui sono stati
prodotti i filmati, anch’essi presenti nel CD;
• i filmati di grande dimensione potrebbero mettere in crisi i lettori CD, soprattutto quelli meno
recenti e veloci, a causa del limitato transfer rate. Per non introdurre ritardi nella
visualizzazione, si consiglia di copiare i file su disco fisso.
28
4.1 Uso simultaneo di diversi programmi
Filmato di riferimento: test_01.avi
Elaboratore utilizzato: ELA1
Scopo principale: mettere in luce la capacità del software di gestire contributi multimediali di tipo
diverso, ed evidenziare il comportamento di Camtasia quando ci si alterni rapidamente tra differenti
applicazioni.
Scopo secondario: valutare eventuali rallentamenti nell’esecuzione delle operazioni ordinarie e
nella registrazione dovuti all’uso simultaneo di applicativi onerosi dal punto di vista di occupazione di
risorse.
Descrizione del test
Durante il test, sono stati lanciati in sequenza differenti applicativi. Ogni operazione è commentata
dalla voce fuori campo, catturata attraverso l’ingresso line in della scheda audio.
In particolare, è stato aperto il WinAmp 2.8 per ascoltare file audio di tipo MIDI e MP3.
Contemporaneamente è stato avviato Microsoft Word 2000, allo scopo di aprire un documento di tipo
DOC, quindi Excel 2000 ed infine PowerPoint 2000. Con quest’ultimo software è stata lanciata una
presentazione, ingrandita a schermo intero. Infine, sono stati aperti in sequenza Corel PhotoPaint 7 (per
la visualizzazione di un file GIF), Internet Explorer 6.0 (per eseguire una ricerca di immagini attraverso
Google) e il solitario di Windows 2000.
Commenti
Nel corso della registrazione, nonostante l’elaboratore di riferimento non fosse particolarmente potente
(vedi paragrafo A.3), solo di rado si è notato un rallentamento – peraltro trascurabile – nell’esecuzione
delle operazioni. Si precisa che le sbavature nell’esecuzione del file MIDI sono già state riscontrate
durante la fase di registrazione, e non sono perciò dovute ad un errato campionamento da parte di
Camtasia. Esse evidenziano semmai un altro problema, da tenere in debita considerazione: la
registrazione full screen è certamente un’operazione onerosa dal punto di vista delle risorse di sistema,
e può causare rallentamenti negli applicativi.
Risultati e conclusioni
Apprezzabile la possibilità di fondere contributi audio di natura diversa: potenzialmente, tutti i canali
audio consentiti dalla scheda adottata possono sovrapporsi nella registrazione. Questa possibilità è
importante dal punto di vista didattico, perché consente ad esempio di commentare con il microfono un
filmato già dotato di un proprio audio.
Dal punto di vista del supporto di file, la domanda corretta da porsi non è “Quali file riesce a
memorizzare Camtasia nella registrazione?”, bensì “Quali file riesce ad aprire e gestire
contemporaneamente l’elaboratore in uso?”. La risposta al secondo quesito coincide con quella al
primo, il che è logico per un software che si occupa di cattura audio e video. Da questo punto di vista
Camtasia è uno strumento molto potente, e non limita in alcun modo il relatore nella scelta dei
contributi multimediali da presentare agli uditori. Unica avvertenza: l’installazione di programmi
durante la registrazione provoca inevitabilmente un crash di sistema.
29
4.2 Compressione audio
Filmati di riferimento: test_02a.avi, test_02b.avi, test_02c.avi, test_02d.avi
Elaboratore utilizzato: ELA1
Scopo: valutare l’impatto della scelta del codec audio sulle dimensioni e sulla qualità del filmato
Descrizione del test
L’attenzione si concentra ora sull’audio. Per esemplificare le diverse possibilità, sono stati registrati in
sequenza un breve brano sinfonico tratto da un CD audio (Benjamin Britten – incipit da The young
person’s guide to the Orchestra) e il parlato di un tutorial disponibile su CD-ROM.
Per limitare l’impatto delle immagini a video sui risultati della prova comparativa sono stati adottati
alcuni accorgimenti:
1. le operazioni svolte sono esattamente le stesse in ciascuno dei 4 filmati. Al fine di evitare la
benché minima differenza (movimenti diversi del mouse, maggior ritardo nello svolgere
un’azione,…), è stata approntata una macro che fa partire la registrazione e quindi avvia i file
audio;
2. il codec video, la risoluzione, la profondità di colore, la posizione delle finestre e via dicendo
sono esattamente uguali in tutti i filmati. L’unica differenza consiste nelle diverse impostazioni
dei parametri audio di registrazione, evidenziati nello specchietto riassuntivo finale;
3. proprio perché la prova coinvolge solo l’audio, il numero di colori dello schermo è stato ridotto
a 65536 e la risoluzione portata a 1024x768. Il codec video adottato è il TSCC.
Commenti
In questo campo, la scelta di una combinazione di parametri efficace dipende essenzialmente dagli
scopi della registrazione. Ad esempio, durante un seminario di musica contemporanea la qualità audio
della registrazione non può essere inferiore allo standard CD (stereo, 16 bit, 44100 Hz), che talvolta si
dimostra perfino insoddisfacente; durante una generica lezione, invece, al fine di limitare le dimensioni
del file prodotto, ci si potrebbe accontentare di una qualità molto inferiore (mono, 8 bit, 22050 Hz), cui
peraltro non corrisponde un eccessivo scadimento del risultato globale.
In definitiva, la configurazione dei parametri va effettuata caso per caso. Lo scopo del test è quello di
fornire solo delle linee guida nell’operare tale scelta.
Risultati e conclusioni
Nome del file
Caratteristiche
Bit rate Dimensioni
su CD
[KB/s]
audio
[KB]
test_02a.avi PCM 44100Hz 16 bit stereo 172 KB/s 17299 KB
test_02b.avi
PCM 8000Hz 8 bit mono
7 KB/s
1582 KB
test_02c.avi
MP3 22050Hz stereo
6 KB/s
1568 KB
test_02d.avi
MP3 11025Hz stereo
2 KB/s
1073 KB
30
Valutazione
musica
ottimo
insufficiente
discreto
sufficiente
Valutazione
parlato
ottimo
sufficiente
ottimo
buono
Caratteristiche comuni ai 4 filmati:
• durata: 1 min 35 sec
• codec video: TSCC
• risoluzione: 1024 x 768
• profondità di colore: 16 bit (65536 colori)
• frame rate richiesto: 5 fotogrammi/sec
Il file test_02a.avi presenta audio non compresso con codifica PCM, secondo gli standard CD audio
(2, canali, 16 bit per campione, frequenza di campionamento di 44100 Hz). Questo è il file di
riferimento con cui eseguire i raffronti, in quanto la sua qualità è identica ai file audio di origine e ne
rappresenta pertanto una copia fedele.
L’adozione di codifica MP3 (MPEG-2 layer 3) propria del filmato test_02c.avi non comporta
significative perdite di qualità audio, ed è forse il miglior compromesso in caso di applicazioni
generiche. La qualità della musica scade in modo lieve, mentre sul parlato è difficile riscontrare
differenze con la versione PCM. In compenso, balza immediatamente all’occhio l’effetto della
compressione sulle dimensioni del filmato, che risulta più piccolo di un ordine di grandezza. La
motivazione sta nel differente bit rate audio, che passa dai 172 KB/sec della codifica PCM ai soli 6
KB/sec dell’MP3.
Un livello paragonabile di riduzione delle dimensioni si ha nel caso di test_02b.avi, ove l’audio però
non è compresso. E infatti la qualità è decisamente inferiore, praticamente inaccettabile per qualsiasi
scopo: per ottenere l’effetto, si è dovuti passare da 2 canali a 1 solo canale (mono), da una frequenza di
campionamento a 44100 Hz a quella di 8 KHz e a campioni di 8 bit contro i 16 di test_02a.avi.
Infine, test_02d.avi rappresenta ancora uno standard qualitativamente buono, soprattutto per
applicazioni in cui la musica, se presente, sia di secondo piano (è il caso delle applicazioni didattiche di
cui ci si sta interessando in questa relazione). Ma se confrontiamo i benefici in termini di dimensioni
con la perdita di qualità audio, certamente test_02c.avi rappresenta ancora la migliore soluzione.
Un’ultima considerazione: l’associazione dei canali audio al filmato, una volta conclusa la
registrazione, è quasi immediata in caso di codifica non compressa; l’operazione di compressione
propria del formato MP3, invece, può risultare lunga, e dipende dalle capacità di elaborazione del
sistema. Il PC ELA1, ad esempio, ha impiegato circa 15 secondi per comprimere 1 minuto e 35 di
audio.
Per ulteriori chiarimenti sugli standard del segnale audio si rimanda il lettore al paragrafo B.3.
31
4.3 Sincronizzazione audio/video
Filmati di riferimento: test_03a.avi, test_03b.avi, test_03c.avi, test_03d.avi
Elaboratore utilizzato: ELA1, ELA2
Scopo: valutare i meccanismi di sincronizzazione tra immagini e audio
Descrizione del test
Per valutare la capacità di mantenere sincronizzati i flussi audio e video, sono stati effettuati due test
simili su file di tipo diverso.
Nel primo un file MIDI viene eseguito mentre la partitura scorre a video. Si tratta del III movimento
Presto dal Concerto Brandeburghese n° 4 in Sol maggiore BWV 1049 di J. S. Bach. L’esecuzione
MIDI, a patto di saper leggere la musica, permette di misurare le eventuali distanze temporali tra eventi
audio e video. Il software utilizzato allo scopo è Coda Finale 2002.
Nel secondo test un file wave in codifica PCM viene eseguito mentre sul monitor scorre la sua forma
d’onda. Si tratta del breve pezzo pianistico Haschemann dalle Kinderszenen op. 15 di R. Schumann. La
prova viene effettuata con il software Syntrillium CoolEdit 2000.
Commenti
Qual’è l’importanza della sincronizzazione tra audio e video? Da un lato, è antipatico e fastidioso per il
fruitore di un filmato constatare un ritardo tra ciò che vede e ciò che sente. Ma soprattutto esistono casi
in cui è il problema della sincronia è critico: si pensi alla contemporanea visualizzazione ed ascolto di
esami fonocardiologici, o al commento di un filmato in cui il relatore velocemente illustra quanto viene
proiettato. Se si perde la sincronizzazione o si accumulano ritardi tra i flussi audio e video, questo ha un
impatto estremamente negativo sul risultato della registrazione.
E’ importante sottolineare preventivamente la differenza tra sincronizzazione audio/video e continuità
del filmato. La prima si basa su fotogrammi chiave nei quali audio e video risultano correttamente
sincronizzati: in altre parole, l’andamento temporale dei due flussi - almeno nei keyframe della
registrazione - rispecchia quello effettivo. Ma cosa avviene nei restanti fotogrammi? L’audio procede
con continuità, il video invece può avanzare a scatti. A questo proposito esistono problemi di natura
diversa, primo fra tutti la capacità dell’elaboratore di eseguire catture video con una certa frequenza.
Nelle prove fin qui effettuate su ELA1, non si è mai superata la frequenza di cattura di 7 frame al
secondo, nonostante le impostazioni richiedessero un valore più alto (si ricorda che anche questo è un
parametro configurabile in Camtasia). Il valore medio del frame rate riscontrato nelle prove con ELA1
è di 5 quadri al secondo. Gli standard cinematografici e televisivi, basati sull’effetto di persistenza
retinea, precedono invece un numero di fotogrammi al secondo compreso tra i 20 e i 30; è chiaro che 5
frame al secondo sia perciò un valore del tutto insufficiente a dare l’illusione del continuo. Di questo
fatto occorrerà tener conto durante la valutazione dei filmati.
Risultati e conclusioni
Per quanto riguarda il primo test (test_03a.avi), effettuato sulla macchina ELA1, il risultato non è
stato particolarmente soddisfacente. Innanzi tutto, la compressione MP3 adottata per l’audio introduce
effetti di click e di pop piuttosto fastidiosi, e non presenti al momento della registrazione. L’operazione
di compressione su ELA1 ha richiesto poco meno di un minuto a fronte dei 5 minuti di audio totali, un
tempo dunque piuttosto lungo.
32
Il test era incentrato sulla sincronizzazione, e in questo Camtasia ha mostrato dei seri limiti. Intorno a
battuta 30 già si accumula un ritardo di un q nell’inseguimento tra musica e partitura. Ad un metronomo
di h = 100, ciò significa 3 decimi di secondo. Al termine dell’intero movimento, il ritardo complessivo
accumulato è di addirittura 2 battute, ossia 8 q, ben 2 secondi e mezzo in una registrazione di 5 minuti e
9 secondi.
Apprezzabile però la capacità di compressione legata all’uso dell’MP3 nel filmato: più di 5 minuti di
registrazione occupano appena 4 MB di spazio su disco. Si tenga comunque presente l’estrema staticità
delle immagini.
Ritenendo la compressione MP3 una possibile causa di ritardo, si è effettuata nuovamente la
registrazione, sempre su ELA1, ma stavolta con audio non compresso PCM (vedi il file test_03b.avi).
La dimensione è ora di 53 MB, però i problemi di sincronismo risultano in buona misura risolti.
Volendo infine valutare l’impatto della potenza di calcolo sul risultato, è stato nuovamente effettuato il
primo test, ma sulla macchina ELA2, assai più performante (test_03c.avi). I problemi
precedentemente riscontrati vengono effettivamente minimizzati: nessun effetto di click e di pop,
ottimo inseguimento audio-video con qualche sbavatura nel finale. Al termine del filmato si ha quasi
mezza battuta di scarto tra il flusso audio e quello video, ma si tratta di una differenza minima in
un’applicazione non espressamente musicale.
Da evidenziare il fatto che la potenza di calcolo differente tra ELA1 ed ELA2 abbia influito solo nella
fase di cattura, ossia per quanto riguarda la miglior sincronizzazione e il movimento assai più fluido
della barra di scorrimento, ma non nella fase di visualizzazione. In altre parole, il filmato test_03a.avi
realizzato con ELA1 ed eseguito in Windows Media Player su ELA2 ha presentato immutati tutti i
difetti precedentemente esposti.
La seconda prova (test_03d.avi) viene effettuata su un file wave, e stavolta si è rinunciato a priori alla
compressione dell’audio. La breve durata del brano non consente una valutazione completa in merito,
però i flussi audio e video appaiono correttamente sincronizzati nel tempo.
In conclusione, l’audio incide pesantemente sulle dimensioni finali del filmato. La cosa appare evidente
se si considera che le immagini a video sono molto spesso statiche (escludendo i movimenti del
cursore), mentre gli eventi sonori devono essere necessariamente registrati con continuità. Nella
codifica PCM ciascun campione occupa sempre un numero costante di bit, anche se si tratta di silenzio
o di un valore che viene ripetuto inalterato per migliaia di volte. Questo rende i file wave
particolarmente pesanti, a meno che non si rinunci alla qualità audio (si veda a questo proposito il test
comparativo di paragrafo 4.2).
La compressione audio, e in particolare l’MP3, risolvebbe questo problema, abbattendo addirittura di
un ordine di grandezza la dimensione dei file, ma – come abbiamo visto – può introdurre forti ritardi
nella sincronizzazione, ritardi non sempre accettabili. Si tratta, in ultima analisi, della soluzione
ottimale, ma richiede una notevole potenza di calcolo.
33
4.4 Codec video a confronto: sequenza di immagini statiche
Filmati di riferimento: test_04a.avi, test_04b.avi, test_04c.avi
Elaboratore utilizzato: ELA1
Scopo: valutare l’impatto dell’adozione dei differenti codec sulla qualità finale del filmato e sulle sue
dimensioni
Descrizione del test
Il test riproduce una tipica situazione didattica: la lezione che si appoggia ad una presentazione
PowerPoint. Affinché i contributi sonori non abbiano impatto sul filmato finale, l’audio è stato escluso
dalla registrazione.
La presentazione si compone di 4 slide, e su ciascuna di esse ci si sofferma per 2 minuti.
I codec adottati sono: TSCC (test_04a.avi), Ligos Indeo 5.11 (test_04b.avi) e DivX 5.01
(test_04c.avi).
Risoluzione del monitor: 1156x864 pixel.
Profondità di colore: 32 bit (16,8 milioni di colori)
Risultati e conclusioni
I tre test hanno dato tutti un risultato soddisfacente sotto entrambi i punti di vista: alta qualità del
filmato prodotto e piccole dimensioni in termini di spazio occupato su disco.
Per quanto riguarda le dimensioni, il codec TSCC ed il DivX 5.01 sono stati più performanti:
rispettivamente 3,4 MB e 3,8 MB contro i 6,5 MB dell’Indeo.
Dal punto di vista della qualità, il TSCC ha dato il risultato migliore in assoluto. In effetti, come
dichiarato dal produttore, esso adotta un algoritmo di compressione senza perdita, e questo comporta
una qualità video ottima; il rovescio della medaglia dovrebbe essere una minor capacità di
compressione, ma il TSCC è ottimizzato proprio per le sequenza di immagini statiche, e infatti il
filmato test_04a.avi è anche quello che occupa meno spazio su disco. Nel file test_04b.avi, prodotto
con Indeo 5.11, si notano imperfezioni sui bordi laddove c’è un netto contrasto di colori; il fenomeno è
tipico di molte forme di compressione con perdita, quali ad esempio l’algoritmo JPEG per le immagini.
Infine, nel filmato DivX si rilevano veri e propri errori nella codifica di alcune aree dell’immagine, in
particolare dei blocchi di pixel neri.
In definitiva, sia per quanto riguarda le modeste dimensioni che per quanto concerne l’ottima qualità
video, bisogna dare atto a TechSmith di aver creato un codec davvero performante. Si sottolinea
comunque che questa serie di test verificava il comportamento dei codec proprio nelle condizioni più
favorevoli a TSCC.
Un’osservazione generale, che coinvolge indistintamente tutti i filmati, riguarda la scarsa occupazione
di spazio: al massimo 7 MB per più di 8 minuti alla risoluzione di 1152x864 pixel e con profondità di
colore a 32 bit (16,8 milioni di colori). Il risultato è davvero impressionante, anche se legato a:
1. assenza di audio, il cui impatto sulle dimensioni finali è davvero notevole, soprattutto se
conservato in formato non compresso (vedi paragrafo 4.2)
2. ampie possibilità di compressione spaziale (inter-frame) e temporale (intra-frame), dovute alla
staticità delle immagini a video; per maggiori chiarimenti, si rimanda al paragrafo B.2.3
34
4.5 Codec video a confronto: immagini in movimento
Filmati di riferimento: test_05a.avi, test_05b.avi, test_05c.avi
Elaboratore utilizzato: ELA1
Scopo: valutare l’impatto dell’adozione dei differenti codec sulla qualità finale del filmato e sulle sue
dimensioni
Descrizione del test
Il test riproduce una tipologia di lezione decisamente diversa da quella simulata nel paragrafo 4.2: in
quel caso, si trattava di una presentazione, cioè di una sequenza estremamente ripetitiva di frame; ora,
al contrario, si vuole testare il comportamento dei codec quando a video viene riprodotto un filmato. In
ambito didattico, potrebbe trattarsi della videocamera puntata sul volto dell’insegnante.
I codec adottati sono: TSCC (test_05a.avi), Ligos Indeo 5.11 (test_05b.avi) e DivX 5.01
(test_05c.avi).
Risoluzione del monitor: 1024x768 pixel.
Profondità di colore: 32 bit (16,8 milioni di colori)
Commenti
Il filmato da catturare al momento della registrazione non viene riprodotto a schermo intero, in quanto
non avrebbe senso dal punto di vista didattico: nell’utilizzo pratico di Camtasia, l’output della
videocamera puntata sul volto del docente o sulla lavagna occuperà sempre una finestra sul desktop e
presumibilmente non verrà mai mandato a schermo intero.
Allora, per simulare un ambiente realistico, si è scelto di catturare un desktop strutturato in maniera
complessa: sono contemporaneamente presenti tre videoclip riprodotti in sequenza da Windows Media
Player, un documento PDF aperto con Acrobat Reader ed infine un’area statica. Il cursore, enfatizzato
dall’effetto highlight di Camtasia, viene spostato per lo schermo. In queste prove viene registrato anche
l’audio, successivamente memorizzato in formato non compresso.
Risultati e conclusioni
I tre test hanno dato un esito molto simile per quanto riguarda l’occupazione di spazio su disco: 26,9
MB con il codec TSCC, 22,6 MB con l’Indeo 5.11 e 25,9 MB con il DivX 5.01. Sugli ultimi due
filmati pesa comunque la qualità video nettamente peggiore e una fluidità molto minore nelle
animazioni (si noti il movimento del mouse). Il modesto frame rate dipende probabilmente dal
sovraccarico del processore in fase di registrazione, per via dei calcoli legati alla compressione dei
filmati, problema di cui non risente il codec TSCC.
Questa batteria di test ha evidenziato un problema molto rilevante: Camtasia non appare in grado di
catturare i filmati riprodotti da Windows Media Player. Nella finestra di destra in realtà si susseguivano
tre animazioni di cui nel filmato finale non c’è traccia. Le prove sono state effettuate sia con l’ultima
versione al momento disponibile (WMP 7.1, incluso nel CD allegato), sia con la versione di default di
Windows 2000 (WMP 6.4).
Il prossimo test affronterà e risolverà questo apparente bug di Camtasia.
35
4.6 Formati e player video
Filmati di riferimento: test_06a.avi, test_06b.avi
Elaboratore utilizzato: ELA1
Scopo: evidenziare eventuali bug di Camtasia nell’acquisizione di filmati
Descrizione del test
La prova riportata in test_06a.avi si divide in due parti:
1. valutazione del funzionamento di Windows Media Player 7.1 con due file in formato AVI e due
file in formato MPEG
2. valutazione del comportamento di Real Player con un file in formato RM
Risultati e conclusioni
Il test evidenzia la capacità di Camtasia di catturare i file di tipo AVI e MPEG aperti con Windows
Media Player 7.1; al contrario, Real Player non viene gestito correttamente. Tale comportamento è
apparentemente inspiegabile, soprattutto considerando che nel test precedente neppure i file di tipo AVI
venivano memorizzati.
A questa prova ne sono seguite immediatamente delle altre. L’esito: i file di Real Player non vengono
mai gestiti correttamente, gli AVI talvolta sì e talvolta no. Allora si è cercata una risposta nel sito del
produttore, scoprendo che la causa di tale problema risiede nell’accelerazione hardware adottata da
Windows Media Player e Real Player; disabilitando questa funzione, la cattura avviene effettivamente
in modo corretto, come evidenziato dal file test_06b.avi.
Per avere ulteriori chiarimenti al riguardo, si rimanda alla FAQ n° 3 riportata in appendice nel
paragrafo A.2.
In tutte le prove effettuate, la sincronizzazione audio/video risulta comunque errata. Tra le possibili
cause di questo comportamento si può indicare la scarsa potenza del processore di ELA1.
36
4.7 Test di lunga durata
Elaboratore utilizzato: ELA2
Scopo: evidenziare eventuali limiti di Camtasia su intervalli di tempo molto lunghi
Descrizione del test
Il test è stato ripetutamente effettuato presso i laboratori del CILEA, su macchine dalla configurazione
leggermente differente ma assai simili a ELA2. La prova consiste in una sessione di cattura audio-video
di notevole estensione temporale, non stabilita a priori.
Commenti
Per evidenti problemi di archiviazione dei dati, i filmati risultanti non sono stati inclusi nel CD-ROM
allegato.
Risultati e conclusioni
Sebbene la documentazione ufficiale non ne faccia cenno, Camtasia conclude in modo irregolare la
sessione di cattura audio-video quando le dimensioni del filmato superano i 2 GB. Esiste comunque la
possibilità di recuperare il filmato prodotto con lo strumento di recovery incluso.
Inoltre, tale limite può essere aggirato interrompendo regolarmente la registrazione, salvando lo
spezzone di filmato e riavviando la registrazione. I vari spezzoni possono poi essere ricuciti e montati
tramite un programma di editing; citiamo a questo proposito Camtasia Producer, incluso nel pacchetto,
o soluzioni più professionali quali Adobe Premiere.
37
APPENDICE A
Manuale d’uso di TechSmith
Nei capitoli precedenti sono state illustrate le motivazioni che portano all’adozione di Camtasia per
l’autoproduzione diretta di materiale didattico da parte del docente.
Nel presente capitolo si descriveranno in modo più dettagliato le caratteristiche del software,
evidenziandone pregi e difetti. Ci si occuperà soprattutto di riportare informazioni tecniche di natura
teorica, ricavate principalmente dal sito ufficiale TechSmith (www.techsmith.com). Sarà cura
dell’autore citare sempre la pagina del sito fonte delle informazioni. Data la frequenza di
aggiornamento nelle pagine Web, il lettore potrebbe riscontrare delle differenze tra quanto riportato
nella presente relazione ed i contenuti del sito TechSmith al momento della lettura. Ci si riferirà
sempre, nel seguito della relazione, alla versione disponibile in rete in data 3 luglio 2002.
38
A.1 Caratteristiche di Camtasia Recorder
Fonte: http://www.techsmith.com/products/camtasia/features.asp
Capture
Camtasia’s easy-to-use VCR-style interface makes creating custom videos a breeze.
•
Input defines the area of the desktop Camtasia will record. Four options provide the flexibility to capture exactly
what part of the screen you want to include in your video.
o Screen captures the entire computer desktop area.
o Window changes the cursor to a finger used to point to the window to be captured.
o Region changes the cursor to a crosshair pointer to define a region of your desktop.
o Fixed Region sets a specific region in pixels.
•
Output tells Camtasia where to send the images you are capturing with the Recorder.
o File saves your screen recording to an industry standard AVI file. The AVI files you create with
Camtasia can be imported, edited, etc. in any third party application that supports the AVI format.
o Live takes advantage of Camtasia’s advanced Live Output feature. Rather than saving your screen
capture video to a file, you can send what you capture, as you’re capturing it, in real-time -- literally
sending out a live broadcast of desktop activity. Camtasia simulates a hardware PC camera and works
with streaming media encoders (Microsoft’s Windows Media Encoder and RealNetworks’
RealProducer), video conferencing and webcam applications. Camtasia looks like a standard Video for
Windows video capture device to these applications.
Single Frame capture mode grabs one frame at a time. Use the record button like a camera shutter button to
capture frame-by-frame. Single Frame capture is useful to create a slide show style movie.
Designed to enhance the quality of your movie, Quick Capture speeds up the frame rate for the pointer, making
cursor movements less choppy on slower systems. This setting is ideal for situations where you have a lot of
cursor movement without much background change. Capture frame rates are increased by as much as 2 to 7 times
using Quick Capture.
Select Camtasia's Layered Window capture option to make movies that include translucent and irregular shaped
windows that other screencam apps fail to grab -- like Microsoft Agent animations and translucent images used
during drag and drop.
Create AVI files using any of the standard Windows audio/video codecs, or our optional TSCC video codec.
Camtasia AVI files playback in standard media players without any plug-ins when standard Windows audio/video
codecs are used.
•
•
•
•
Audio
Adding your narration to Camtasia videos is fast and easy. Speak into the microphone while you record your screen capture
video, or use DubIt to overlay an audio track to any AVI file.
Effects
Camtasia’s effects offer configuration flexibility to choose the fonts, colors, size and appearance that will enhance the
professional appearance of your videos. Effects are easily toggled on and off in the Camtasia Recorder and most allow you
to preview changes before you proceed with your movie making.
•
ScreenPad adds floating annotations such as graphic shapes and images like arrows, callout boxes and logos to
emphasize specific areas in your recordings. Simply drag-and-drop objects from the ScreenPad to your desktop.
The annotations will appear to "float" on your desktop and can be repositioned by clicking and dragging them to a
new location.
Create your own annotation objects or import bitmap, gif and jpeg images to use as shapes. Once you have a
39
•
•
•
•
•
•
•
collection of shapes positioned on your desktop, save them as a layout, making it easy to place multiple ScreenPad
objects in one quick step. Create an unlimited number of custom object and layout libraries.
ScreenDraw allows you to draw on your desktop while you record a movie. Make your movies lively and easier to
understand by underlining, pointing and illustrating with the freehand draw tool. Annotate the screen just like
television sportscasters!
Add a Time/Date stamp and/or a Caption to your video. The caption will display for the duration of your movie,
while you define the length of time Camtasia will display the Time/Date stamp (e.g., 5 seconds).
Brand your videos with a custom Watermark, just like the television networks. You decide whether to overlay,
underlay or emboss your watermark and control its size and position on the screen.
Highlight and AutoHighlight are helpful in drawing the viewer’s attention to an exact area of the screen.
Highlight allows you to select a window or portion of a window prior to recording. A colored highlight box will
appear around this area in the video. AutoHighlight is similar, except that rather than staying in one place, the
highlight follows the cursor as it moves across the screen while you’re recording. You can adjust the color and
width of the highlight.
Viewers sometimes find it difficult to find and follow the cursor in a screen capture video. Cursor Highlight adds
effects such as circles, stars, rings, etc. that will shadow the cursor as it moves across the video and/or appear
when you click the right or left mouse button.
Use Zoom during recording to show more detail on screen or cover more area. The plus and minus zoom options
zoom the capture area in and out in increments, always maintaining the aspect ratio. The ZoomTo button will
zoom directly to a certain size, or to a specific region, window or the full screen. The Zoom Undo button reverts
back to the last zoom size and toggles between the last two zoom sizes. AutoZoom allows you to zoom between
two windows, regions, etc., with a smooth, professional appearance. Camtasia’s AutoZoom automatically pans the
area and zooms in smoothly.
Panning captures a smaller area of the screen where the action is and ignores the inactive areas. This reduces file
size and helps focus the viewer’s attention. To manually Pan, point to the frame of the defined capture area and
drag it across the screen. AutoPan keeps your cursor in the center of the capture region and follows the pointer
across the desktop.
40
A.2 Documentazione, FAQ e download
Nel CD allegato, nella sezione Documentazione, è presente il file getstart.doc; si tratta di una guida
che permette all’utente di muovere i primi passi nell’universo di Camtasia. Tale documento è stato
scaricato dal sito del produttore. Per comodità sono stati inclusi sul CD allegato anche i manuali relativi
a Camtasia Producer e Camtasia Recorder, in formato DOC e PDF.
Per aggiornamenti ed ulteriori approfondimenti, si invita il lettore a visitare la pagina:
http://www.techsmith.com/techsupp/camtasia/default.asp.
Si segnala poi la presenza su Internet di numerosi gruppi di discussione su potenzialità e problemi
legati all’uso di Camtasia.
Si riporta ora il contenuto di http://www.techsmith.com/techsupp/camtasia/toptenfaqs.asp,
aggiornato al giorno 3 Luglio 2002.
FAQ è l’abbreviazione per “Frequently Asked (o Answered) Questions”, ossia domande poste
frequentemente. Tale sezione, dedicata ai quesiti di maggior interesse per gli utente, è ormai diventata
fondamentale nel campo dell’assistenza tecnica. I risultati di alcuni studi statistici indicano che la
maggior parte degli utenti richiede assistenza in merito a pochi problemi facilmente individuabili. Si
tratta appunto dei quesiti che vengono riportati nella sezione FAQ dei siti dei produttori, in modo da
creare una knowledge base a disposizione di tutti, e conseguentemente ridurre le richieste di
chiarimenti e le segnalazioni di problemi.
1. What is an AVI and why should I use a codec?
As defined by Microsoft, AVI stands for Audio Video Interleave. AVI files are basically a number of still images called
frames that are combined sequentially in one file. When the file is played, the player, Media Player for example, chugs
through the AVI file and displays each consecutive image in the same way that movie film rolling through a projector
displays a movie.
AVI files may contain thousands of frames, and all of that picture information can produce very large file sizes. To reduce
the file size, the video data can be compressed using various compression algorithms. When implemented, these
compression algorithms are called codecs. Codec stands for Compressor/ Decompressor. While it is possible to create an
uncompressed AVI, the file size is enormous. To keep file sizes more reasoable, you should use a codec to compress your
AVI.
For more information about AVIs and Codecs, read this introduction to AVIs and Codecs.
2. Why are my videos blurry?
There are two causes of blurry videos:
1.
2.
Scaling the video in the application that is playing it, or scaling it in Camtasia Producer.
Producing the video using a "lossy" codec.
Scaling while playing and Media Player 7 problems:
If you use the default setup of Camtasia Recorder and produce videos with the TSCC codec, the playback should be
lossless, of perfect quality and it should look exactly like the screen that you recorded.
The problem is probably that the video is not being played back at 100% the original size at which it was recorded.
41
Normally in Media Player all that was needed was to select View> Options> Playback and set Zoom=100%.
In its default "skins" mode, Media Player 7 has problems playing files at 100% their original size. Most of the time it scales
them to a smaller size resulting in image quality degradation. Many times selecting View> Zoom = 100% has no effect.
The fix is to use Media Player 7 in 6.4 mode, to use Media Player 6.4, or to distribute your movies with Camtasia Player.
To use Media Player 7 in v6.4 mode:
1.
2.
3.
Locate and run the file MPLAYER2.EXE that is located in Program Files\Windows Media Player. This will run
MP7 in v6.4 mode.
When v6.4 is running select View>Options>Formats, press Select All> Apply> OK. This will set the Windows
shell associations to use Media Player 6.4 when you double click on a video in Windows Explorer, or other
applications that use the Windows shell associations to launch a player.
Select View> Options> Playback and set the Zoom level to 100%.
If you wish to use v6.4, you may download it from:
http://www.microsoft.com/windows/windowsmedia/en/download/default.asp
Another option is to use the TechSmith Camtasia AVI Player. It is free to download and distribute with your Camtasia
videos. It will always play AVI files correctly with no scaling. It is available on our Web site:
http://www.techsmith.com/products/camtasia/player.asp
It is necessary to take into consideration the resolution of the desktop that the video is going to be played on. If a video is
1024x768 and it is played back on an 800x600 desktop, the video will be too big dimensionally to fit on the screen. If the
video is scaled to fit the smaller desktop, image quality degradation will occur because of the scaling.
If an 800x600 video is played back on an 800x600 screen, then the video must be played back in full screen mode because
there won't be room for the title bar, border, etc. of the application that is playing the video. Therefore it is always better to
create videos that are smaller than the resolution of the screen that they will be viewed on.
Scaling in Camtasia Producer:
By default the Camtasia Producer will not scale the video. To produce a video without scaling select Produce
Movie>Options. In the Size tab be sure that Largest Movie Size is selected.
Lossy Codec:
Use the TSCC or RLE video codec because they are lossless codecs and won't degrade the quality of your videos.
Both TSCC and Microsoft RLE are lossless codecs. TSCC is lossless at any color depth, while RLE is limited to 256 colors.
RLE will also produce video file sizes that are up to 6 times larger than TSCC encoded videos.
Computer videos are compressed using various compression algorithms. These compression algorithms are implemented
using codecs. Some codecs sacrifice image quality when they compress the video.
By default Camtasia uses the TechSmith TSCC video codec. TSCC is called a lossless codec because it will not degrade
image quality when it compresses the video.
Most other codecs, Microsoft Video 1 for example, are lossy codecs and will degrade the quality of the video.
3. I tried to record Media Player, Real Player (etc.), but my video is blank? What's wrong?
42
This is caused because the player that is being recorded is using hardware acceleration. The solution is to disable hardware
acceleration in the player before recording it.
To disable acceleration in:
Media Player: In Media Player 7, Select Tools> Options> Perfromance. In Media Player v6.4 and earlier, select View>
Options> Playback. In both cases slide the Hardware Acceleration slider to None.
RealPlayer G2: Select Options/Preferences from the RealPlayer menu. Go to the "Performance" tab and disable
(uncheck) the "Use optimized video display" setting. You may need to close and restart RealPlayer G2 to have the change
take effect.
For the Apple QuickTime, Edit> Preferences> Streaming Transport. In the drop down box select Video Settings and
uncheck all of the DirectDraw options.
Another option is to disable hardware acceleration system wide. Because this effects all applications on the system, it may
cause performance problems for some applications and others may not run at all.
To disable graphics hardware acceleration globally for all applications on Windows 2000, select Control Panel> Display>
Properties> Settings> Advanced> Troubleshooting, on other versions of Windows select Control Panel> System>
Performance tab> Graphics> Advanced settings. In both cases slide the Hardware Acceleration slider to None.
4. Can Camtasia record Flash animations?
Yes. You can use Camtasia to convert Flash animations to any of the supported Camtasia formats, i.e. AVI, ASF, WMV,
CAMV, RM, MOV and Gif animation.
5. Why are my videos blank when I try to record my DVD player?
You may not be able to record the DVD player because DVD players require hardware acceleration. You can try turning off
hardware acceleration system wide, but then the DVD player probably will not work.
To disable graphics hardware acceleration globally for all applications on Windows 2000, select Control Panel> Display>
Properties> Settings> Advanced> Troubleshooting, on other versions of Windows select Control Panel> System>
Performance tab> Graphics> Advanced settings. In both cases slide the Hardware Acceleration slider to None.
6. Can I use Camtasia with my camcorder?
Camtasia makes movies of your screen. It does not accept input from external video sources.
You may be able to record the movie with Camtasia if you have an application that can play the camcorder video on your
screen, providing that the application displaying the video does not use hardware acceleration. If acceleration is used, then
the video that you make with Camtasia will be blank where the camcorder video is displayed. You can try disabling
acceleration system wide but then the application may not.
7. What parts of my screen are not being recorded?
If Quick Capture is enabled, areas of the screen that change without user mouse activity making the change occur, such as
animations, may not be recorded. The solution is to turn off Quick Capture.
8. Can Camtasia record the whole screen. All I can record is a little box.
In the Recorder select Capture> Input. There you can select Screen, Window, Region or Fixed region. By default the
43
Recorder is set to Fixed Region. If you set the Input to Region, after starting the capture you can drag out an area on the
screen to capture.
9. Why does the capture box follow my cursor when I try to record?
Select Effects>Zoom and Pan and uncheck AutoPan.
10. The video I recorded is ok, but why is the audio I recorded missing?
Camtasia and SnagIt only record audio from the microphone. If you need to record audio that is generated by applications,
the workarounds are:
1.
2.
3.
Get a Sound Blaster Live sound card. It places an input into the Recording section of the Windows Volume
Control called "What You Hear" that maps the audio internally in the sound card to the microphone. This allows
direct recording of audio generated by applications simply by enabling audio recording in Snagit or Camtasia.
Check your sound card. Some sound cards may also have a mixer control that allows you to map the audio to the
microphone input.
Place a microphone in front of the speakers.
Place a jumper wire between Line Out and Mic In on the sound card. If you do this, you may wish to disable the
Windows Volume Control> Options> Advanced Controls> Mic Gain or the audio may sound slightly over
amped.
11. I can't record audio with my microphone. What's wrong?
Things to check:
1.
2.
3.
4.
5.
6.
7.
8.
In the Recorder, is Effects> Audio> Record Audio enabled?
Check Options> Preferences> AVI tab. What is selected for the Audio Capture Device?
Camtasia uses the Windows Volume Control to set the recording level. In the Recorder select
Options>Preferences>AVI and press the Volume Control button. Make sure that the microphone is selected and
the volume is turned up.
Can you record with Windows Sound Recorder? If you can't then you have a generic audio problem with your
computer.
Is the microphone plugged into the microphone jack on that back of the sound card? It needs to be plugged in to
the microphone jack, not the line in jack etc.
Try a different microphone.
Try updating / reinstalling the sound card drivers.
Try a different sound card.
12. Why is the audio level in my movies too low?
You need to adjust the audio level before recording. Start the Recorder recording and then press the Pause button. Then
Select Options> Preferences> AVI tab, and press the Volume button. Close the Preferences dialog and you can then adjust
the microphone volume level using the audio level meter in the Camtasia window.
While you record audio with Camtasia Recorder, you can monitor the Audio Level to be sure you are encoding the optimal
dynamic range. The green to yellow range indicate a normal reading. Orange to red warns that you are close to an overmodulated input. The best sound quality will occur when the audio level bar is kept in the green to light orange range and
only occasionally enter the red range. That is, try to keep the level bar from filling the entire audio level meter all the time.
The goal is to keep your input levels as high as possible without exceeding the range of values which can be stored digitally
when encoded. When the Audio Level meter is frequently in the red range, your input level is too high and the peaks of your
waveform become clipped off, resulting in distortion.
To adjust your levels use the Windows recording volume control. You can find the Windows recording volume control in
the Audio tab of the "Multimedia" control panel applet available from "Start->Settings->Control Panel". The input level
44
also depends on your particular microphone, how close you are to the microphone and how loudly you speak while
recording. By keeping your input levels as high as possible, but without clipping, you will be encoding the optimal dynamic
range. It is particularly important to record sounds with the hottest levels possible if you plan to later convert 16-bit audio
data to 8-bit, or if you plan to compress your audio in a streaming media file. This assures that you will use the greatest
dynamic range possible in the converted file.
13. Why is the audio quality low?
In the Recorder, check Options> Preferences> AVI tab. In the Audio Options section, press the Audio Setup button. The
default audio setup for the Recorder is PCM (uncompressed audio). 22.050 kHz, 16 bit mono. That should give you good
quality audio. If the audio is still low quality, try a different microphone.
14. Can I use Camtasia to record just audio?
To be specific, yes and no. In the Recorder select Capture>Input and select Region. Start recording and select a very small
area, i.e. 1" square and record while recording audio using the microphone. Then when you have have finished place the
clip in the Edit Pane of the Camtasia Producer and select Edit>Save Audio. This will save the audio portion of the AVI file
to a WAV file.
15. Why is the audio out of sync with my video?
This can happen for two reasons. Some on-board audio subsystems such as in many Sony VIO notebooks and systems that
have ESS audio do not record audio properly. The current version of Camtasia has code to compensate for this hardware
failure. In most cases this problem presents with the audio stream being longer than the video. Please download the current
version of Camtasia.
You can verify this problem by using another application to record audio on the system. For example you can visit
http://www.cooledit.com and download Cool Edit. Start recording and note the exact time you start recording. Let it record
for 20-30 minutes and then stop recording and note the exact time that you stopped. Calculate the time that you recorded for
and then right click on the WAV file and select Properties. The amount of time that you recorded for will probably not
match the actual real time of the recording session.
If the computer is very overloaded and has no resources left, Camtasia can drop audio. In this case the audio stream will be
shorter than the video. Please refer to the FAQ section on poor performance, jerky mouse and background apps slow.
16. The audio is making the video file too large. What can I do?
By default the Recorder uses uncompressed PCM audio. That is a good selection for your original recording because you
can later edit the video and not lose audio quality. The solution is to compress the audio in the Camtasia Producer after you
have finished recording and have completed the complete edit cycle.
17. I made a mistake in the middle of my audio. Do I have to record the whole video again?
No. Just use DubIt that is free with Camtasia. If you don't have Dubit you may download it from our Web site. Open the
movie in Dubit, position to where you want to re-record and start recording. Dubit will overwrite the original video. It might
be a good ide to save the original audio track first in case you make a mistake. In Dubit select File> Split> Save Audio as
and save a copy as a WAV file. If you need to you can reinsert the original audio back into the AVI file. To insert WAV
files into an AVI, in Dubit select Edit> Insert Audio File.
18. Why do my movies have a slow frame rate and/or jerky mouse movements? Why are my background apps so
slow?
Windows 2000 / XP:
45
The real solution is to use Windows 2000 or XP as your multimedia authoring OS. By turning off hardware acceleration
system wide, frame rates may be increased by a factor of 10. If the frame rate is manually configured in the Recorder to a
reasonable rate such as 5-10 fps, drastic reductions in CPU utilization can be achieved. This is only true for Windows 2000
and XP.
Camtasia results on a Win2K system (NVIDIA GeForce graphics card, 750MHz PIII, TSCC video codec) are:
•
•
•
At 32-bit color 1280x1024:
9 fps with hardware acceleration, 12 fps without hardware acceleration (fps means frames per second...)
At 16-bit color 1280x1024:
2 fps with hardware acceleration, 20 fps without hardware acceleration
At 16-bit color 800x600:
6 fps with hardware acceleration, 50 fps without hardware acceleration
There are two ways to disable hardware acceleration.
•
•
In the Recorder, select Options> Preferences> Program and check Disable Display Acceleration During Capture.
This will make your screen blank for a few seconds each time that you start recording.
Acceleration can be disabled globally for all applications. On Windows 2000 and XP, select Control Panel >
Display> Properties> Settings> Advanced> Troubleshooting, on other versions of Windows select Control Panel>
System> Performance tab> Graphics> Advanced settings. In both cases slide the Hardware Acceleration slider to
None. Your screen will blank for a few seconds when you do this, but will not blank at the start of each recording
session.
For most software demos and / or training videos, 5-10 fps is perfectly adequate. Faster frame rates will only result in larger
video file size, increased bandwidth requirements and can cause slower computers to have playback problems.
If the Recorder has Auto Configure enabled, it will attempt to record at the fastest frame rate possible. Many times this
results in ridiculously high frame rates, such as the aforementioned 50 fps. This will cause CPU utilization to reach 100%
that can cause both background applications to run very slowly and/or jerky mouse movement.
By manually configuring the Recorder for a lower frame rate, CPU utilization is reduced.
To manually configure the frame rate in the Recorder select Options> Preferences> AVI tab. In the Video Options section
enter the desired frame rate.
Windows 95/98/ME/NT:
There are some steps to improve recording performance on non Windows 2000 machines. They are:
1.
2.
3.
4.
5.
6.
Reduce the screen color depth to 256 colors.
Reduce the size of the area of the screen being recorded.
Don't record audio while recording video.
Reduce the recording frame rate.
Make sure that no unnecessary background apps are running.
Use a faster computer.
19. Why won't my Camtasia videos play on other computers?
Although Camtasia can produce videos using any standard Windows codec, by default it uses the supplied TechSmith
TSCC codec. While Camtasia can use other codecs that are installed with the standard installation of Windows such as
Microsoft Video 1 or RLE, TSCC will produce much smaller files, and it also produces perfect quality, "lossless" videos
unlike Video 1 that is a "lossy" codec. A lossy codec sacrifices video quality when it compresses the video, much like JPG
46
compression for image files degrades the quality of the image.
You may select a codec in the Recorder: Options>Preferences>AVI. Uncheck Auto Configure and press the Video Setup
button. In the Producer: Produce Movie> Options> AVI> Video Setup.
When you produce a video using any particular codec, that codec must be installed on any workstation that is going to view
the videos.
The file TSCC.EXE, that is located in the directory that Camtasia is installed in, is the installation program for the TSCC
codec. It's also available at our Web site http://www.techsmith.com/download.asp for download.
You may freely distribute TSCC.EXE. Simply have your users run TSCC.EXE and it will install the TSCC codec on their
system. This only needs to be done once.
TSCC.EXE may be run in silent mode using the /s command line switch.
Another option is to use the Pack and Show feature in the Camtasia Producer. Pack and Show wraps your video and
TSCC.EXE in an EXE file that automatically installs the TSCC codec and plays the video when the user runs the EXE file.
To produce a Pack and Show EXE file in the Camtasia Producer select File>Pack and Show.
Camtasia also includes an ActiveX control that may be embedded in a Web page to automate the download and installation
of the TSCC codec for IE users. It will not work for Netscape. The HTML syntax for embedding the control in a Web page
is detailed in the file TSCCINST.TXT located in the Camtasia installation directory.
For Windows NT/2000/XP users must have administrator rights to install codecs.
20. Can QuickTime view Camtasia movies?
Yes, but not AVI videos that are using the TSCC video codec. QuickTime apparently has hard-coded codec support into the
QuickTime application and it appears not to be able to use installed Windows codec. The workaround is to use Media
Player, Real Player, the Camtasia Player or to produce your videos using a codec that QuickTime can understand. For a list
of Apple supported Windows codecs your may visit: http://www.apple.com/quicktime/specifications.html
21. The application I am capturing has large windows. When I try to capture, the whole computer slows down. How
can I capture these large windows in real time?
This is a symptom of asking your computer to do too much work. Try reducing the size of the capture area, the number of
colors you screen is set for, the frame rate at which you are recording, or the compression settings for the TSCC codec.
Some combination of these remedies should allow you to capture a reasonably-sized window.
22. Are there any distribution licensing restrictions on TSCC or Camtasia videos?
You may freely distribute TSCC.EXE.
You may freely distribute the Camtasia videos that you create.
You do not have to have Camtasia installed to view videos created with Camtasia. If the video is compressed with the
TSCC codec, only the TSCC codec needs to be installed on the computer viewing the videos. The TSCC codec does not
have to be installed if the video is produced with a video codec other than TSCC.
23. What is the difference between Camtasia and SnagIt?
Camtasia is designed specifically for making movies of your screen. Camtasia produces video file types AVI, WMV, ASF,
47
MOV, CAMV and GIF animation GIF files.
While SnagIt has very minimal video capture functionality, it is primarily for static image file screen capture and produces
BMP, GIF, PCX, PNG, TGA, JPG and TIF files.
24. What is the difference between Camtasia and the Camtasia Screen Recorder SDK?
Camtasia is an end user application, much like a word processor is an end user application. The Camtasia Screen Recorder
SDK is a software development kit for software developers that wish to add screen capture functionality to their own
applications.
25. Why use Pack and Show?
Pack and Show (P&S) is useful for the distribution of AVI files mainly for two reasons:
1. If you wish to distribute AVI files that are encoded with the TSCC video codec, P&S can be used to automate the
installation of the TSCC codec. If the P&S file includes the TSCC video codec installation program TSCC.EXE, the TSCC
codec is automatically installed when the user runs the P&S EXE. This avoids the user having to run TSCC.EXE to install
the TSCC codec.
2. P&S allows you to include the Camtasia Player, CAMPLAY.EXE. This gives you control over what player will be used
to view your video. This is useful because unlike Media Player, the Camtasia Player will always play the videos at 100%
original size and the image will not be scaled and therefore not distorted, which is a common problem with Media Player.
The Camtasia Player is more configurable than Media Player and can be played in full screen mode, with or without
controls etc.
What is a Pack and Show EXE?
Pack and Show (P&S) creates a self-extracting Zip type EXE file. The Zip EXE file contains the video file, and optionally,
the Camtasia Player and/or the installation program for the TSCC video codec, TSCC.EXE.
The P&S EXE can be examined with a standard Zip utility such as WinZip. The EXE will, depending on the production
options that are configured when creating the P&S EXE, contain:
Your Movie File (always included) TSCC.EXE (optional TSCC video codec installation program) CAMPLAY.EXE
(optional Camtasia Player)
How does Pack and Show work?
When the P&S EXE is executed, the contents of the file are extracted to a temporary directory on the user's hard disk. In
Windows 2000 for example, a unique folder name is created in the user's temp directory, such as:
\Documents and Settings\username\Local Settings\Temp\_sfx649
If the TSCC codec is included with the P&S file, then the TSCC codec is silently installed on the user's machine. Note:
Windows NT, 2000 and XP require administrator rights to install video codecs. This is the true both with P&S and running
TSCC.EXE directly.
If the Camtasia Player, CAMPLAY.EXE, is included, then the video is played using the Camtasia Player. If the Camtasia
Player is not included the video is played using whatever player is configured in the Windows shell associations on that
machine to play that type of video.
Considerations when using Pack and Show
48
1. Because a P&S EXE file is a Zip type file, the contents must be extracted (unzipped) before the video will be played. If
the video has a very large file size or is located on a slow CD-ROM, there will be a delay while the file is unzipped to the
local hard disk.
2. If the local hard disk has little free disk space, a large video may fill the remaining space.
3. EXE files may be blocked by some firewalls.
4. Depending on the content of the video, for example the audio is compressed or not, the P&S file may be considerably
smaller than the contents once they are decompressed. This can aid in network transmission because of reduced file size.
26. Can I add annotations after I have created a movie?
Currently Camtasia does not support adding annotations after the video has been recorded. One possible workaround is to
play your video and then use Camtasia to record it while it is playing. Then while recording you can use ScreenPad,
ScreenDraw and other effects to annotate your new video.
27. Can I remove the evaluation brand in movies created with Camtasia after it expired?
No. The brand is permanent.
Dal sito del produttore è inoltre possibile scaricare tutto il software descritto in questa relazione. La
pagina di riferimento è: http://www.techsmith.com/products/camtasia/download.asp
Il registratore Camtasia viene offerto nella versione pienamente funzionante, ma solo per i primi 30
giorni di uso (periodo di valutazione del prodotto); superata tale data, la licenza scade ed è richiesta la
registrazione. In caso di mancata registrazione, Camtasia Recorder rimane funzionante, ma aggiunge la
scritta “unregistered version” al filmato prodotto. Il player ed il codec sono invece liberamente
distribuiti.
I file in questione sono presenti nel CD allegato alla relazione, nella directory Download.
Camtasia Full Install: (con Streaming Media Support)
Versione: 3.0.2
Data: 21 Maggio 2002
Dimensione: 8.250 MB
Presente sul CD allegato.
Camtasia Core Install: (senza Streaming Media Support)
Versione: 3.0.2
Data: 21 Maggio 2002
Dimensione: 3.301 MB
TechSmith Screen Capture Codec (TSCC)
Versione: 2.0.2
Data: 13 Giugno 2002
Dimensione: 170 KB
Presente sul CD allegato.
49
Camtasia Standalone Player
Versione: 1.0.4
Data: 21 Maggio 2002
Dimensione: 129 KB
Presente sul CD allegato.
Camtasia Recovery Tool
Versione: 1.0.1
Data: 7 Marzo 2001
Dimensione: 164 KB
Presente sul CD allegato.
Il recorder Camtasia è il modulo software necessario per eseguire la cattura audio/video.
Il TSCC rappresenta il codec proprietario, adottato di default da Camtasia (vedi paragrafo A.5). Si
sottolinea il fatto che non sia necessario utilizzare questo codec nella produzione di filmati con
Camtasia. Le prove comparative presentate nei prossimi capitoli evidenziano proprio pregi e difetti di
alcuni codec tra quelli attualmente più diffusi in ambiente Windows.
Lo standalone player permette la visualizzazione dei filmati. Anche in questo caso, la soluzione
proprietaria non è l’unica: Camtasia supporta infatti i formati Windows Media, RealTime e QuickTime;
pertanto, è consentito l’uso di altri viewer, tra cui il ben noto Windows Media Player.
Infine, il recovery tool rappresenta un utile strumento per il recupero dei filmati in caso di
malfunzionamento del sistema o di interruzione improvvisa dell’alimentazione.
50
A.3 Requisiti di sistema
Fonte: http://www.techsmith.com/products/camtasia/requirements.asp
I requisiti di sistema dichiarati sul sito del produttore sono:
• Microsoft Windows 95 OSR2, 98, Me, NT 4.0, 2000, XP o successivi
• processore a 90 MHz (consigliati 400 MHz)
• 16 MB RAM (consigliati 64 MB)
• scheda audio compatibile Windows
• microfono (opzionale)
• 12 MB di spazio su disco fisso per l’installazione del software
Con riferimento alla tecnologia attualmente disponibile sul mercato (luglio 2002), i requisiti di sistema
elencati risultano particolarmente laschi. Ad esempio, non solo le caratteristiche minime ma addirittura
quelle ottimali erano già ampiamente supportate dai Personal Computer di fascia entry-level di 2 anni
fa. Questo rende teoricamente possibile l’installazione del software su qualsiasi macchina, compresi PC
e notebook un po’ datati e non particolarmente potenti.
Nei test di valutazione delle prestazioni verrà analizzata anche l’usabilità del prodotto in funzione delle
caratteristiche degli elaboratori. Per le prove sul campo, infatti, sono state utilizzate macchine
differenti, sempre nel rispetto dei requisiti minimi richiesti dal produttore. Ecco un elenco dettagliato
delle loro caratteristiche:
Elaboratore 1 [ELA1]
Sistema operativo: Windows 2000 Professional
Processore: Pentium III 500 MHz
RAM: 256 MB
Scheda audio primaria: Sound Blaster Live 1024
Scheda audio secondaria: Yamaha SW1000XG
Scheda grafica: Matrox Millennium G400 / 32 MB
Disco fisso: 60 GB
Caratteristiche aggiuntive: lettore DVD, masterizzatore CD
Elaboratore 2 [ELA2]
Sistema operativo: Windows XP Professional
Processore: Pentium IV 2 GHz
RAM: 512 MB
Scheda audio: integrata
Scheda grafica: GEOForce
Disco fisso: 30 GB
51
A.4 Tipi di file supportati
Camtasia Recorder è un software di cattura audio e video. Le sorgenti sono configurabili attraverso il
menù Options Î Preferences. Nella schermata che si presenta all’utente si riconoscono 2 sezioni
(Video Options e Audio Options) e un riquadro riassuntivo su codec e formati.
Il pulsante Video Setup consente di scegliere il codec da
utilizzare nella cattura video. Per maggiori dettagli su cosa
sia un codec e quale impatto abbia sul risultato della
registrazione, si rimanda al paragrafo B.1. I contenuti della
sezione Configurazione avanzata della sorgente video
dipendono dal codec prescelto.
Un discorso analogo vale per il pulsante Audio Setup, che
permette di configurare in modo raffinato la frequenza di
campionamento, il numero di bit per campione, il numero
dei canali e la compressione dell’audio, in funzione del
codec prescelto.
Indipendentemente dal codec, Camtasia cattura le
immagini che compaiono sul monitor, alla risoluzione e
profondità di colore utilizzate dall’utente al momento della
registrazione.
Di default non viene eseguita la registrazione dell’audio.
Per attivarla, è necessario andare in Effects Î Audio Î
Record audio. A questo punto Camtasia memorizza nel
filmato i suoni provenienti dalla periferica preferenziale per la riproduzione dei suoni (vedi Pannello di
controllo Î Suoni e multimedia) e dalla periferica indicata come Audio Capture Device nel menù
Options Î Preferences del software.
Normalmente queste impostazioni non vanno corrette manualmente, ma possono esistere casi
eccezionali. Ad esempio, per creare il filmato test_01.avi è stato utilizzato il sistema ELA1 (vedi
paragrafo A.3), che presenta due schede audio e che ha richiesto di configurare i parametri audio di
Camtasia.
Virtualmente non esiste alcun tipo di file o di contributo multimediale non supportato da Camtasia. Il
software, infatti, cattura tutto ciò che viene presentato a video: se un file può essere aperto
dall’elaboratore che sta eseguendo la registrazione, allora tale file risulta automaticamente supportato
da Camtasia.
La prova test_01.avi, presente nella sezione test del CD allegato, dimostra la possibilità di lavorare
contemporaneamente con più applicativi, alternandosi tra file di diverso tipo (Microsoft Word, Excel,
PowerPoint, file GIF, JPG, MIDI, MP3,…). La registrazione rispecchia fedelmente lo svolgimento del
lavoro, e il test nel suo complesso può essere considerato completamente riuscito.
L’unico limite riscontrato è rappresentato da un leggero rallentamento delle operazioni, dovuto alla
presenza simultanea di diversi programmi aperti e alla contemporanea cattura audio e video. Si tratta
comunque di ritardi del tutto trascurabili, soprattutto perchè riferiti all’elaboratore ELA1, la cui
configurazione non è particolarmente potente.
52
A.5 Il codec proprietario TSCC
Codec è l’abbreviazione di compressore/decompressore. I codec vengono applicati all’audio e al video
per comprimerne la dimensione. Il vantaggio è che i file così ottenuti occupano meno spazio su disco e
richiedono meno banda quando vengono trasmessi in rete. Per aprire un file compresso è necessario
decomprimerlo facendo uso dello stesso codec. Al termine del processo di compressione e
decompressione, il file originario viene ripristinato e dal punto di vista del risultato l’intera operazione
è trasparente all’utente. Per una trattazione completa sull’operazione di compressione, si rimanda al
paragrafo B.1 dell’Appendice tecnica.
I codec generalmente utilizzati per i filmati si basano su algoritmi con perdita. Tra questi, citiamo: Intel
Indeo, Radius Cinepak Codec e DivX. Sono proprio questi i codec testati con Camtasia nelle prove
comparative (vedi paragrafo 4.4 e seguenti)
TechSmith, invece, propone il codec proprietario TSCC (TechSmith Screen Capture Codec), un
algoritmo senza perdita, gratuitamente distribuito e – nelle intenzioni del produttore - dalle eccellenti
capacità di compressione.
Nella pagina http://www.techsmith.com/products/camtasia/codec.asp vengono presentati i
vantaggi nell’uso del TSCC rispetto ad altri codec (in ogni caso supportati dal Camtasia Recorder). Tra
questi:
• la compressione senza perdita, che “preserva al 100% la qualità dell’immagine” e “sopravvive a
un numero virtualmente infinito di cicli di editing”;
• l’ottimizzazione nella cattura di immagini su schermo, con particolare riferimento agli
applicativi “da ufficio”. Trattandosi di un prodotto esplicitamente sviluppato per la cattura di
schermate, e non ad esempio per la compressione di film o la videoconferenza, i progettisti
hanno riservato una particolare attenzione nella compressione delle immagini statiche. Si può
infatti ipotizzare che, escludendo le animazioni e i movimenti del cursore sullo schermo,
durante una presentazione le immagini a video siano fortemente ridondanti nello spazio e nel
tempo, e pertanto ampiamente comprimibili;
• grande velocità nella compressione, anche con alti frame rate.
53
APPENDICE B
Tecniche di compressione e standard multimediali
Nelle pagine di questo capitolo saranno chiariti alcuni concetti generali e verranno illustrati gli standard
universalmente accettati nel campo della riproduzione audio e video. L’obiettivo è quello di rendere più
comprensibili le scelte sul tipo di compressione da adottare nella produzione del filmato finale.
54
B.1 Le tecniche di compressione
Comprimere può significare “ridurre di volume o deformare, mediante pressione” ed anche
“schiacciare, stringere” (definizioni tratte da G. Devoto, G. C. Oli – Dizionario della lingua italiana).
In gergo informatico, si definisce “compressore” un software in grado di ridurre le dimensioni fisiche
di un file, misurate in byte o suoi multipli. Il file ottenuto tramite l’operazione di compressione viene
detto “compresso”.
Le tecniche di compressione dei dati hanno già da tempo assunto una grande importanza nel mondo
dell’Information and Communication Technology, in quanto la loro adozione consente di superare
alcuni limiti tecnici e fisici dei dispositivi attualmente in uso. Ad esempio, determinati file in formato
non compresso risulterebbero troppo grandi per essere contenuti nei comuni supporti di memoria
secondaria (si pensi ai film in DVD).
Un altro aspetto fondamentale della compressione è legato alla trasmissione dei dati su un canale, sia
questo una linea telefonica o un bus interno al calcolatore: avere file più piccoli significa diminuire
l’occupazione di banda richiesta dalla trasmissione e di conseguenza velocizzare la trasmissione stessa.
Si pensi alla diffusione in rete dei file audio: il formato wave (PCM non compresso) l’avrebbe
fortemente ostacolata, mentre il problema è stato risolto con l’avvento del formato MP3 (MPEG-2
layer 3), che arriva agevolmente a rapporti di compressione di 1:10 senza significativa perdita di
qualità.
Due utenti che vogliono comunicare utilizzando compressione dei dati devono conoscere e utilizzare il
medesimo algoritmo di de/compressione al fine di ottenere una esatta ricostruzione dell'immagine, o pù
in generale delle informazioni, sul computer remoto. La comunicazione di cui si parla in questa
relazione è una forma di interazione molto particolare, che avviene a distanza temporale e spaziale tra
docente e studente. Chiaramente, l’adozione di un certo algoritmo di compressione in fase di creazione
del materiale richiede l’utilizzo dello stesso algoritmo in fase di visualizzazione.
Va a questo punto definito il concetto fondamentale di codec: dal punto di vista linguistico, si tratta
della contrazione delle parole codificatore-decodificatore. Il codec rappresenta il fulcro
dell’elaborazione di un segnale audio-video, in tutto il suo percorso a partire dall'acquisizione
analogica alla trasmissione codificata e attraverso il processo inverso su un computer remoto. Il codec
può essere sia hardware che software: nel primo caso parliamo di una scheda installata sul computer
che provvede a manipolare il segnale tramite chip appositi quali possono essere i DSP (digital signal
processor); nel secondo caso si intende che i medesimi algoritmi di de/codifica e de/compressione
vengono applicati direttamente dalla CPU del computer, comandata da appositi programmi software.
Nella stragrande maggioranza dei casi le informazioni audio e video vengono trattate separatamente,
rari sono i casi in cui un unico algoritmo provvede alla loro contemporanea codifica.
Le tecniche di compressione dei dati ricadono in due grandi categorie: riduzione di ridondanza e
riduzione di entropia. La prima indica una trasformazione completamente reversibile, la seconda una
compressione con distorsione o irreversibile. Nel dettaglio:
• la codifica a riduzione di entropia è una tecnica di memorizzazione di una informazione con
perdita di una certa parte del segnale originale. Si pensi ad un qualsiasi campionamento, nel
quale si associa ad un segnale una quantità finita di valori discreti, ecco che la ricostruzione del
segnale originale a partire dall'insieme dei campioni non potrà essere che approssimata, sarà
55
•
appunto una trasformazione irreversibile. Quindi questo concetto è strettamente legato alla
quantizzazione che può essere riassunta in tre tecniche principali: scalare, a blocchi e
sequenziale.
Per quantizzazione scalare si intende che ogni campione è quantizzato indipendentemente da
tutti gli altri. Negli altri due casi c'è, invece, una dipendenza tra campioni successivi.
La quantizzazione a blocchi è caratterizzata principalmente dalla adozione di una trasformata:
prima di quantizzare si trasforma l'immagine in un differente dominio, in cui il campione viene
poi quantizzato. Lo scopo è quello di quantizzare un intero blocco con un numero minore di bit
rispetto al dominio originale. La trasformata è in genere lineare e può essere di Fourier, di
Hadamar, Coseno, oppure la Karhunen Loeve che è senza dubbio la migliore. Nel campo della
videoconferenza si sfrutta nella stragrande maggioranza dei casi la trasformata discreta di
coseno (DCT), che come particolarità ha quella di non lavorare sull'intera immagine bensì su
piccole porzioni della stessa, ad esempio blocchetti di 8x8 o 16x16 pixel.
La più comune forma di quantizzazione sequenziale è la quantizzazione con predizione: qui il
campione successivo viene predetto e soltanto la differenza tra il valore predetto e quello attuale
viene quantizzata, con notevole miglioramento della compressione dell'immagine. Tale tecnica
viene sfruttata al meglio nel caso della videoconferenza perché si presuppone che una parte
dell'immagine rimanga pressoché statica, per esempio lo sfondo, e che si muova soltanto il
volto e le spalle del conferenziere.
la codifica a riduzione di ridondanza, al contrario, rimuove semplicemente le ridondanze
dell'informazione, e ne permette l'esatta ricostruzione in fase di decodifica. Tre sono le tecniche
principali che caratterizzano tale riduzione: codifica a massima efficienza, con nonridondanza, binaria.
La codifica a massima efficienza opera su sorgenti statisticamente indipendenti. Un classico
esempio è l’algoritmo Huffman, che ottiene una riduzione della lunghezza media del codice
(average code length) utilizzata per rappresentare i simboli dell'alfabeto che statisticamente si
ripetono frequentemente. Tale codifica prevede, quindi, la conoscenza a priori delle
caratteristiche generiche della sorgente.
La codifica con non-ridondanza è simile alla codifica con predizione. I valori che non sono
esattamente uguali a quelli predetti vengono chiamati non-ridondanti e piuttosto che trasmettere
le differenze tra i nuovi e i predetti valori, vengono trasmessi solo quelli non-ridondanti. Poiché
in tale maniera non tutti i campioni vengono trasmessi, l'uscita di questo predittore è di tipo
asincrono; quindi, per permettere in ricezione un'esatta ricostruzione della sequenza originale
dei campioni, viene trasmesso uno speciale codice di temporizzazione che indica il numero e la
posizione dei campioni mancanti.
Infine, la codifica binaria prevede che ai campioni vengano associati due soli livelli di valore.
L'obbiettivo della codifica a sorgente binaria è rendere il numero di bit di un blocco di sorgente
vicino, o uguale all'entropia di quel blocco. Un esempio noto è dato dai Run Length Codes.
56
B.2 Standard per il segnale video
Si riassumeranno ora in forma tabellare le caratteristiche del segnale video secondo gli standard
universalmente riconosciuti.
B.2.1 Segnale televisivo analogico secondo gli standard europei
• rapporto tra base ed altezza del cinescopio: 4:3 (schermi cinematografici: 16:9)
• frequenza di trasmissione dei fotogrammi: 25 fotogrammi al secondo (standard USA: 30
fotogrammi al secondo; standard cinematografico: 24 fotogrammi al secondo)
• scansione interallacciata: in luogo di 25 immagini al secondo si trasmettono 50 semi-immagini
al secondo, alternando righe pari a righe dispari.Il motivo di tale stratagemma è che, ad una
frequenza di trasmissione di 25 Hz, l’occhio umano dovrebbe agire come un filtro ideale
centrato sulla frequenza di Nyquist (pari in questo caso a 12,5 Hz). Ma a tale frequenza l’occhio
non ha ancora perso la sua sensibilità, e quindi o si procede alla proiezione di ogni fotogramma
per due volte (il che richiederebbe un elemento di memoria), o si adotta la scansione
interallacciata
• numero di righe visibili sullo schermo: 562
• frequenza di campionamento spaziale verticale massima: fmax vert = 281 cicli/quadro, attuabile
solo in presenza di un filtro di ricostruzione ideale
• frequenza di campionamento spaziale verticale adottata: fvert = 281 x 0,7 = 197 cicli/quadro
• frequenza di campionamento spaziale orizzontale: forizz = 197 x 4/3 = 263 cicli/riga
• tempo assegnato per la trasmissione di una riga: triga = 52 μsec
• tempo assegnato per la trasmissione di un ciclo: tciclo = 52/263 = 200 nsec circa
• banda del segnale: fmax = 5 MHz, sia per il segnale bianco e nero, sia per il segnale a colori (tale
risultato si ottiene con la tecnica della multiplazione a divisione di frequenza)
B.2.2 Segnale televisivo numerico secondo gli standard europei
• trasmissione del segnale di luminanza Y e di crominanza CR e CB
• frequenza di campionamento per la luminanza: fY = 13,5 MHz
• frequenza di campionamento per la crominanza: fC = 6,75 MHz
• tempo di riga: triga = 64 μsec, di cui solo 52 μsec sono disponibili per le informazioni televisive
• caratteristiche del segnale di luminanza Y: 720 campioni/riga; 576 righe/quadro (di cui solo 562
portano informazione, le altre sono a 0); 25 quadri/sec
• caratteristiche dei segnali di crominanza CR e CB: 360 campioni/riga; 576 righe/quadro; 25
quadri/sec
• quantizzazione con almeno 8 bit a campione; bit rate risultante: n = 25 x (720 x 576 x 8 + 360 x
x 576 x 8 + 360 x 576 x 8) = 166 Mbit/sec circa
B.2.3 Tecniche di riduzione di ridondanza ed irrilevanza
Il segnale televisivo è ridondante in senso spaziale e temporale: è dunque possibile adottare una
codifica differenziale intra-quadro (considerando i campioni precedenti e adiacenti al campione
corrente all’interno dello stesso quadro) o una codifica differenziale inter-quadro (considerando i punti
dei quadri precedenti che occupano la stessa posizione del campione corrente). Un’evoluzione di
quest’ultima tecnica consiste nel cercare di individuare, all’interno di quadri consecutivi, il moto
57
apparente dei soggetti (tecnica differenziale a compensazione dello spostamento). In generale, la sua
applicazione porta a risultati di buona qualità con un bit rate di 40 – 80 Mbit/sec.
Per le immagini in movimento il gruppo di lavoro denominato Motion Picture Expert Group (MPEG)
ha stabilito alcuni standard:
• MPEG-1, il cui bit rate deve essere inferiore a 1 Mbit/sec
• MPEG-2 a scopo di distribuzione (bit rate compreso tra 2 e 6 Mbit/sec) e a scopo di
contribuzione (bit rate tra 10 e 20 Mbit/sec)
• MPEG-4, che prevede una codifica diversa e ottimizzata a seconda dei casi; l’algoritmo di
decodifica deve essere trasmesso assieme ai dati codificati.
Si ricorda che una codifica di tipo differenziale presenta un inconveniente: saltare all’immagine N
comporta la ricostruzione di tutte le N-1 immagini precedenti. Il problema viene aggirato
memorizzando regolarmente nella sequenza un’immagine non codificata in funzione delle precedenti.
Per una descrizione esaustiva della storia, delle caratteristiche tecniche e degli standard MPEG, si
consulti il sito http://mpeg.telecomitalialab.com
58
B.3 Standard per il segnale audio
B.3.1 Lo standard del Red Book
Quando venne inventato il Compact Disc (CD), le due case produttrici Sony e Philips descrissero nel
cosiddetto Red Book le specifiche fisiche del supporto, i parametri ottici per la lettura, le tecniche di
modulazione e correzione di errore, e infine il formato dei dati.
Questo formato al giorno d’oggi rappresenta lo standard maggiormente diffuso nel campo dell’audio, e
prevede:
• codifica PCM (Pulse Code Modulation)
• frequenza di campionamento fC = 44100 Hz
• 16 bit per campione
• quantizzazione lineare
• bit rate = 705 Kbit/sec
B.3.2 Altre codifiche senza compressione
Esistono varianti della codifica PCM in cui si può diminuire a proprio piacimento la frequenza di
campionamento, il numero di bit per campione e il numero di canali (mono/stereo). Si ricorda che i
parametri prescelti nello standard Red Book garantiscono una fedele riproduzione di segnali fino a 20
KHz, la massima frequenza teorica che il nostro orecchio è in grado di percepire. Una riduzione dei
valori comporta in generale un degrado della qualità audio, a meno che il segnale originario non sia di
tipo particolare: ad esempio, la banda di frequenze della voce umana non supera i 5 KHz, per cui un
campionamento a 11,025 KHz risulta del tutto soddisfacente.
Al contrario, esistono standard che aumentano il valore dei parametri, incrementando così il bit rate, ma
anche la qualità audio. Ad esempio, i dispositivi DAT campionano a 48 KHz; lo standard proposto per i
DVD audio prevede, oltre a tale frequenza di campionamento, anche l’attribuzione di 24 bit ad ogni
campione.
Anche per i segnali audio esistono poi tecniche di codifica adattative (Adaptive Delta Modultion) e
differenziali (Differential Pulse Code Modulation, Delta Modulation,…), che presentano tutti i pregi e i
difetti già elencati nel caso del segnale video. In particolare, queste tecniche consentono di ridurre anche drasticamente - il bit-rate senza compromettere la qualità, a patto di conoscere a priori le
caratteristiche del segnale.
B.3.3 Compressione MP3
L’algoritmo ISO-MPEG Audio Layer-3, meglio conosciuto come MP3, rappresenta il risultato di anni
di studio sulle tecniche di compressione audio e sui fenomeni di mascheramento delle frequenze tipici
dell’orecchio umano. La compressione è di tipo lossy, ossia con perdita di informazione; pertanto,
l’algoritmo non è reversibile, e l’informazione tagliata è definitivamente persa. Eppure, il risultato che
si ottiene applicando la compressione MP3 è di solito molto soddisfacente. La chiave del mistero sta
proprio nelle caratteristiche del sistema uditivo umano, che si comporta da filtro e maschera
determinati suoni. L’algoritmo MP3 sposta questo filtro a monte nella catena di riproduzione, e in
questo modo elimina le informazioni irrilevanti.
Va ricordato che, in assenza di compressione, il segnale audio digitale tipicamente consiste di 44100
campioni al secondo, ciascuno di 16 bit, da moltiplicare per i due canali. Il bit rate risultante è dunque
di circa 1,4 Mbit/sec. La codifica audio MPEG riesce a raggiungere un fattore di compressione di 1:12
preservando la qualità, e arriva a rapporti superiori a 1:24 se si tollera perdita di qualità.
59
Si riporta uno schema indicativo delle capacità dell’algoritmo MPEG in funzione del layer adottato
(qualità CD audio):
1:4
con il Layer 1 (corrisponde a 384 kbps per un segnale stereo),
1:6...1:8
con il Layer 2 (corrisponde a 256..192 kbps per un segnale stereo),
1:10...1:12
con il Layer 3 (corrisponde a 128..112 kbps per un segnale stereo),
Nella famiglia degli algoritmi MPEG per l’audio, il più potente ed efficace è dunque il layer 3, in grado
di raggiungere il bit rate più basso a parità di qualità audio, o analogamente di ottenere la qualità audio
più elevata a parità di bit rate. Nella tabella seguente sono riportati dei valori indicativi relativi alle
performance del layer 3:
Qualità audio
Banda
Canali
Bit rate
Rapporto di compressione
telefono
2.5 kHz
mono
8 kbps
96:1
radio AM
7.5 kHz
mono
32 kbps
24:1
radio FM
11 kHz
stereo
56...64 kbps
26...24:1
televisione
15 kHz
stereo
96 kbps
16:1
CD
>15 kHz
stereo
112..128kbps
14..12:1
I dati tecnici e le tabelle sono stati tratti dal sito http://www.iis.fhg.de
60
BIBLIOGRAFIA
Descrizione del prodotto Sony PCS-DS150
• manuale utente in formato cartaceo
• sito del produttore: http://www.sony.com
• depliant illustrativi:
http://www.dominadm.com/ftp/depliants/sony/pcs-ds150(brch).pdf
Descrizione del prodotto TechSmith Camtasia
• manuali in formato digitale: http://www.techsmith.com/techsupp/camtasia/default.asp
• sito del produttore: http://www.techsmith.com
Compressione, caratteristiche dei segnali audio e video
• appunti delle lezioni del corso di Telematica del Prof. R. Melen (Politecnico di Milano, Facoltà
di Ingegneria, A. A. 2000 -2001)
• appunti delle lezioni del corso di Informatica applicata al suono del Prof. G. Haus (Università
statale, Facoltà di Informatica, A. A. 2000 –2001)
• sito del Fraunhofer Institute (standard MP3): http://www.iis.fhg.de
• sito del gruppo di lavoro MPEG: http://mpeg.telecomitalialab.com
Supporto tecnico e logistico
• CILEA (Consorzio Interuniversitario Lombardo per l’Elaborazione Automatica):
http://www.cilea.it
61
RINGRAZIAMENTI
Nel corso della relazione ci si è avvalsi delle apparecchiature e della fattiva collaborazione del
personale del Cilea (Consorzio Interuniversitario Lombardo per l’Elaborazione Automatica). Un sentito
ringraziamento a tutti coloro che, fornendo utili consigli e mettendo a disposizione la propria
esperienza, hanno permesso di affrontare in modo più dettagliato e completo i differenti aspetti del
problema trattato.
Un ringraziamento particolare al Dott. G. Limongiello, che ha svolto il ruolo di tutor per conto del
CILEA, a R. Piazzola, per la fattiva collaborazione tecnico-logistica, e al Prof. F. Pinciroli, docente di
Informatica Medica del Politecnico di Milano.
62

Documenti analoghi