Formato File di Testo

Transcript

Formato File di Testo
Formato File di Testo
Un file di testo è un file per computer che contiene solo caratteri di
scrittura semplici, senza informazioni sul loro formato (dimensione, colore,
ecc). Di solito rappresenta un testo leggibile direttamente dagli utenti senza
bisogno di installare programmi appositi.
Il termine si usa in contrapposizione a file binario, che è invece un file
contenente dati generici non direttamente leggibili dall'utente. In realtà, dal
punto di vista delle macchine, non c'è distinzione tra i due tipi, poiché tutti i file
non sono altro che sequenze di byte. La differenza sta solo in ciò che i byte
rappresentano e come viene utilizzato.
I
byte
dei
file
di
testo
rappresentano
quindi
lettere,
numeri,
punteggiatura, spazi e altri normali simboli stampabili, ma possono contenere
anche alcuni caratteri di controllo come tab (per la tabulazione), carriage
return e line feed (per andare a capo).
Per codifica nei file di testo si intende la corrispondenza tra il valore dei
byte, che è sempre un numero intero da 0 a 255, e il carattere rappresentato.
La corrispondenza non è sempre 1 a 1: in molte codifiche moderne un solo
carattere è rappresentato da molti byte, in modo da superare il limite di 256
possibili caratteri e supportare anche lingue ricche di simboli come quelle
orientali.
Esempi di codifiche 1 a 1 sono la comunissima ASCII, la ISO 8859 e la
EBCDIC. Esempi di codifiche multibyte sono i vari tipi di Unicode e l'EUC.
Ovviamente lo scopo per cui sono nati i file di testo, e tutt'ora un utilizzo
molto frequente, è la lettura/scrittura diretta da parte degli utenti. La
mancanza di formattazione li rende poveri dal punto di vista estetico, ma in
compenso grazie a questa semplicità non occorrono particolari programmi per
leggerli, e spesso possono essere trasferiti direttamente da un sistema
operativo all'altro. Ci sono alcune limitazioni all'universalità dei file di testo: La
codifica non è sempre ovvia, e quando il sistema non la riconosce o non la
supporta, il file può diventare illeggibile.
Fonte: http://it.wikipedia.org
I maggiori sistemi usano notazioni diverse per il carattere di a capo: Mac
OS usa CR, UNIX usa LF, Windows usa CR/LF
L'estensione dei file di testo è generalmente .txt.
Fonte: http://it.wikipedia.org