Kas yra tekstinis failas?

Tekstinis failas yra kompiuterio failas, kuriame saugomas įvestas dokumentas kaip raidžių ir skaitinių simbolių serija, paprastai be vaizdinės formatavimo informacijos. Turinys gali būti asmeninis užrašas ar sąrašas, žurnalo ar laikraščio straipsnis, knyga ar bet koks kitas tekstas, kurį galima tiksliai atspausdinti mašinėle. Tekstiniai failai yra panašūs į teksto apdorojimo failus, nes abiejų turinys pirmiausia yra tekstinis; jie skiriasi tuo, kad tekstiniuose failuose paprastai neįrašoma tokios informacijos, kaip simbolių stilius ir dydis, puslapių skaičius ar kitos detalės, kurios nurodytų baigto dokumento išvaizdą. Kai kurios kompiuterių operacinės sistemos iš esmės skiria tekstinį failą, kuris yra skirtas tiesiogiai išversti į žmogaus skaitomą tekstą, ir dvejetainį failą, kurį tiesiogiai interpretuoja kompiuteris.

Daugumoje teksto kodavimui naudojamų schemų kiekvienam simboliui priskiriama skaitinė reikšmė, o tekstas rašomas kaip dvejetainių skaičių eilutė. Viena kodavimo schemų šeima, vadinama Amerikos standartiniu informacijos mainų kodu (ASCII), tapo plačiai naudojamu standartu ankstyvoje kompiuterijos istorijoje, nepaisant menko kitų nei anglų kalbų palaikymo. ISO 8859 kodų šeima suteikė daug geresnį palaikymą kalboms, pagrįstoms lotyniška abėcėle ir panašiomis abėcėlėmis, tačiau nepavyko užkoduoti simbolių iš Rytų Azijos kalbų, pavyzdžiui, japonų, todėl daugėja nesuderinamų standartų.

Visai neseniai Unicode® konsorciumas sukūrė kodavimo sistemą, pavadintą Unicode®, kurios tikslas yra kiekvienam simboliui, vartojamam visose žemėse, priskirti unikalų numerį. Tai leis naudoti vieną kodą kiekvienai kalbai, o tekstai iš kelių kalbų bus rodomi viename faile. Pirmoji Unikodo dalis yra pagrįsta ISO 8859, kuris pats yra pagrįstas ASCII. Unicode® naudojimas gali turėti pranašumų net angliškai kalbančiose šalyse, nes naudojant senesnes schemas užkoduotas tekstas gali rodyti nedidelius neatitikimus, kai perkeliama iš sistemos į sistemą.

Tekstinių failų pranašumai yra mažas dydis ir universalumas. Kilobaitai arba megabaitai mažesni nei tie patys duomenys, saugomi kitais formatais, jais galima greitai ir masiškai keistis el. paštu arba diske. Daugumą jų galima atidaryti kompiuteriuose, kuriuose veikia įvairios operacinės sistemos, naudojant labai paprastą programinę įrangą. Pagrindinis trūkumas yra formatavimo trūkumas. Tekstinis failas gali būti netinkamas pasirinkimas vaizduoti dokumentą, kuriame yra vaizdų arba kurio prasmė perteikiama naudojant dizaino elementus – pavyzdžiui, failą, kuriame yra lentelės duomenų, matematinių formulių ar konkrečios poezijos.

Tekstiniai failai paprastai skirti žmonėms skaityti ir redaguoti, tačiau ne visuose juose yra turinio, kuris pirmiausia skirtas žmonėms vartoti. Dauguma programavimo kodų yra saugomi tekstiniame faile prieš sukūrimą, tai yra, išverčiami į kompiuterio skaitomą dvejetainį failą. Failuose taip pat gali būti mašininiu būdu skaitomų tekstinių žymų, kurios, be paprasto teksto, pateikia formatavimo informaciją. Pavyzdžiui, hiperteksto žymėjimo kalbos (HTML) failas gali būti atidarytas kaip paprasto teksto failas teksto rengyklėje arba rodomas kaip suformatuotas tinklalapis, kai jį interpretuoja žiniatinklio naršyklė. Panašios schemos apima LaTeX, naudojamą moksliniams straipsniams rengti, ir Extensible Markup Language (XML), naudojamą duomenų struktūrizavimui.