Tekstredigering

posted in: Programmering, Tips | 0

De fleste har lejlighedsvist brug for ganske almindelig redigering af almindelig uformateret tekst. Og laver man it support, hjemmesider eller programmering, så er det hele tiden. Windows kommer med et indbygget program til redigering af tekst: Notepad. Eller som det hedder i den danske udgave: Notesblok. Programmet kan redigere tekst og det er det, det skal bruges til, så det er jo fint. Som udgangspunkt arbejder programmet altid med tekst kodet i ANSI, men hvis du åbner en UTF-8 kodet tekst, arbejder den også fint med det – den fortæller dig bare ikke, hvad det er du har med at gøre (se nedenfor om ANSI og UTF-8). Og hvis du prøver at arbejde med store tekstfiler bliver notepad uhyggelig langsom – det kan tage timer at lave en søg og erstat i en stort dokument.

Men der findes fremragende alternativer. Jeg installerer altid Notepad++ på mine PC’er.: Den er meget hurtigere end Notepad, du kan samtidigt have flere filer åbne, du kan lave søg og erstat med specialtegn (fx linjeskift) og konvertere mellem ANSI og UTF-8 m.fl. for blot at nævne nogle få fordele. Og så findes der utallige udvidelser, som kan få den til at lave et eller andet ekstra – fx vise to tekstfiler side om side med fremhævelse af forskelle. Notepad++ kan indlæse og vise hvad som helst, så vi bruger det også, hvis vi skal finde ud af, hvilken type fil, vi har med at gøre: Windows beslutter sig for at starte et bestemt program ud fra det, der står efter det sidste punktum i navnet, så hvis denne fileextension af en eller anden grund er blevet forkert, så kan Windows ikke finde ud af at bruge det rigtige program. Så indlæser vi i Notepad++ og ser på de første bytes i filen og de afslører som regel, hvad det er. Der findes en liste over mange af disse filsignaturer her: wikipedia List_of_file_signatures. Derefter ændrer vi endelsen til den rigtige og så kan Windows finde ud af det igen.

 

Til brug for programmering er der et par alternativer, der er endnu mere målrettet opgaven med programtekster, herunder markering af syntaxbegreber: Atom er gratis mens Sublime Text koster $80. Atom kalder sig selv “a hackable text editor” og det afspejler sig tydeligt i de mængder af “hacks” eller specielle udvidelser, som der findes til programmet.

 

 

Et andet udbredt alternativ er UltraEdit til $100. UltraEdit kan suppleres med flere programmer fra IDM: UltraFinder, UltraCompare, UltraFTP. (Hele familien koster $180).

 

Om ANSI og UTF-8: Computere gemmer alting som binær kode (0’er og 1-taller). Det gælder også bogstaver og andre tegn. Så man er nødt til at vide, hvilken kombination af 0’er og 1’er der skal fortolkes og vises som fx bogstavet A. Denne vedtagelse startede med ASCII definitionen, som definerede, hvordan man skulle fortolke de 128 mulige kombinationer af 0’er og 1-taller, som der er plads til i en byte. Denne definition passede fint for engelsk, men nogle sprog har nogle specielle tegn (som vores æ ø å) og de måtte derfor bruge specielle udgaver af ASCII tabellen, hvor nogle af de oprindelige tegn blev pillet ud og erstattet med specialtegnene. De specielle definitioner blev kalde en codepage og dansk/norsk codepage har nummer 865, hvor backslash, pipe, skarpe og krøllede parenteser blev erstattet med vore specielle tegn. Frygteligt besværligt når man fx skulle have en printer til at skrive begge typer tegn. Den seneste ændring af dette system var ISO 8859-15 som gav plads til euro tegnet €. I Windows sammenhæng benyttes som regel betegnelsen ANSI. ANSI er en udvidelse fra ASCII med yderligere forskellige codepages. Strengt taget omfatter ANSI også UTF-8, UTF-16, EBCDIC og flere andre codepages, så betegnelsen er lidt noget sludder, da den netop bruges som alternativ til disse. UTF-8 giver mange, mange flere mulige tegn, da der her anvendes op til 4 bytes for at Kode et tegn. UTF-8 anvender et variablet antal bytes, så hvis det er nok med 1 byte, så bruges kun 1. Du kan se mere om UTF-8 her.