2.5 Manejo de texto, cadenas de caracteres

Referencia: Van Rossum 3.1.2 p11, Rodriguez 5.6.1 p59, Downey 2.9

El manejo de texto en computadoras, se conoce con el nombre técnico de «cadenas de caracteres».

Una letra del alfabeto, un número, un signo de puntuación, en general: todos los símbolos que están disponibles en el teclado del computador son un dibujo a ser presentado o usado en una pantalla, impresora, etc.

Cada dibujo se numera para su identificación y cada dibujo se lo conoce como «caracter» o en idioma inglés «character».

La tabla «caracteres y su número de identificación estandarizado se concoce como Tabla de códigos ASCII (American Standard Code for Information Interchange).

Par visualizar el concepto, por ejemplo se obtiene el código ASCII de un caracter:

>>ord('a')
97

El proceso contrario para obtener el caracter de un código ASCII es:

>>chr(97)
'a'

Los símbolos o caracteres se agrupan para formar palabras, frases, párrafos, por lo que internamente se convierten en vectores numéricos de los dibujos o símbolos. A esta agrupación se la conoce como «cadenas» o «strings».

La agrupación de caracteres se conoce como «concatenar». En Python se usa el símbolo «+» para denotar concatenación.

Ejemplo:

>>> a = 'Hola'
>>> b = '¿que tal?'
>>> c =  a+b
>>> c
'Hola¿que tal?'

La operación c = a+b debe leerse como: c almacena a concatenado con b. Diferenciando la acción de las operaciones matemáticas de igualdad y suma.