Archivos csv
1. Archivos csv
Algunas tablas de datos se pueden recibir como archivos.csv, que son datos separados por ';' , debiendo indicar el separador de decimales ','.
Ejemplo de archivo: ejemplonotas01.csv
nombre;primera;segunda;tercera;final
Maria;55;70;0;62,5
Pedro;30;60;70;65
Juan;80;65;65;72,5
puede ser leído y procesado usando la librería pandas
import pandas as pd
# INGRESO
# archivo de entrada
unarchivo = 'ejemplonotas01.csv'
# PROCEDIMIENTO
tabla = pd.read_csv(unarchivo,
sep=';',
na_values=',')
# SALIDA
print(tabla)
con lo que se obtiene:
nombre primera segunda tercera final
0 Maria 55 70 0 62,5
1 Pedro 30 60 70 65
2 Juan 80 65 65 72,5
>>>
Tamaño de la tabla:
>>> tabla.shape
(3, 5)
>>> tabla.columns
Index(['nombre', 'primera', 'segunda', 'tercera', 'final'], dtype='object')
>>> tabla['nombre']
0 Maria
1 Pedro
2 Juan
Name: nombre, dtype: object
Seleccionando solo un grupo de datos:
>>> soloprimera = tabla['primera']
>>> soloprimera
0 55
1 30
2 80
Name: primera, dtype: int64
>>> media = soloprimera.mean()
>>> media
55.0
Referencia:
https://pandas.pydata.org/docs/reference/api/pandas.read_csv.html
https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.to_csv.html
Archivos csv
2. Archivos json
Algunas estructuras de datos que se encuentran en formato tipo "diccionario" se pueden guardar y leer usando librerías Pandas.
Para el ejemplo se usa el diccionario:
tabla = {'Maria': {'primera': 55,
'segunda': 70,
'tercera': 0,
'final': '62,5'},
'Pedro': {'primera': 30,
'segunda': 60,
'tercera': 70,
'final': '65'},
'Juan': {'primera': 80,
'segunda': 65,
'tercera': 65,
'final': '72,5'}
}
Para almacenar estos datos se realiza la conversión del diccionario a DataFrame con el objetivo de usar la instrucción de Pandas para guardar archivos.json.
tabla.to_json(unarchivo)
Instrucciones en Python
import pandas as pd
# INGRESO
#archivos de salida T: Transpuesta
unarchivo = 'ejemplonotas01.json'
unarchivoT = 'ejemplonotasT01.json'
# datos como diccionario de datos
tabla = {'Maria': {'primera': 55,
'segunda': 70,
'tercera': 0,
'final': '62,5'},
'Pedro': {'primera': 30,
'segunda': 60,
'tercera': 70,
'final': '65'},
'Juan': {'primera': 80,
'segunda': 65,
'tercera': 65,
'final': '72,5'}
}
# PROCEDIMIENTO
# conversión a DataFrame de pandas
tabla = pd.DataFrame(tabla)
tablaT = tabla.transpose()
# SALIDA
print(tabla)
print('transponer: ')
print(tablaT)
# almacena en archivo.json
tabla.to_json(unarchivo)
tablaT.to_json(unarchivoT)
los archivos resultantes son:
Referencia:
https://pandas.pydata.org/docs/reference/api/pandas.io.json.read_json.html
https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.to_json.html
Archivos csv