Data Science N019 Recolección de datos en: Kaggle

Cordiales saludos

Kaggle es una excelente plataforma para la recolección de datos. Posee miles de Datasets de forma gratuitas, con las cuales podemos practicar. Existen muchas fuentes de datos en internet que también puedes utilizar, tan solo dedícale un tiempo a la busquedad de datos y seguro encontrarás. De todas maneras conociendo a Kaggle, por ahora, es suficiente.


19a.png

Registro en Kaggle

Para registrarte en Kaggle entra a su web y luego Sign In.


19b.png

La plataforma te da varias opciones para registrarte y acceder, yo escogí entrar con Google.


19C.png


Seleccionar un Dataset

Claramente se ve el botón Datasets Para seleccionar un dataset de nuestra preferencia.


19D.png

Escogí al azar el primero que me mostraba por popularidad. También puedes escoger datos por temas específicos como: Ciencia de la computación, deporte, educación, etc.


19e.png


Descarga


19f.png

Luego de seleccionar el dataset que llame nuestra atención lo descargamos. La descarga puede ser directa o en formato zip. Luego que tengamos nuestro archivo en nuestra computadora lo movemos a nustra carpeta de trabajo.


19j.png

Un detalle de suma importancia para tomar en cuenta. En este caso el nombre del archivo vino originalmente así: covid-variants.csv. Me he topado con descargas donde el nombre del dataset viene con espacios en blancos: ejemplo de datos.csv debemos renombrarlo (para evitar males futuros) sin espacios entre palabras: ejemplo_de_datos.csv o ejemplodedatos.csv o como lo prefieras.

Carga del Dataset en nuestro cuaderno de trabajo

Entramos a nustro entorno virtual y corremos jupiter notebbok.


19g.png

Creamos nustra cuaderno 19_recoleccion_de_datos_kaggle.ipynb (linea verde) y nos aseguramos que esté nuestro dataset para trabajar (recuadro rojo)

19h.png

Dentro de nuestro cuaderno importamos la librería pandas y copiamos la instrucción:

pd.read_csv('covid-variants.csv')

Esto lo habíamos visto en nuestra publicación: Data Science N004 Recopilar datos de una tabla en excel y el formato .csv. En la siguiente captura de pantalla vemos ya nuestros datos.


19i.png


Una vez más los invito a practicar, practicar, practicar... Hasta la próxima entrega, Feliz Día!


separador001.png

Entrega anterior

Uso de los Jupyter Notebook - Creando un entorno virtual (continuación)


separador001.png

Invitación Especial

Apreciada comunidad extiendo mi invitación, para todos los que hacemos vida en esta maravillosa comunidad, a participar con la etiqueta #Hive para promocionar nuestras publicaciones en la red social: #Twitter. Para más detalles puedes consultar la publicación de @hive-data


hive_twitter_400.gif
Fuente:


separador001.png

Clases gratis de programación / Free programming classes

[ESP/ENG] Mi proyecto en Python/My project in Python.

Mi twitter
separador001.png


I started a Ko-fi Page! Ko-fi helps creators get support from fans of their work. Please support or follow my page! If you like what I do and feel in tune with my work in creating content for free programming courses and chess publications without any profit interest. Give me a coffee... I will be very grateful!
separador001.png
Todos a programar!
Rafael Aquino



0
0
0.000
2 comments
avatar

¡Enhorabuena!


Has recibido el voto de PROYECTO CHESS BROTHERS

✅ Has hecho un trabajo de calidad, por lo cual tu publicación ha sido valorada y ha recibido el apoyo de parte de CHESS BROTHERS ♔ 💪


♟ Te invitamos a usar nuestra etiqueta #chessbrothers y a que aprendas más sobre nosotros.

♟♟ También puedes contactarnos en nuestro servidor de Discord y promocionar allí tus publicaciones.

♟♟♟ Considera unirte a nuestro trail de curación para que trabajemos en equipo y recibas recompensas automáticamente.

♞♟ Echa un vistazo a nuestra cuenta @chessbrotherspro para que te informes sobre el proceso de curación llevado a diario por nuestro equipo.


Cordialmente

El equipo de CHESS BROTHERS

0
0
0.000