Data Science N019 Recolección de datos en: Kaggle
Cordiales saludos
Kaggle es una excelente plataforma para la recolección de datos. Posee miles de Datasets de forma gratuitas, con las cuales podemos practicar. Existen muchas fuentes de datos en internet que también puedes utilizar, tan solo dedícale un tiempo a la busquedad de datos y seguro encontrarás. De todas maneras conociendo a Kaggle, por ahora, es suficiente.
Registro en Kaggle
Para registrarte en Kaggle entra a su web y luego Sign In.
La plataforma te da varias opciones para registrarte y acceder, yo escogí entrar con Google.
Seleccionar un Dataset
Claramente se ve el botón Datasets Para seleccionar un dataset de nuestra preferencia.
Escogí al azar el primero que me mostraba por popularidad. También puedes escoger datos por temas específicos como: Ciencia de la computación, deporte, educación, etc.
Descarga
Luego de seleccionar el dataset que llame nuestra atención lo descargamos. La descarga puede ser directa o en formato zip. Luego que tengamos nuestro archivo en nuestra computadora lo movemos a nustra carpeta de trabajo.
Un detalle de suma importancia para tomar en cuenta. En este caso el nombre del archivo vino originalmente así: covid-variants.csv. Me he topado con descargas donde el nombre del dataset viene con espacios en blancos: ejemplo de datos.csv debemos renombrarlo (para evitar males futuros) sin espacios entre palabras: ejemplo_de_datos.csv o ejemplodedatos.csv o como lo prefieras.
Carga del Dataset en nuestro cuaderno de trabajo
Entramos a nustro entorno virtual y corremos jupiter notebbok.
Creamos nustra cuaderno 19_recoleccion_de_datos_kaggle.ipynb (linea verde) y nos aseguramos que esté nuestro dataset para trabajar (recuadro rojo)
Dentro de nuestro cuaderno importamos la librería pandas y copiamos la instrucción:
pd.read_csv('covid-variants.csv')
Esto lo habíamos visto en nuestra publicación: Data Science N004 Recopilar datos de una tabla en excel y el formato .csv. En la siguiente captura de pantalla vemos ya nuestros datos.
Una vez más los invito a practicar, practicar, practicar... Hasta la próxima entrega, Feliz Día!
Entrega anterior
Uso de los Jupyter Notebook - Creando un entorno virtual (continuación)
Invitación Especial
Apreciada comunidad extiendo mi invitación, para todos los que hacemos vida en esta maravillosa comunidad, a participar con la etiqueta #Hive para promocionar nuestras publicaciones en la red social: #Twitter. Para más detalles puedes consultar la publicación de @hive-data
Fuente:
Clases gratis de programación / Free programming classes
[ESP/ENG] Mi proyecto en Python/My project in Python.
I started a Ko-fi Page! Ko-fi helps creators get support from fans of their work. Please support or follow my page! If you like what I do and feel in tune with my work in creating content for free programming courses and chess publications without any profit interest. Give me a coffee... I will be very grateful!
Todos a programar!
Rafael Aquino
https://twitter.com/Rafa_elaquino/status/1485377246974324737
The rewards earned on this comment will go directly to the person sharing the post on Twitter as long as they are registered with @poshtoken. Sign up at https://hiveposh.com.
¡Enhorabuena!
✅ Has hecho un trabajo de calidad, por lo cual tu publicación ha sido valorada y ha recibido el apoyo de parte de CHESS BROTHERS ♔ 💪
♟ Te invitamos a usar nuestra etiqueta #chessbrothers y a que aprendas más sobre nosotros.
♟♟ También puedes contactarnos en nuestro servidor de Discord y promocionar allí tus publicaciones.
♟♟♟ Considera unirte a nuestro trail de curación para que trabajemos en equipo y recibas recompensas automáticamente.
♞♟ Echa un vistazo a nuestra cuenta @chessbrotherspro para que te informes sobre el proceso de curación llevado a diario por nuestro equipo.
Cordialmente
El equipo de CHESS BROTHERS