Sql para Ciencia de Datos

Realizado por Pablo Sierra Solution Engineer en Oracle

Bienvenidos

  • Quieres aprender SQL?
  • Tienes experiencia en Python, R, pero no en SQL?
  • Quieres difundir el SQL?

Introdución al SQL teoría y práctica.

¿Quien soy?

Ing. Electricista... Argentina... Oracle...

Datos... Nube... Sector Público...

Salud... Transporte... Ministerios...

¿Que es el SQL?

Es un lenguaje de programación declarativo que nos permite interactuar con bases de datos relacionales.

Tabla Inventario

Producto Valor Cantidad
Manzanas 1 1
Limones 2 4
Pan 3 2

Motor de Base de Datos

Oracle Mysql Postgres y más...

Tabla Inventario

Identificador Producto Valor Cantidad
001 Manzanas 1 1
002 Limones 2 4
003 Pan 3 2

Tabla Ventas

Identificador Cliente
001 Juan
002 María
003 María
¿Se puede usar para hacer ciencia de datos?
La data está en un lugar seguro, para trabajar directamente con la fuentes, esquemas, tablas y sus formatos.
De esta forma puedes crear modelos de datos complejos para responder preguntas más complejas.
Puedes hacer actividades básicas y avanzadas de exploración de datos, el data cleaning, engineering feature y Machine learning.
Todo en la base de datos...

¿Por qué los cientificos de Datos no lo usan como lenguaje Nro1?

Lenguaje Declarativo VS Lenguaje Imperativo.

Python



							<--Python es un lenguaje multiproposito-->

							# declarar variables
							lista_frutas = ['banana', 'Manzana', 'Limon']

							# loops
							for fruta in lista_frutas:
								print(fruta)
							
							# mismo loop con otra sintaxis
							for i in range(len(lista_frutas)):
								print(lista_frutas[i])

						

Escribo lo que quiero y hago loops.

SQL



							/* SQL es un lenguaje declarativo de dominio específico */

							SELECT
								*
							FROM
								una_tabla
							WHERE
								columna1 = 10 AND columna2 != 20;

						

Le digo a la base lo que quiero...

Muchos Pasos para Iniciarse

  • Descargar e instalar un motor de base de datos o escoger un servicio en la nube
  • Herramienta para conectarse a la base de datos
  • Driver de conexión
  • Datos de conexión url, port, usuario, contraseña...
  • Se necesita cargar datos

No es para todos los casos

Data Lake vs Data Warehouse

Si esta en SQL usa SQL...

Se necesita más

DIFUSION

¿Fin?

- Sql Notebooks School [Codigo]
- Sql Notebooks School [Demo en Vivo]
- Encuesta - Comunidad SQL
- Curso - SQL for Data Analysis