Arquitectura Big Data

Descripción del Repositorio

Este repositorio contiene una serie de proyectos y ejercicios que he desarrollado como parte de mi formación en la asignatura "Arquitectura Big Data". El objetivo principal es mostrar los conceptos y técnicas que he aprendido en el manejo de grandes volúmenes de datos utilizando tecnologías como Apache Spark y PySpark.

Contenidos

Temas : PySpark RDD, Spark Broadcast, Flask, Mongo, Spark

Procesamiento de Datos con RDDs: Proyectos que ilustran cómo crear y transformar Resilient Distributed Datasets (RDDs) utilizando funciones básicas para manipular datos.
Análisis de Datos en Tiempo Real: Ejercicios que demuestran el uso de Spark para realizar análisis en tiempo real, optimizando el rendimiento y eficiencia en el procesamiento.
Simulación de Datos: Proyectos en los que he utilizado la librería Faker para generar conjuntos de datos simulados, facilitando el análisis y la práctica sin necesidad de datos reales.
Análisis de Texto: Ejercicios que incluyen el procesamiento de descripciones de patentes, mostrando cómo aplicar técnicas de análisis de texto y extracción de información.

Entorno de Desarrollo

Python
Env ambiente virtual en conda

Frameworks Necesarios

Apache Spark: Motor para tareas de ingeniería de datos, ciencia de datos y aprendizaje automático.

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
.ipynb_checkpoints		.ipynb_checkpoints
1019ProyectpMovieRatings		1019ProyectpMovieRatings
Clases		Clases
DataLake/Raw/Fuente1_ml-1m		DataLake/Raw/Fuente1_ml-1m
Examen 1		Examen 1
Examen 2		Examen 2
Final		Final
Seguimiento 1		Seguimiento 1
Seguimiento 2		Seguimiento 2
ml-1m		ml-1m
LICENSE		LICENSE
README.md		README.md
artofwar.txt		artofwar.txt
mongo.txt		mongo.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Arquitectura Big Data

Descripción del Repositorio

Contenidos

Entorno de Desarrollo

Frameworks Necesarios

About

Uh oh!

Releases

Packages

Uh oh!

Languages

License

Catalina2820/Arquitectura-Bigdata

Folders and files

Latest commit

History

Repository files navigation

Arquitectura Big Data

Descripción del Repositorio

Contenidos

Entorno de Desarrollo

Frameworks Necesarios

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages