Skip to content

This repository contains projects and exercises I completed during my "Big Data Architecture" course. It reflects the concepts I’ve learned about data processing using Apache Spark and PySpark.

License

Notifications You must be signed in to change notification settings

Catalina2820/Arquitectura-Bigdata

Repository files navigation

Arquitectura Big Data

Descripción del Repositorio

Este repositorio contiene una serie de proyectos y ejercicios que he desarrollado como parte de mi formación en la asignatura "Arquitectura Big Data". El objetivo principal es mostrar los conceptos y técnicas que he aprendido en el manejo de grandes volúmenes de datos utilizando tecnologías como Apache Spark y PySpark.

Contenidos

Temas : PySpark RDD, Spark Broadcast, Flask, Mongo, Spark

  • Procesamiento de Datos con RDDs: Proyectos que ilustran cómo crear y transformar Resilient Distributed Datasets (RDDs) utilizando funciones básicas para manipular datos.

  • Análisis de Datos en Tiempo Real: Ejercicios que demuestran el uso de Spark para realizar análisis en tiempo real, optimizando el rendimiento y eficiencia en el procesamiento.

  • Simulación de Datos: Proyectos en los que he utilizado la librería Faker para generar conjuntos de datos simulados, facilitando el análisis y la práctica sin necesidad de datos reales.

  • Análisis de Texto: Ejercicios que incluyen el procesamiento de descripciones de patentes, mostrando cómo aplicar técnicas de análisis de texto y extracción de información.

Entorno de Desarrollo

  • Python
  • Env ambiente virtual en conda

Frameworks Necesarios

  • Apache Spark: Motor para tareas de ingeniería de datos, ciencia de datos y aprendizaje automático.

About

This repository contains projects and exercises I completed during my "Big Data Architecture" course. It reflects the concepts I’ve learned about data processing using Apache Spark and PySpark.

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published