Skip to content

Análisis de los datos de viajes en taxi de YellowCab en Nueva York utilizando Apache Spark. El proyecto incluye estudios sobre la velocidad media de los taxis, los viajes más comunes y análisis financieros. Implementaciones usando Spark SQL, DataFrames y RDDs, junto con un análisis de rendimiento para diferentes métodos de consulta.

Notifications You must be signed in to change notification settings

pablohd10/hpc-spark-taxi-trip-analysis

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

32 Commits
 
 
 
 
 
 
 
 

Repository files navigation

NYC YellowCab Spark Analysis

Descripción

Este proyecto consiste en un análisis de los datos de viajes de YellowCab en la ciudad de Nueva York, utilizando Apache Spark para procesar grandes volúmenes de datos. Se realizan estudios sobre:

  • Velocidad media de los taxis en función de la hora.
  • Viajes en taxi más comunes.
  • Media de la cantidad total pagada en función del número de pasajeros.

Esto se consigue mediante la implementación de consultas mediante Spark SQL, DataFrames y RDDs. El objetivo principal es realizar un análisis de rendimiento comparativo entre estas técnicas.

Contenido

El contenido de este proyecto se encuentra en el archivo .ipynb

About

Análisis de los datos de viajes en taxi de YellowCab en Nueva York utilizando Apache Spark. El proyecto incluye estudios sobre la velocidad media de los taxis, los viajes más comunes y análisis financieros. Implementaciones usando Spark SQL, DataFrames y RDDs, junto con un análisis de rendimiento para diferentes métodos de consulta.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 4

  •  
  •  
  •  
  •