Build software better, together

Learn data visualization through Tableau 2020 and create opportunities for you or key decision-makers to discover data patterns such as customer purchase behavior, sales trends, or production bottlenecks. This Course on Udemy

barchart dashboards filters tableau aggregation opportunities udemy datapreparation tableau-training data-science-udemy key-decision-makers production-bottlenecks sales-trends

Updated Jul 25, 2020

ms8909 / dptron

Star

mltrons dptron: Dirty Data in, Clean Data Out!

data datascience dataprep datascience-machinelearning datapreparation

Updated Nov 11, 2022
Python

huseyincenik / data_science

Star

Data Science materials

data-science data timeseries time-series timeline data-visualization datascience data-structures dataset time-series-analysis dataprocessing dataengineering dataanalysis timeseries-analysis timeseriesforecasting datapreparation

Updated Sep 15, 2024
Jupyter Notebook

RafeyIqbalRahman / Data-Imputation-Techniques

Star

This repository demonstrates data imputation using Scikit-Learn's SimpleImputer, KNNImputer, and IterativeImputer.

scikit-learn sklearn imputation preprocessing scikitlearn-machine-learning sklearn-library imputation-methods scikit-learn-python datapreparation

Updated Aug 3, 2020
Python

rrambhia22 / Bike_Crash_Analysis

Star

The project deals with determining and predicting the type of accident taking place in the city of Austin. The data would help in understanding what possible factors are leading to the accidents based on the severity of the incident that has occurred.

python recommendations exploratory-data-analysis jupyter-notebook feature-extraction classification-algorithm datavisualization correlation-analysis data-driven-model datapreprocessing machinelearningalgorithms datapreparation model-building-and-evaluation pre-modeling-steps

Updated Jul 5, 2022
Jupyter Notebook

prakhargurawa / Titanic-Survival-Predictor

Star

Trying to predict survival rate of passengers using algorithms like Logistic Regression, Ada Boost, Gradient Boost , Decision Tree Classifiers , Extra Tree Classifiers , Random Forest Classifiers and XG Boost with appropriate data preprocessing techniques.

python machine-learning scikit-learn machine-learning-algorithms python3 adaboost feature-engineering datapreprocessing datapreparation decision-tree-classifiers xg-boost extra-tree-classifiers random-forest-classifiers titanic-survival-predictor

Updated Nov 19, 2020
Jupyter Notebook

MadhuBala11 / DiabetesPrediction

Star

In this project, I have used logistic regression, a supervised machine learning algorithm, to predict whether a person has diabetes or not based on various features such as age, blood pressure, glucose level, body mass index, etc. I have used Python and popular libraries such as Pandas, Scikit-Learn, and Matplotlib to perfom model building

data-visualization logistic-regression data-exploration correlation-analysis datapreparation data-splitting additional-analysis-prediction

Updated Jan 26, 2024
Jupyter Notebook

NAVEENDATAANALYST / SPACESHIP-TITANIC-PASSENGER-TRANSPORT-PREDICTION

Star

The data is available in kaggle competitions. https://www.kaggle.com/competitions/spaceship-titanic I have participated and completed the competition on my own.

r decision-tree-classifier datavisualization dataexploration datapreprocessing datapreparation

Updated Mar 4, 2023

rainaa0277 / House-Price-Prediction-using-Linear-Regression

Star

For a real estate firm, building a house price prediction model based upon various factors. Problem - Regression | Algorithm used -Linear Regression using OLS

data-science machine-learning algorithms machine-learning-algorithms regression statsmodels datavisualization datapreprocessing regression-model datapreparation ols-regression-model

Updated Jan 24, 2022
Jupyter Notebook

ENGRZULQARNAIN / ScrapySub

Star

ScrapySub is a Python library designed to recursively scrape website content, including subpages. It fetches the visible text from web pages and stores it in a structured format for easy access and analysis. This library is particularly useful for NLP and AI developers who need to gather large amounts of web content for their projects.

python scraper crawling scraping-websites python-package urllib3 datapreprocessing datapreparation

Updated Jul 14, 2024
Python

DaveChui / Data-Preparation-and-Cleaning---Geo-Data

Star

Preparing and Cleaning Data

datacleaning datapreparation

Updated Jan 9, 2023
Jupyter Notebook

rrambhia22 / Crimes_Incarceration_Analysis

Star

Crime and Incarceration in the United States contain data on crimes that are committed, and the prisoner counts in every 50 states, for which the data is analyzed using various analytical methods.

python linear-regression exploratory-data-analysis jupyter-notebook statistical-analysis tableau model-building datavisualization dataanalysis correlation-matrix decision-tree-regression feature-importance datacleaning random-forest-regression datacollection machinelearningalgorithms datapreparation labelencoding pre-modeling-steps

Updated Jul 5, 2022
Jupyter Notebook

NAVEENDATAANALYST / CUSTOMER-ANALYTICS-ON-USA-BASED-COMPANY-DATA

Star

This is my 6th semester Essentials of Data Analytics project.

r analytics classification logistic-regression kmeans-clustering datavisualization random-forest-classifier clustering-analysis heirarchical-clustering dataexploration datapreparation xgboost-classifier

Updated Feb 26, 2023

NAVEENDATAANALYST / HOTEL-RESERVATIONS-PREDICTION-IN-R

Star

CAN U PREDICT CORRECTLY WHETHER A CUSTOMER WILL CANCEL THE RESERVATION?? You can find the dataset from this kaggle website: https://www.kaggle.com/datasets/ahsan81/hotel-reservations-classification-dataset

r logistic-regression datavisualization decision-tree-regression datapreparation

Updated Mar 4, 2023

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

datapreparation

Here are 63 public repositories matching this topic...

sfu-db / dataprep

ydataai / ydata-talkdatatome

CoDS-GCS / KGFarm

victorcouste / trifacta-flows-examples

visokio / omniscope-custom-blocks

baharzurnaci / Machine-Learning-Zoomcamp-

Ashleshk / Tableau-10-A-Z-Hands-on-Tableau-Training-for-Data-Science-Udemy

ms8909 / dptron

huseyincenik / data_science

RafeyIqbalRahman / Data-Imputation-Techniques

rrambhia22 / Bike_Crash_Analysis

prakhargurawa / Titanic-Survival-Predictor

MadhuBala11 / DiabetesPrediction

NAVEENDATAANALYST / SPACESHIP-TITANIC-PASSENGER-TRANSPORT-PREDICTION

rainaa0277 / House-Price-Prediction-using-Linear-Regression

ENGRZULQARNAIN / ScrapySub

DaveChui / Data-Preparation-and-Cleaning---Geo-Data

rrambhia22 / Crimes_Incarceration_Analysis

NAVEENDATAANALYST / CUSTOMER-ANALYTICS-ON-USA-BASED-COMPANY-DATA

NAVEENDATAANALYST / HOTEL-RESERVATIONS-PREDICTION-IN-R

Improve this page

Add this topic to your repo