Summarization of CNN/DAILY MAIL Data-set using BART

BART stands for bidirectional autoregressive transformer, a reference to its neural network architecture. BART proposes an architecture and pre-training strategy that makes it useful as a sequence-to-sequence model (seq2seq model) for any NLP task, like summarization, machine translation, categorizing input text sentences, or question answering under real-world conditions. In this article, we'll focus on its summarization capabilities.

Here are the reasons of choosing BART over other models:

Most Resilient to Real-World Noisy Data
Acceptable Results Out-of-the-Box Across Many Domains
Produces Grammatically Correct Summaries
Overcome Limitations of GPT-3

References : https://arxiv.org/pdf/1910.13461.pdf

Other powerful models such as MoCa, PEGASUS, GPT 4, could also be used, however due to gpu limitations, we are using BART.

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
Asutosh Rath's Submission.pdf		Asutosh Rath's Submission.pdf
README.md		README.md
Summarization_on_cnn_daily_mail_(asutosh_rath) (1).ipynb		Summarization_on_cnn_daily_mail_(asutosh_rath) (1).ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Summarization of CNN/DAILY MAIL Data-set using BART

About

Releases

Packages

Languages

61-Keys/Summarization-of-CNN-DAILY-MAIL-DATASET-Asutosh-

Folders and files

Latest commit

History

Repository files navigation

Summarization of CNN/DAILY MAIL Data-set using BART

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages