数据

本项目专注于复现CAIL2018数据集上的LJP工作。
我专门写了篇综述，等写完了我挂到ArXiv上。
项目代码的逻辑顺序是：数据集的不同预处理方法→不同的解决方案

超过5M的文件都存储在了百度网盘上，以方便大陆用户下载。

数据
LJP paper list
通用文本分类
结果展示
引用
star history

数据

CAIL2018数据集，原始数据来自裁判文书网，经处理后输入是事实描述文本，输出是案件的罪名、刑期、适用法条和罚金。
中国大陆刑事一审案件，分成big和small两个子数据集。

数据集处理策略：

原生数据格式

下载地址：https://cail.oss-cn-qingdao.aliyuncs.com/CAIL2018_ALL_DATA.zip

以事实文本作为输入，以分类任务的范式，预测罪名（accusation）、法条（law）、刑期（imprisonment，单位为月，如被判为无期徒刑则是-1、死刑是-2

训练集是first_stage/train.json，测试集是 first_stage/test.json + restData/rest_data.json（文中说，这个配置是删除多被告情况，仅保留单一被告的案例；删除了出现频数低于30的罪名和法条；删除了不与特定罪名相关的102个法条（没看懂这句话是啥意思））

具体的待补

LADAN格式

small数据集：
链接：https://pan.baidu.com/s/1kLueQRCFYYnYCOK9DE8o9Q
提取码：n51y

big数据集：
链接：https://pan.baidu.com/s/1EY-NowCigua0XQ5pwqenow
提取码：mkos

具体的创建过程我没记录，总之是跟LADAN官方代码和统计信息是一样的，大概来说应该是看LADAN的GitHub项目得到的。

Dataset	small	big
train cases	101,619	1,587,979
valid cases	13,768	-
test cases	26,749	185,120
articles	103	118
charges	119	130
term of penalty	11	11

CTM格式

待补

LJP paper list

论文前面的单选框表示是否完成并上传复现代码。代码具体复现了多少看models文件夹里面。
因为我感觉不同数据集之间的转换不难，所以我就只复现一种数据集格式了（一般用的是LADAN格式）除了LADAN之外，我大多数代码直接使用了原文作为初始数据。fact_list是文本列表，每个元素是用空格隔开的分词后的原文

2024年
(ESWA) KnowPrompt4LJP Chinese legal judgment prediction via knowledgeable prompt learning 我在另一个GitHub项目那边帮人下了这篇paper，有需自取：https://github.com/PolarisRisingWar/pytorch_ljp/files/15269723/Chinese.legal.judgment.prediction.via.knowledgeable.prompt.learning.pdf
LegalDuet: Learning Effective Representations for Legal Judgment Prediction through a Dual-View Legal Clue Reasoning

2023年
Precedent-Enhanced Legal Judgment Prediction with LLM and Domain-Model Collaboration
A Comprehensive Evaluation of Large Language Models on Legal Judgment Prediction
Exploiting Contrastive Learning and Numerical Evidence for Confusing Legal Judgment Prediction
CL4LJP Contrastive Learning for Legal Judgment Prediction
ML-LJP: Multi-Law Aware Legal Judgment Prediction
LA-MGFM: A legal judgment prediction method via sememe-enhanced graph neural networks and multi-graph fusion mechanism
How Legal Knowledge Graph Can Help Predict Charges for Legal Text
Zero-shot Transfer of Article-aware Legal Outcome Classification for European Court of Human Rights Cases
Legal Syllogism Prompting: Teaching Large Language Models for Legal Judgment Prediction
Methods of incorporating common element characteristics for law article prediction
An Approach Based on Cross-Attention Mechanism and Label-Enhancement Algorithm for Legal Judgment Prediction
FCA-LJP: A Method Based on Formal Concept Analysis for Case Judgment Prediction
融合法律文本结构信息的刑事案件判决预测
基于注意力机制与知识融合的法律判决预测模型研究

2022年

(ACL) Re11：读论文 EPM Legal Judgment Prediction via Event Extraction with Constraints：这作者代码和数据都没给全，我都不知道别的能复现这篇工作的是咋实现的
(EMNLP) Do Charge Prediction Models Learn Legal Theory?
(IJCAI) Re28：读论文 CECP Charge Prediction by Constitutive Elements Matching of Crimes
(IPM) Re36：读论文 CEEN Improving legal judgment prediction through reinforced criminal element extraction
(COLING) Re 39：读论文 CTM Augmenting Legal Judgment Prediction with Contrastive Case Relations
(Artificial Intelligence and Law) Re41：NumLJP Judicial knowledge‑enhanced magnitude‑aware reasoning for numerical legal judgment predi

MVE-FLK: A multi-task legal judgment prediction via multi-view encoder fusing legal keywords
Interpretable prison term prediction with reinforce learning and attention
Charge prediction modeling with interpretation enhancement driven by double-layer criminal system Similar Case Based Prison Term Prediction
Legal Judgment Prediction via Heterogeneous Graphs and Knowledge of Law Articles
A Computational Intelligence Model for Legal Prediction and Decision Support
基于BERT模型的多任务法律案件智能判决方法
基于概念的司法判决预测可解释研究
基于数据和知识融合的可解释司法判决预测模型
基于因果推断和多专家FTOPJUDGE机制的法律判决预测方法研究
基于法条外部知识的法条推荐

2021年

Label Definitions Augmented Interaction Model for Legal Charge Prediction
Equality before the Law: Legal Judgment Consistency Analysis for Fairness
Mulan: A Multiple Residual Article-Wise Attention Network for Legal Judgment Prediction
基于法律裁判文书的法律判决预测
一种法律判决预测的影响因素分析方法
Dependency Learning for Legal Judgment Prediction with a Unified Text-to-Text Transformer

2020年

(ACL) Re27：读论文 LADAN Distinguish Confusing Law Articles for Legal Judgment Prediction
LADAN我当年复现的时候出过一点问题，见LADAN文件夹。LADAN官方回复说可以直接改用TF 2实现的D-LADAN（https://github.com/prometheusXN/D-LADAN ），这个我以后可能也会实现一下。

Iteratively Questioning and Answering for Interpretable Legal Judgment Prediction
An Element-aware Multi-representation Model for Law Article Prediction
Multi-task Legal Judgement Prediction Combining a Subtask of the Seriousness of Charges
The Sentencing-Element-Aware Model for Explainable Term-of-Penalty Prediction
A Relation Learning Hierarchical Framework for Multi-label Charge Prediction
Legal Judgment Prediction with Label Dependencies

2019年

(IJCAI) MPBFN Legal Judgment Prediction via Multi-Perspective Bi-Feedback Network
(ChineseCSCW) MAMD Charge Prediction for Multi-defendant Cases with Multi-scale Attention

Hierarchical Matching Network for Crime Classification A Recurrent Attention Network for Judgment Prediction Learning to Predict Charges for Judgment with Legal Graph Legal Cause Prediction with Inner Descriptions and Outer Hierarchies Charge Prediction with Legal Attention Automatic Legal Judgment Prediction via Large Amounts of Criminal Cases 融入罪名关键词的法律判决预测多任务学习模型Multi-task learning model for legal judgment predictions with charge keywords MANN: A Multichannel Attentive Neural Network for Legal Judgment Prediction 基于胶囊网络的法律罪名预测方法研究

2018年

(EMNLP) TOPJUDGE Legal Judgment Prediction via Topological Learning

2017年

(EMNLP) Re7：读论文 FLA/MLAC/FactLaw Learning to Predict Charges for Criminal Cases with Legal Basis

通用文本分类

TextCNN
Bi-GRU
SVM

2018年

(NAACL) BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

结果展示

待补

原始格式数据集

LADAN格式数据集

引用

论文还在路上，现在如果大家想引用本GitHub项目可以参考如下格式：

@Misc{LJP_Collection,
  title = {LJP_Collection},
  author = {Huijuan Wang},
  howpublished = {\url{https://github.com/PolarisRisingWar/LJP_Collection}},
  year = {2023}
}

文字版可参考：Huijuan Wang, LJP_Collection, (2023), GitHub repository, \url{https://github.com/PolarisRisingWar/LJP_Collection}

Name		Name	Last commit message	Last commit date
Latest commit History 26 Commits
models		models
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

数据

原生数据格式

LADAN格式

CTM格式

LJP paper list

通用文本分类

结果展示

原始格式数据集

LADAN格式数据集

引用

Star History

About

Releases

Packages

Languages

PolarisRisingWar/LJP_Collection

Folders and files

Latest commit

History

Repository files navigation

数据

原生数据格式

LADAN格式

CTM格式

LJP paper list

通用文本分类

结果展示

原始格式数据集

LADAN格式数据集

引用

Star History

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages