CIDAR-v2: Culturally-Relevant Instruction Dataset For Arabic v2. We need to fix the issues of the previous version and also add more samples.
Our data annotation paltform was built on top of flask library. You can follow the next steps to run the app.
- Install the requirements
pip install -r requirements.txt
. - Run the app using flask
flask --app app run
.
Reviewers can make changes on Instruction
and Output
to add new samples or review the previous samples from CIDAR.
instruction(str)
: required instruction. Each of the 10K instructions is reviewd by a contributer.
output(str)
: response for the instruction given.
This sample shows an Arabic-specific intruction which related to البلاغة
and الإعراب
. The sentence is orignally in Arabic - not translated from any other lanaguage -
index
: 10030
instruction
: لو سمحت اين صيغة المبالغة في " الجاحظ اديب سيارة اراؤه" و ما اعراب الجملة؟
output
:
'صيغة المبالغة في هذه الجملة هي "سيّارة"، فاسم الفاعل من "السير" هو '
'"سائر/ سائرة" وإذا أردت الدلالة على المبالغة في سير الآراء (أي '
'شهرتها وكثرة تداولها) قلت "آراء سيّارة".\r\n'
'أما إعراب الجملة فهو: "الجاحظُ": مبتدأ مرفوع بالضمة. "أديبٌ": خبر '
'مرفوع بالضمة. "سيارةٌ": خبر متقدم، و"آراؤُه": مبتدأ متأخر، وهو '
'مضاف والهاء ضمير متصل مضاف إليه في محل جر. ويمكن اعتبار "سيارة" '
'مبتدأ وهو وصف يعمل عمل فعله، و"آراؤُه" فاعل سدّ مسدّ الخبر.\r\n'
'وفي الحالتين فجملة "سيارة آراؤه" جملة اسمية في محل رفع نعت '
'لـ"أديب".'
Take a look at the Guidlines.