diff --git a/p5_simplifier.py b/p5_simplifier.py index ff4e437..add1944 100644 --- a/p5_simplifier.py +++ b/p5_simplifier.py @@ -15,20 +15,30 @@ if torch.cuda.is_available(): counter = 0 total = 0 -remained = 0 + id = '' keywords_count = 15 -def single_section_representation(text): - global remained +def single_section_representation(content): + """ + این متد، یک متن قانونی را با جملات ساده تر بازنمایی می کند + + **Args: + content(str): متن یک سکشن قانونی + **Returns: + result(bool): بیانگر وضعیت عملیات با یک کلید بولین + desc(str): توضیحی در مورد نتیجه عملیات + sentences(list): لیستی از جملاتی که متن ورودی را بازنمایی می کند + """ + try: - sen_count = (len(text) / 1000) * 15 + sen_count = (len(content) / 1000) * 15 sen_count = int(sen_count) if sen_count == 0: sen_count = 1 messages = [{"role": "system", "content": "تو یک وکیل حقوق دان هستی و باید بتوانی متن های قانونی و حقوقی را بدون تغییر اصطلاحات فنی، به صورتی توضیح دهی که افراد غیر حقوق دان، معنای متن را درک کنند. " }, {"role": "user", "content": - f"متن زیر را در قالب {sen_count} جمله جداگانه، ساده و روان به زبان فارسی، برای کسی که حقوق دان نیست، بازنویسی کن و بین دو * قرار بده و هیچ گونه توضیحی در ابتدا یا انتهای پاسخ، اضافه نکن. جملاتی که تولید می کنی، از نظر معنایی تکراری نباشند و از مجموع جملات بتوان منظور و معنای دقیق متن داده شده را فهم کرد. در پایان هر جمله، علامت نقطه قرار بده و به هیچ وجه جمله آخر را به صورت ناقص رها نکن.\n متن:{text}" + f"متن زیر را در قالب {sen_count} جمله جداگانه، ساده و روان به زبان فارسی، برای کسی که حقوق دان نیست، بازنویسی کن و بین دو * قرار بده و هیچ گونه توضیحی در ابتدا یا انتهای پاسخ، اضافه نکن. جملاتی که تولید می کنی، از نظر معنایی تکراری نباشند و از مجموع جملات بتوان منظور و معنای دقیق متن داده شده را فهم کرد. در پایان هر جمله، علامت نقطه قرار بده و به هیچ وجه جمله آخر را به صورت ناقص رها نکن.\n متن:{content}" }] input_ids = tokenizer.apply_chat_template(