Justina Clarus 24B — safetensors
Modelo conversacional PT-PT focado no CPC e CC, com reforço intensivo em:
- abuso de direito,
- direito da família,
- liberdade sexual,
- ações coletivas (tipo popular).
Distribuição em safetensors para uso com transformers.
Origem
Base: Chat Noir — desenvolvido por Octávio Viana com Virtuo Turing – Artificial Intelligence, S.A.
Arquitetura: Mistral-24B com LoRA proprietárias. Corpus PT-PT técnico, jurídico e literário.
Cobertura jurídica
- CPC: espécies de ações, processos, competência, recursos, caso julgado.
- CC: obrigações, responsabilidade civil, direitos de personalidade.
- Reforços: abuso de direito; família e menores; liberdade sexual; ações populares.
- Contexto (seleção): CPP, CP, CRP, CEDH, RGPD (+ Lei 58/2019), Lei 112/2009, Lei 130/2015, LAV, Reg. (UE) 1215/2012, Reg. (UE) 2019/1111, Dir. 2004/25/CE, CVM 194/196.
Dados e metodologia
Treino em JSONL com pares Q/A autossuficientes.
role: "user" ou "assistant".content: texto simples em PT-PT. Sem cabeçalhos. Sem vírgulas finais.- Schema
{ "messages": [ {"role":"user","content":"…"}, {"role":"assistant","content":"…"} ] }
Exemplos {"messages":[{"role":"user","content":"Quais são as espécies fundamentais de ações no Direito Processual Civil segundo o artigo 10.º, n.º1 CPC?"},{"role":"assistant","content":"Segundo o artigo 10.º, n.º1 CPC, no esquema de Direito Processual Civil, há duas espécies fundamentais de ações."}]} {"messages":[{"role":"user","content":"O que caracteriza a ação declarativa no Direito Processual Civil?"},{"role":"assistant","content":"A ação declarativa pode ainda ser, conforme o artigo 10.º, n.º2 e 3 CPC, de simples apreciação, de condenação ou constitutiva, sendo que em cada subespécie se pedem diferentes providências ao tribunal."}]}
Treino jurídico adicional (síntese)
Peças processuais iniciais e acórdãos das Relações (Guimarães, Porto, Coimbra, Lisboa, Évora) e do STJ, convertidos em Q/A, checklists, testes binários, contraexemplos e “ruído controlado”.
Design e limites
- Respostas curtas e precisas; baixa latência local.
- Janela de contexto ≈ 4k tokens.
- Não otimizado para contexto longo (>8k).
Utilização
transformers (FP16/BF16, GPU)
from transformers import AutoTokenizer, AutoModelForCausalLM import torch
repo = "VirtuoTuring/justina_clarus-24b-safetensors" tok = AutoTokenizer.from_pretrained(repo, use_fast=True) dtype = torch.bfloat16 if torch.cuda.is_bf16_supported() else torch.float16 model = AutoModelForCausalLM.from_pretrained(repo, torch_dtype=dtype, device_map="auto")
prompt = "Pergunta: Indique as espécies de ações no art. 10.º, n.º 1 CPC.\nResposta:" inputs = tok(prompt, return_tensors="pt").to(model.device) out = model.generate(**inputs, max_new_tokens=400, temperature=0.2, top_p=0.9) print(tok.decode(out[0], skip_special_tokens=True))
4-bit (bitsandbytes)
from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig import torch
bnb = BitsAndBytesConfig( load_in_4bit=True, bnb_4bit_quant_type="nf4", bnb_4bit_use_double_quant=True, bnb_4bit_compute_dtype=torch.bfloat16 if torch.cuda.is_bf16_supported() else torch.float16 ) tok = AutoTokenizer.from_pretrained(repo, use_fast=True) model = AutoModelForCausalLM.from_pretrained(repo, quantization_config=bnb, device_map="auto")
Boas práticas
- Cite artigos e números quando relevante.
- Valide com fontes oficiais; revisão humana obrigatória em peças processuais.
Avaliação
Sem métricas públicas nesta versão. Uso alvo: Q/A jurídico, síntese curta, rascunhos.
Limitações
- Não substitui profissionais forenses ou tribunais.
- Pode errar em regimes especiais ou alterações legislativas recentes.
Licença
Virtuo 1.0. Uso, modificação e redistribuição, incluindo comercial, desde que se preservem avisos originais e referência a Virtuo Turing – Artificial Intelligence, S.A..
Créditos
Virtuo Turing – Artificial Intelligence, S.A. (Portugal) e Octávio Viana.
Base © Mistral AI (Apache-2.0).
Website: https://justina.cloud
Citação sugerida
VirtuoTuring/justina_clarus-24b-safetensors — modelo PT-PT jurídico (CPC/CC; abuso de direito; família; liberdade sexual; ações populares). Virtuo Turing – Artificial Intelligence, S.A.
Justina Clarus 24B — safetensors
PT-PT conversational model focused on the Portuguese CPC and Civil Code, with intensive subsets on:
- abuse of rights,
- family law,
- sexual freedom,
- “popular action” collective actions.
Distributed as safetensors for use with transformers.
Origin
Base: Chat Noir — developed by Octávio Viana with Virtuo Turing – Artificial Intelligence, S.A.
Architecture: Mistral-24B with proprietary LoRA adapters. Corpus authored in European Portuguese across technical, legal, and literary domains.
Legal coverage
- CPC: types of actions, procedures, jurisdiction, appeals, res judicata.
- CC: obligations, tort, personality rights.
- Reinforcements: abuse of rights; family and minors; sexual freedom; popular actions.
- Wider context (selection): CPP, CP, CRP, ECHR, GDPR (+ Law 58/2019), Law 112/2009, Law 130/2015, LAV, Reg. (EU) 1215/2012, Reg. (EU) 2019/1111, Directive 2004/25/EC, CVM 194/196.
Data and method
Training in JSONL using self-contained Q/A pairs.
role: "user" or "assistant".content: plain PT-PT text. No headers. No trailing commas.- Schema
{ "messages": [ {"role":"user","content":"…"}, {"role":"assistant","content":"…"} ] }
Examples {"messages":[{"role":"user","content":"Quais são as espécies fundamentais de ações no Direito Processual Civil segundo o artigo 10.º, n.º1 CPC?"},{"role":"assistant","content":"Segundo o artigo 10.º, n.º1 CPC, no esquema de Direito Processual Civil, há duas espécies fundamentais de ações."}]} {"messages":[{"role":"user","content":"O que caracteriza a ação declarativa no Direito Processual Civil?"},{"role":"assistant","content":"A ação declarativa pode ainda ser, conforme o artigo 10.º, n.º2 e 3 CPC, de simples apreciação, de condenação ou constitutiva, sendo que em cada subespécie se pedem diferentes providências ao tribunal."}]}
Additional legal training (summary)
Statements of claim and Portuguese appellate and Supreme Court judgments, transformed into Q/A, checklists, binary tests, counterexamples, and “controlled noise”.
Design and limits
- Short, precise answers; low latency on local hardware.
- Context window ≈ 4k tokens.
- Not tuned for very long context (>8k).
Usage
transformers (FP16/BF16, GPU)
from transformers import AutoTokenizer, AutoModelForCausalLM import torch
repo = "VirtuoTuring/justina_clarus-24b-safetensors" tok = AutoTokenizer.from_pretrained(repo, use_fast=True) dtype = torch.bfloat16 if torch.cuda.is_bf16_supported() else torch.float16 model = AutoModelForCausalLM.from_pretrained(repo, torch_dtype=dtype, device_map="auto")
prompt = "Pergunta: Indique as espécies de ações no art. 10.º, n.º 1 CPC.\nResposta:" inputs = tok(prompt, return_tensors="pt").to(model.device) out = model.generate(**inputs, max_new_tokens=400, temperature=0.2, top_p=0.9) print(tok.decode(out[0], skip_special_tokens=True))
4-bit (bitsandbytes)
from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig import torch
bnb = BitsAndBytesConfig( load_in_4bit=True, bnb_4bit_quant_type="nf4", bnb_4bit_use_double_quant=True, bnb_4bit_compute_dtype=torch.bfloat16 if torch.cuda.is_bf16_supported() else torch.float16 ) tok = AutoTokenizer.from_pretrained(repo, use_fast=True) model = AutoModelForCausalLM.from_pretrained(repo, quantization_config=bnb, device_map="auto")
Good practice
- Cite article numbers when relevant.
- Validate outputs against official sources; human review required for filings.
Evaluation
No public metrics in this card. Target use: legal Q/A, brief synthesis, drafting support.
Limitations
- Not a substitute for legal professionals or courts.
- May miss special regimes or recent legislative changes.
License
Virtuo 1.0. Permissive use, modification, and redistribution, including commercial, provided original notices are preserved and Virtuo Turing – Artificial Intelligence, S.A. is referenced.
Credits
Virtuo Turing – Artificial Intelligence, S.A. (Portugal) and Octávio Viana.
Base © Mistral AI (Apache-2.0).
Website: https://justina.cloud
Suggested citation
VirtuoTuring/justina_clarus-24b-safetensors — PT-PT legal model (CPC/CC; abuse of rights; family; sexual freedom; popular actions). Virtuo Turing – Artificial Intelligence, S.A.
- Downloads last month
- 5