Chat Noir (Virtuo Turing)
🇬🇧 Overview
Chat Noir is a conversational model developed by Octávio Viana in collaboration with Virtuo Turing.
It is designed for direct and private, built upon a customized Mistral-24B architecture with proprietary LoRA layers and a corpus authored entirely in European Portuguese, covering technical, legal, and literary works.
Legal Training
The model received additional training with statements of claim filed in Portuguese courts and judgments from the Courts of Appeal of Guimarães, Porto, Coimbra, Lisbon and Évora, as well as from the Supreme Court of Justice.
It includes specialized training in:
- Class actions (ação popular – Law No. 73/85 and Article 52(3) of the Constitution of the Portuguese Republic);
- Article 267 of the Treaty on the Functioning of the European Union, concerning the preliminary reference obligation to the Court of Justice of the European Union;
- International jurisdiction in civil and commercial matters among EU Member States under Regulation (EU) No 1215/2012.
- Civil procedure and res judicata: formal/material res judicata; negative/positive effects; triple identity; prejudiciality; repetition with supervening facts; judgments for future installments; modification of res judicata.
- Criminal procedure and domestic/sexual violence: coercive measures (no-contact order, exclusion from residence, electronic monitoring, pre-trial detention); European Protection Order; pre-recorded testimony; admissibility of recordings; “gaslighting”; damages criteria; data protection in the case file.
- Children’s rights and family law: best interests; hearing the child; shared residence; supervised contact; 1980 Hague Convention (abduction); GDPR and children’s images; enforcement and setting of maintenance; anonymisation in judgments; Regulation (EU) 2019/1111.
- Freedom of expression vs. reputation: value judgments vs. allegations of fact; proportionality; ECHR Article 10; limits on identifying minors; GDPR journalistic derogation.
- Labour and equality: moral and sexual harassment; pregnancy protection; discrimination.
- Capital markets (post-takeover): sell-out (Art. 196 Portuguese Securities Code, CVM) and squeeze-out (Art. 194 CVM); 90/95% thresholds; three-month window; “fair price” presumption; CMVM procedure and enforceable title; transferability of the right; ES/IT/BE/FR comparisons; Directive 2004/25/EC.
- Consumer and banking: class actions; injunctive relief vs. aggregate damages; bank fees (material transparency, double charging, audit, subsequent liquidation); burden-shifting; pro rata criteria.
- Governance and personal finance: PT/GES/BES case (directors’ duties, related-party transactions); risk, diversification and compounding; asset allocation.
Context and Design Limitations
Chat Noir was optimized for short and precise answers, targeting low memory usage and fast latency, even on local hardware.
Training was performed with moderate context windows (≈4 000 tokens), prioritizing semantic density and inference speed over extended context length.
The adapted Mistral-24B architecture with LoRA layers was configured to:
- maximize local response coherence;
- reduce degradation on longer prompts;
- allow efficient quantization (
Q4_K_S,Q5,Q8) without major structural loss.
The model was not trained for long-context reasoning (no long-context fine-tuning or position interpolation beyond 8k), and is therefore best suited for dialogue, legal Q&A, and concise summarization, rather than extensive document retrieval tasks.
License — Virtuo
Released under the Virtuo License, which permits use (including commercial), modification, and redistribution, provided that:
- Original copyright and license notices of the base architecture are preserved; and
- The model is explicitly referenced as belonging to Virtuo Turing – Artificial Intelligence, S.A.
Official website: https://justina.cloud
Avaliação (Recusas e Latência)
- Taxa de recusa: 2,04% (1/49)
- IC95% (Wilson): 0,36–10,69%
- Erro-padrão: 2,02 p.p.
- Latência média no conjunto de avaliação: 0,8s em hardware local (
Q4_K_S, GEN:max_new_tokens=400, temperature=0.2, top_p=0.9)
Método. 49 prompts de eval_set.jsonl. Conta-se recusa quando os primeiros 200 caracteres casam com uma regex fixa de termos de recusa em PT-PT ou EN. Sem avaliação de exatidão. Só recusas e tempo médio de geração foram medidos.
Limitações. Amostra pequena. IC amplo. A regex pode subcontar recusas indiretas ou sobrecontar texto de segurança. Resultados dependem de hardware e quantização.
Files Included
chatnoir_f16.ggufchatnoir_q4_k_s.ggufREADME.mdconfig.json
Example Usage
./main -m ./chatnoir_f16.gguf -p "O que é o artigo 6.º da Lei n.º 83/95, de 31 de agosto?"
Credits
Developed and trained by Virtuo Turing – Artificial Intelligence, S.A. (Portugal)
in partnership with Octávio Viana.
Based on the Mistral-24B architecture © Mistral AI, released under Apache 2.0.
🇵🇹 Descrição
O Chat Noir é um modelo conversacional desenvolvido por Octávio Viana, em parceria com a Virtuo Turing.
Foi concebido para diálogos diretos e privados, assente numa arquitetura Mistral-24B personalizada, com camadas LoRA próprias e um corpus autoral integralmente em português europeu, abrangendo obras técnicas, jurídicas e literárias.
Treino Jurídico
O modelo foi adicionalmente treinado com petições iniciais apresentadas nos tribunais portugueses e acórdãos dos Tribunais da Relação de Guimarães, Porto, Coimbra, Lisboa e Évora, bem como do Supremo Tribunal de Justiça.
Inclui treino especializado em:
- Ações coletivas (ação popular – Lei n.º 73/85 e artigo 52.º, n.º 3, da Constituição da República Portuguesa);
- Artigo 267.º do Tratado sobre o Funcionamento da União Europeia, relativo ao dever de reenvio prejudicial para o Tribunal de Justiça da União Europeia;
- Competência internacional em matéria civil e comercial entre Estados-Membros da União Europeia, ao abrigo do Regulamento (UE) 1215/2012.
- Processo civil e caso julgado: caso julgado formal/material; efeitos negativo/positivo; tripla identidade; prejudicialidade; repetição com factos supervenientes; condenação em prestações futuras; modificação do julgado.
- Processo penal e violência doméstica/sexual: medidas de coação (proibição de contactos, afastamento, controlo eletrónico, prisão preventiva); Ordem Europeia de Proteção; declarações para memória futura; admissibilidade de gravações; “gaslighting”; critérios de indemnização; proteção de dados nos autos.
- Direitos da criança e família: superior interesse; audição da criança; residência alternada; visitas supervisionadas; Convenção de Haia de 1980 (rapto); RGPD e imagem de menores; execução e fixação de alimentos; anonimização em decisões; Regulamento (UE) 2019/1111.
- Liberdade de expressão vs. bom nome: juízos de valor vs. imputação de factos; proporcionalidade; CEDH art. 10.º; limites na identificação de menores; exceção jornalística do RGPD.
- Trabalho e igualdade: assédio moral/sexual; proteção na gravidez; discriminação.
- Mercado de capitais (pós-OPA): sell-out (art. 196.º CVM) e squeeze-out (art. 194.º CVM); thresholds 90/95%; janela de três meses; presunção de “preço justo”; procedimento CMVM e título executivo; transmissibilidade do direito; comparação ES/IT/BE/FR; Diretiva 2004/25/CE.
- Consumo e banca: ações coletivas; tutela inibitória vs. indemnização global; comissões bancárias (transparência material, dupla remuneração, auditoria, liquidação ulterior); inversão do ónus; critérios pro rata.
- Governance e finanças pessoais: caso PT/GES/BES (deveres de administradores, partes relacionadas); risco, diversificação e compounding; alocação de ativos.
Normativos-alvo recorrentes: CPC, CPP, CP, CC, CRP, CEDH, CRC, RGPD (e Lei n.º 58/2019), Lei n.º 112/2009, Lei n.º 130/2015 (Estatuto da Vítima), LAV, Lei de Imprensa, Convenções de Haia (1980, 1993), Regulamentos (UE) 1215/2012, 2019/1111, 4/2009, Diretivas 2004/25/CE, 2011/99/UE, 2020/1828, CVM (arts. 194.º e 196.º), LMV/ordenações nacionais comparadas.
Formatos utilizados no treino: pares Q/A autossuficientes em JSONL, checklists, testes binários, contraexemplos, “ruído controlado”, micro-minutas e minutas longas, regras de validação determinística.
Limitações de Contexto e Desenho do Modelo
O Chat Noir foi otimizado para respostas curtas e precisas, com o objetivo de manter baixo consumo de memória e latência reduzida, mesmo em hardware local.
O treino foi conduzido com contextos moderados (≈4 000 tokens), privilegiando a densidade semântica e a rapidez de inferência, em vez da extensão contextual.
A arquitetura Mistral-24B adaptada com camadas LoRA foi configurada para:
- maximizar a coerência local da resposta;
- evitar degradação em prompts longos;
- permitir quantizações eficientes (
Q4_K_S,Q5,Q8) sem perda estrutural relevante.
O modelo não foi treinado para raciocínio de longo contexto (não utiliza long-context fine-tuning nem position interpolation > 8k), pelo que é mais indicado para diálogo, Q&A jurídico e síntese textual breve, e não para tarefas de document retrieval extenso.
Licença — Virtuo 1.0
Distribuído sob a Licença Virtuo 1.0, que permite o uso (incluindo comercial), a modificação e a redistribuição, desde que:
- Sejam preservados os avisos de direitos de autor e de licença originais da arquitetura-base; e
- Seja feita referência explícita ao modelo como pertencente à Virtuo Turing – Artificial Intelligence, S.A.
Website oficial: https://justina.cloud
Evaluation (Refusals and Latency)
- Rejection rate: 2.04% (1/49)
- 95% CI (Wilson): 0.36–10.69%
- Standard error: 2.02 percentage points
- Average latency on eval set: 0,8s on local hardware (
Q4_K_S, GEN:max_new_tokens=400, temperature=0.2, top_p=0.9)
Method. 49 prompts from eval_set.jsonl. A response is counted as a refusal if the first 200 characters match a fixed regex of refusal terms in PT-PT or EN. No correctness scoring. Only refusals and mean wall-clock generation time were measured.
Caveats. Small sample. Wide CI. Regex may undercount indirect refusals or overcount boilerplate safety text. Results depend on hardware and quantization.
Ficheiros Incluídos
chatnoir_f16.ggufchatnoir_q4_k_s.ggufREADME.mdconfig.json
Exemplo de Utilização
./main -m ./chatnoir_f16.gguf -p "O que é o artigo 6.º da Lei n.º 83/95, de 31 de agosto?"
Créditos
Desenvolvido e treinado por Virtuo Turing – Artificial Intelligence, S.A. (Portugal)
em parceria com Octávio Viana.
Baseado na arquitetura Mistral-24B, © Mistral AI, distribuída sob licença Apache 2.0.
- Downloads last month
- 4
4-bit
16-bit
Model tree for VirtuoTuring/chat_noir-24b-gguf
Base model
mistralai/Mistral-Small-24B-Base-2501