Holy-fox commited on
Commit
82c7562
·
verified ·
1 Parent(s): 90d3829
Files changed (1) hide show
  1. README.md +74 -3
README.md CHANGED
@@ -1,3 +1,74 @@
1
- ---
2
- license: apache-2.0
3
- ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ license: apache-2.0
3
+ language:
4
+ - ja
5
+ ---
6
+
7
+ ![image/jpeg](https://cdn-uploads.huggingface.co/production/uploads/65f01b5235c5424c262c8be8/ti8DDkF-ai0nz75KaEpri.jpeg)
8
+
9
+ ## 概要
10
+
11
+ ArrowPro-7B-KillerWhaleはMistral系のNTQAI/chatntq-ja-7b-v1.0をベースにAItuber、AIアシスタントの魂となるようにChat性能、および高いプロンプトインジェクション耐性を重視して作られました。
12
+
13
+ ## ベンチマーク
14
+
15
+ ArrowPro-7B-KillerWhaleはベンチマーク(ELYZA-TASK100)において、ArrowPro-7B-KUJIRAの1.03倍の性能を発揮し、7Bモデルにおいて日本語性能最強のモデルです。(実質スコア3.91)
16
+
17
+ ![image/png](https://cdn-uploads.huggingface.co/production/uploads/65f01b5235c5424c262c8be8/X7nP0KSk-K9kp6RuOb6Vm.png)
18
+
19
+ ## How to use
20
+ ```python
21
+ import torch
22
+ from transformers import AutoTokenizer, AutoModelForCausalLM
23
+
24
+ tokenizer = AutoTokenizer.from_pretrained("DataPilot/ArrowPro-7B-KillerWhale")
25
+ model = AutoModelForCausalLM.from_pretrained(
26
+ "DataPilot/ArrowPro-7B-KillerWhale",
27
+ torch_dtype="auto",
28
+ )
29
+ model.eval()
30
+
31
+ if torch.cuda.is_available():
32
+ model = model.to("cuda")
33
+
34
+ def build_prompt(user_query):
35
+ sys_msg = "あなたは日本語を話す優秀なアシスタントです。回答には必ず日本語で答えてください。"
36
+ template = """[INST] <<SYS>>
37
+ {}
38
+ <</SYS>>
39
+
40
+ {}[/INST]"""
41
+ return template.format(sys_msg,user_query)
42
+
43
+ # Infer with prompt without any additional input
44
+ user_inputs = {
45
+ "user_query": "まどマギで一番かわいいキャラはだれ?",
46
+ }
47
+ prompt = build_prompt(**user_inputs)
48
+
49
+ input_ids = tokenizer.encode(
50
+ prompt,
51
+ add_special_tokens=True,
52
+ return_tensors="pt"
53
+ )
54
+
55
+ tokens = model.generate(
56
+ input_ids.to(device=model.device),
57
+ max_new_tokens=500,
58
+ temperature=1,
59
+ top_p=0.95,
60
+ do_sample=True,
61
+ )
62
+
63
+ out = tokenizer.decode(tokens[0][input_ids.shape[1]:], skip_special_tokens=True).strip()
64
+ print(out)
65
+ ```
66
+
67
+ ## 謝辞
68
+ 助言を与えてくださったすべての皆様に感謝します。
69
+ また、元モデルの開発者の皆様にも感謝を申し上げます。
70
+ このモデルを作成するために計算資源を貸してくれた[witness氏](https://x.com/i_witnessed_it)と[Meta Data Lab](https://x.com/Metadatalab)に感謝を申し上げます
71
+
72
+ ## お願い
73
+
74
+ このモデルを利用する際は他人に迷惑をかけないように最大限留意してください。