Loewolf commited on
Commit
1b407d5
·
verified ·
1 Parent(s): f592845

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +64 -3
README.md CHANGED
@@ -1,3 +1,64 @@
1
- ---
2
- license: mit
3
- ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ license: mit
3
+ language:
4
+ - de
5
+ base_model:
6
+ - kkirchheim/german-gpt2-medium
7
+ pipeline_tag: text-generation
8
+ tags:
9
+ - german
10
+ - gpt2
11
+ - fine-tuned
12
+ - text-generation
13
+ - mathematics
14
+ - general-knowledge
15
+ - conversation
16
+ - AI
17
+ - NLP
18
+ - deep-learning
19
+ - machine-learning
20
+
21
+ ---
22
+
23
+ # AtomicGPT 1
24
+
25
+ AtomicGPT 1 ist ein deutsches KI-Sprachmodell, das auf `GPT-2 Medium` basiert und speziell für die Verarbeitung der deutschen Sprache optimiert wurde. Das Modell wurde mit einem **1 MB großen Datensatz** trainiert, der **Mathematik, Allgemeinwissen und Gesprächsdaten** umfasst. Dabei wurde ein besonderer Fokus auf Konversationsfähigkeiten gelegt, da dieser Bereich die meisten Trainingsdaten erhielt.
26
+
27
+ ## Trainingsdetails
28
+ - **Modellbasis**: `kkirchheim/german-gpt2-medium`
29
+ - **Datensatzgröße**: 1 MB
30
+ - **Trainingsdauer**: 5 Stunden
31
+ - **Epochen**: 100
32
+ - **Trainingsziele**: Verbesserung der generellen Sprachfähigkeiten in Deutsch mit Fokus auf Mathematik, Allgemeinwissen und natürliche Gespräche
33
+
34
+ ## Anwendungsmöglichkeiten
35
+ AtomicGPT 1 eignet sich für verschiedene Anwendungsfälle, darunter:
36
+ - **Textgenerierung**: Erzeugung natürlicher und zusammenhängender deutscher Texte
37
+ - **Mathematische Problemstellungen**: Unterstützung bei Berechnungen und Problemlösungen
38
+ - **Allgemeinwissen**: Bereitstellung fundierter Antworten zu verschiedenen Themenbereichen
39
+ - **Dialogsysteme**: Interaktive und realistische Konversationen auf Deutsch
40
+
41
+ ## Lizenz
42
+ AtomicGPT 1 steht unter der **MIT-Lizenz**, was eine flexible Nutzung und Weiterentwicklung ermöglicht.
43
+
44
+ ## Installation & Nutzung
45
+ Das Modell kann mit der `transformers`-Bibliothek von Hugging Face genutzt werden:
46
+
47
+ ```python
48
+ from transformers import GPT2LMHeadModel, AutoTokenizer
49
+
50
+ model_name = "Pfad/zu/AtomicGPT1"
51
+ model = GPT2LMHeadModel.from_pretrained(model_name)
52
+ tokenizer = AutoTokenizer.from_pretrained(model_name)
53
+
54
+ prompt = "Was ist die Hauptstadt von Deutschland?"
55
+ input_ids = tokenizer(prompt, return_tensors="pt").input_ids
56
+ output = model.generate(input_ids, max_length=100)
57
+ print(tokenizer.decode(output[0], skip_special_tokens=True))
58
+ ```
59
+
60
+ ## Bild
61
+ ![AtomicGPT 1](1.jpg)
62
+
63
+ ---
64
+ AtomicGPT 1 ist ein kompaktes, aber leistungsfähiges deutsches Sprachmodell, das für spezifische Anwendungsfälle optimiert wurde. Es kann als Basis für weiterführende Entwicklungen oder als eigenständiges KI-Tool genutzt werden.