khanhld commited on
Commit
b873087
·
verified ·
1 Parent(s): f8238ce

Upload ChunkFormer model

Browse files
Files changed (5) hide show
  1. README.md +82 -0
  2. config.yaml +121 -0
  3. global_cmvn +1 -0
  4. pytorch_model.pt +3 -0
  5. vocab.txt +1024 -0
README.md ADDED
@@ -0,0 +1,82 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - speech-recognition
4
+ - audio
5
+ - chunkformer
6
+ - ctc
7
+ - pytorch
8
+ - transformers
9
+ - automatic-speech-recognition
10
+ - long-form transcription
11
+ - asr
12
+ license: apache-2.0
13
+ library_name: transformers
14
+ pipeline_tag: automatic-speech-recognition
15
+ ---
16
+
17
+ # ChunkFormer Model
18
+ <style>
19
+ img {
20
+ display: inline;
21
+ }
22
+ </style>
23
+ [![GitHub](https://img.shields.io/badge/GitHub-ChunkFormer-blue)](https://github.com/khanld/chunkformer)
24
+ [![Paper](https://img.shields.io/badge/Paper-ICASSP%202025-green)](https://arxiv.org/abs/2502.14673)
25
+
26
+
27
+ ## Usage
28
+
29
+ Install the package:
30
+
31
+ ```bash
32
+ pip install chunkformer
33
+ ```
34
+
35
+ ```python
36
+ from chunkformer import ChunkFormerModel
37
+
38
+ # Load the model
39
+ model = ChunkFormerModel.from_pretrained("khanhld/chunkformer-ctc-small-libri-100h")
40
+
41
+ # For long-form audio transcription
42
+ transcription = model.endless_decode(
43
+ audio_path="path/to/your/audio.wav",
44
+ chunk_size=64,
45
+ left_context_size=128,
46
+ right_context_size=128,
47
+ return_timestamps=True
48
+ )
49
+ print(transcription)
50
+
51
+ # For batch processing
52
+ audio_files = ["audio1.wav", "audio2.wav", "audio3.wav"]
53
+ transcriptions = model.batch_decode(
54
+ audio_paths=audio_files,
55
+ chunk_size=64,
56
+ left_context_size=128,
57
+ right_context_size=128
58
+ )
59
+ ```
60
+
61
+ ## Training
62
+
63
+ This model was trained using the ChunkFormer framework. For more details about the training process and to access the source code, please visit: https://github.com/khanld/chunkformer
64
+
65
+ Paper: https://arxiv.org/abs/2502.14673
66
+
67
+ ## Citation
68
+
69
+ If you use this work in your research, please cite:
70
+
71
+ ```bibtex
72
+ @INPROCEEDINGS{10888640,
73
+ author={Le, Khanh and Ho, Tuan Vu and Tran, Dung and Chau, Duc Thanh},
74
+ booktitle={ICASSP 2025 - 2025 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)},
75
+ title={ChunkFormer: Masked Chunking Conformer For Long-Form Speech Transcription},
76
+ year={2025},
77
+ volume={},
78
+ number={},
79
+ pages={1-5},
80
+ keywords={Scalability;Memory management;Graphics processing units;Signal processing;Performance gain;Hardware;Resource management;Speech processing;Standards;Context modeling;chunkformer;masked batch;long-form transcription},
81
+ doi={10.1109/ICASSP49660.2025.10888640}}
82
+ ```
config.yaml ADDED
@@ -0,0 +1,121 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ accum_grad: 2
2
+ cmvn: global_cmvn
3
+ cmvn_conf:
4
+ cmvn_file: data/train-clean-100/global_cmvn
5
+ is_json_cmvn: true
6
+ ctc: ctc
7
+ ctc_conf:
8
+ ctc_blank_id: 0
9
+ dataset: asr
10
+ dataset_conf:
11
+ batch_conf:
12
+ batch_type: dynamic
13
+ max_frames_in_batch: 120000
14
+ pad_feat: true
15
+ fbank_conf:
16
+ dither: 1.0
17
+ frame_length: 25
18
+ frame_shift: 10
19
+ num_mel_bins: 80
20
+ filter_conf:
21
+ max_length: 40960
22
+ min_length: 0
23
+ token_max_length: 400
24
+ token_min_length: 1
25
+ resample_conf:
26
+ resample_rate: 16000
27
+ shuffle: true
28
+ shuffle_conf:
29
+ shuffle_size: 1000
30
+ sort: false
31
+ sort_conf:
32
+ sort_size: 2000
33
+ spec_aug: true
34
+ spec_aug_conf:
35
+ max_f: 10
36
+ max_t: 50
37
+ num_f_mask: 2
38
+ num_t_mask: 2
39
+ spec_sub: false
40
+ spec_sub_conf:
41
+ max_t: 30
42
+ num_t_sub: 3
43
+ speed_perturb: true
44
+ decoder: bitransformer
45
+ decoder_conf:
46
+ attention_heads: 4
47
+ dropout_rate: 0.1
48
+ linear_units: 2048
49
+ num_blocks: 3
50
+ positional_dropout_rate: 0.1
51
+ r_num_blocks: 3
52
+ self_attention_dropout_rate: 0.1
53
+ src_attention_dropout_rate: 0.1
54
+ dtype: fp16
55
+ encoder: chunkformer
56
+ encoder_conf:
57
+ activation_type: swish
58
+ attention_dropout_rate: 0.1
59
+ attention_heads: 4
60
+ cnn_module_kernel: 15
61
+ cnn_module_norm: layer_norm
62
+ dropout_rate: 0.1
63
+ dynamic_chunk_sizes:
64
+ - -1
65
+ - -1
66
+ - 64
67
+ - 128
68
+ - 256
69
+ dynamic_conv: true
70
+ dynamic_left_context_sizes:
71
+ - 64
72
+ - 128
73
+ - 256
74
+ dynamic_right_context_sizes:
75
+ - 64
76
+ - 128
77
+ - 256
78
+ input_layer: dw_striding
79
+ linear_units: 2048
80
+ normalize_before: true
81
+ num_blocks: 12
82
+ output_size: 256
83
+ pos_enc_layer_type: chunk_rel_pos
84
+ positional_dropout_rate: 0.1
85
+ selfattention_layer_type: chunk_rel_seflattn
86
+ use_cnn_module: true
87
+ grad_clip: 5
88
+ input_dim: 80
89
+ log_interval: 100
90
+ max_epoch: 200
91
+ model: asr_model
92
+ model_conf:
93
+ ctc_weight: 0.3
94
+ length_normalized_loss: false
95
+ lsm_weight: 0.1
96
+ reverse_weight: 0.3
97
+ model_dir: exp/v1
98
+ optim: adamw
99
+ optim_conf:
100
+ lr: 0.001
101
+ output_dim: 1024
102
+ save_states: model_only
103
+ scheduler: warmuplr
104
+ scheduler_conf:
105
+ warmup_steps: 15000
106
+ tokenizer: bpe
107
+ tokenizer_conf:
108
+ bpe_path: data/lang_char/train-clean-100_bpe1024.model
109
+ is_multilingual: false
110
+ non_lang_syms_path: null
111
+ num_languages: 1
112
+ special_tokens:
113
+ <blank>: 0
114
+ <eos>: 2
115
+ <sos>: 2
116
+ <unk>: 1
117
+ split_with_space: false
118
+ symbol_table_path: data/lang_char/train-clean-100_bpe1024_units.txt
119
+ train_engine: torch_ddp
120
+ use_amp: true
121
+ vocab_size: 1024
global_cmvn ADDED
@@ -0,0 +1 @@
 
 
1
+ {"mean_stat": [377288640.0, 392184320.0, 415522112.0, 439642304.0, 462305440.0, 478134144.0, 486317792.0, 484854944.0, 481903008.0, 478719936.0, 484679808.0, 490927648.0, 501299424.0, 508010560.0, 509113632.0, 510138976.0, 509241344.0, 505738048.0, 507309600.0, 497438368.0, 489879040.0, 495238624.0, 486570304.0, 489920800.0, 486313792.0, 489624352.0, 486650080.0, 490423072.0, 490283296.0, 491844256.0, 493904384.0, 496209792.0, 499723104.0, 506249856.0, 511422688.0, 514613472.0, 519311744.0, 523896064.0, 528323104.0, 527253408.0, 531522400.0, 530094080.0, 532636160.0, 531560032.0, 532671776.0, 535229760.0, 538473664.0, 541965888.0, 544653120.0, 546927744.0, 547662464.0, 548900608.0, 550557184.0, 551221760.0, 550011072.0, 549681216.0, 549286208.0, 549093952.0, 549785856.0, 550029440.0, 550721856.0, 548635328.0, 544479872.0, 541057088.0, 537695744.0, 534047744.0, 530223392.0, 526621440.0, 524060832.0, 522416352.0, 520415168.0, 519538016.0, 519445088.0, 519127552.0, 517873984.0, 516610112.0, 516178496.0, 513642656.0, 511779712.0, 509221632.0], "var_stat": [4320987136.0, 4707190784.0, 5358135296.0, 5987740672.0, 6634504704.0, 7109028352.0, 7372617216.0, 7347464192.0, 7241876480.0, 7122445824.0, 7274906624.0, 7460743680.0, 7764865024.0, 7959791616.0, 7985910272.0, 8000324096.0, 7956391424.0, 7843857408.0, 7875313152.0, 7581451776.0, 7354802688.0, 7481633280.0, 7224129024.0, 7295001088.0, 7178827776.0, 7249619968.0, 7157318656.0, 7249249792.0, 7242912768.0, 7282761216.0, 7336015872.0, 7396921856.0, 7479434240.0, 7617581056.0, 7766127616.0, 7900237824.0, 8038410752.0, 8170933760.0, 8297018368.0, 8260835840.0, 8380481024.0, 8333346816.0, 8399360000.0, 8366544896.0, 8400977920.0, 8480865280.0, 8584512000.0, 8697213952.0, 8783428608.0, 8851557376.0, 8868983808.0, 8906819584.0, 8952121344.0, 8969757696.0, 8927692800.0, 8911980544.0, 8898642944.0, 8894412800.0, 8916986880.0, 8925707264.0, 8938296320.0, 8863333376.0, 8754246656.0, 8649031680.0, 8546321920.0, 8433665024.0, 8317259264.0, 8210675712.0, 8133715456.0, 8079525888.0, 8018883584.0, 7984903680.0, 7976119296.0, 7963761664.0, 7922351104.0, 7879020544.0, 7862078976.0, 7796150272.0, 7744995840.0, 7673272832.0], "frame_num": 36162482}
pytorch_model.pt ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:99f4ee7b772ddf3b5d3a01bbbfd6fa85dbb687f653813d7fe8171ac949afaa04
3
+ size 183009932
vocab.txt ADDED
@@ -0,0 +1,1024 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ <blank> 0
2
+ <unk> 1
3
+ <sos/eos> 2
4
+ ' 3
5
+ ▁ 4
6
+ ▁a 5
7
+ a 6
8
+ ▁ab 7
9
+ ab 8
10
+ able 9
11
+ ably 10
12
+ ▁about 11
13
+ ▁ac 12
14
+ ac 13
15
+ ▁acc 14
16
+ ace 15
17
+ ach 16
18
+ ached 17
19
+ ack 18
20
+ ▁act 19
21
+ act 20
22
+ ▁ad 21
23
+ ad 22
24
+ ▁add 23
25
+ ade 24
26
+ ▁adm 25
27
+ ▁adv 26
28
+ ady 27
29
+ ▁af 28
30
+ ▁after 29
31
+ ▁ag 30
32
+ ag 31
33
+ ▁again 32
34
+ ▁against 33
35
+ age 34
36
+ ail 35
37
+ ain 36
38
+ ained 37
39
+ aint 38
40
+ ▁air 39
41
+ air 40
42
+ ak 41
43
+ ake 42
44
+ aken 43
45
+ aking 44
46
+ ▁al 45
47
+ al 46
48
+ ale 47
49
+ alk 48
50
+ ▁all 49
51
+ all 50
52
+ ally 51
53
+ ▁almost 52
54
+ ▁along 53
55
+ als 54
56
+ ▁also 55
57
+ ▁always 56
58
+ ▁am 57
59
+ am 58
60
+ ame 59
61
+ ▁among 60
62
+ amp 61
63
+ ▁an 62
64
+ an 63
65
+ anc 64
66
+ ance 65
67
+ ▁and 66
68
+ and 67
69
+ ane 68
70
+ ang 69
71
+ ange 70
72
+ ank 71
73
+ ▁another 72
74
+ ans 73
75
+ ▁answ 74
76
+ ant 75
77
+ ▁any 76
78
+ ▁anything 77
79
+ ap 78
80
+ ▁app 79
81
+ app 80
82
+ ▁appe 81
83
+ aps 82
84
+ ▁ar 83
85
+ ar 84
86
+ ard 85
87
+ ▁are 86
88
+ are 87
89
+ ared 88
90
+ ark 89
91
+ ▁arm 90
92
+ arm 91
93
+ ars 92
94
+ art 93
95
+ ary 94
96
+ ▁as 95
97
+ as 96
98
+ ase 97
99
+ ash 98
100
+ ▁asked 99
101
+ ason 100
102
+ ▁ass 101
103
+ ass 102
104
+ ast 103
105
+ ▁at 104
106
+ at 105
107
+ atch 106
108
+ ate 107
109
+ ated 108
110
+ ately 109
111
+ ater 110
112
+ ates 111
113
+ ath 112
114
+ ather 113
115
+ ating 114
116
+ ation 115
117
+ ations 116
118
+ ▁att 117
119
+ au 118
120
+ aught 119
121
+ ause 120
122
+ aut 121
123
+ av 122
124
+ ave 123
125
+ ▁aw 124
126
+ ▁away 125
127
+ ay 126
128
+ ▁b 127
129
+ b 128
130
+ ▁back 129
131
+ ▁bar 130
132
+ ▁be 131
133
+ be 132
134
+ ▁beaut 133
135
+ ▁bec 134
136
+ ▁because 135
137
+ ▁been 136
138
+ ▁before 137
139
+ ▁beg 138
140
+ ▁began 139
141
+ ▁beh 140
142
+ ▁being 141
143
+ ▁bel 142
144
+ ▁belie 143
145
+ ▁believe 144
146
+ ber 145
147
+ ▁best 146
148
+ ▁bet 147
149
+ ▁better 148
150
+ ▁betw 149
151
+ ▁between 150
152
+ ▁bl 151
153
+ ▁black 152
154
+ ble 153
155
+ ▁bo 154
156
+ ▁bod 155
157
+ ▁both 156
158
+ ▁br 157
159
+ ▁bre 158
160
+ ▁bro 159
161
+ ▁brought 160
162
+ ▁bu 161
163
+ ▁bus 162
164
+ ▁but 163
165
+ ▁by 164
166
+ ▁c 165
167
+ c 166
168
+ ▁call 167
169
+ ▁called 168
170
+ ▁came 169
171
+ ▁can 170
172
+ ▁cap 171
173
+ ▁car 172
174
+ ▁care 173
175
+ cc 174
176
+ ce 175
177
+ ced 176
178
+ cei 177
179
+ cept 178
180
+ ▁certain 179
181
+ ces 180
182
+ cess 181
183
+ ▁ch 182
184
+ ch 183
185
+ ▁char 184
186
+ ▁che 185
187
+ ched 186
188
+ ▁child 187
189
+ ci 188
190
+ ck 189
191
+ ▁cl 190
192
+ cl 191
193
+ ▁cle 192
194
+ ▁co 193
195
+ ▁col 194
196
+ ▁com 195
197
+ ▁come 196
198
+ ▁comm 197
199
+ ▁comp 198
200
+ ▁compan 199
201
+ ▁con 200
202
+ ▁conf 201
203
+ ▁cons 202
204
+ ▁cont 203
205
+ ▁contin 204
206
+ ▁cor 205
207
+ ▁cou 206
208
+ ▁could 207
209
+ ▁count 208
210
+ ▁country 209
211
+ ▁cour 210
212
+ ▁course 211
213
+ ▁cr 212
214
+ ct 213
215
+ ction 214
216
+ ▁cur 215
217
+ ▁d 216
218
+ d 217
219
+ ▁dark 218
220
+ ▁day 219
221
+ ▁days 220
222
+ dd 221
223
+ dden 222
224
+ ▁de 223
225
+ de 224
226
+ ▁dear 225
227
+ ▁del 226
228
+ ▁des 227
229
+ ▁did 228
230
+ ▁dif 229
231
+ ▁dis 230
232
+ ▁disc 231
233
+ ▁dist 232
234
+ ▁do 233
235
+ ▁doct 234
236
+ ▁does 235
237
+ ▁don 236
238
+ ▁done 237
239
+ ▁door 238
240
+ ▁down 239
241
+ ▁dr 240
242
+ ▁dra 241
243
+ ▁dre 242
244
+ ▁e 243
245
+ e 244
246
+ ▁each 245
247
+ ▁ear 246
248
+ ect 247
249
+ ▁ed 248
250
+ ed 249
251
+ een 250
252
+ ▁eight 251
253
+ ▁el 252
254
+ el 253
255
+ ▁em 254
256
+ em 255
257
+ ▁en 256
258
+ en 257
259
+ ence 258
260
+ ▁end 259
261
+ ened 260
262
+ ▁eng 261
263
+ ▁enough 262
264
+ ens 263
265
+ ense 264
266
+ ▁ent 265
267
+ ent 266
268
+ ention 267
269
+ ently 268
270
+ ents 269
271
+ enty 270
272
+ ep 271
273
+ er 272
274
+ ered 273
275
+ ering 274
276
+ ers 275
277
+ ertain 276
278
+ ▁es 277
279
+ es 278
280
+ ess 279
281
+ est 280
282
+ et 281
283
+ eter 282
284
+ ▁ev 283
285
+ ▁even 284
286
+ ▁ever 285
287
+ ever 286
288
+ ▁every 287
289
+ ew 288
290
+ ▁ex 289
291
+ ▁exp 290
292
+ ▁ey 291
293
+ ▁eyes 292
294
+ ▁f 293
295
+ f 294
296
+ ▁fa 295
297
+ ▁face 296
298
+ ▁fact 297
299
+ ▁fall 298
300
+ ▁fam 299
301
+ ▁far 300
302
+ ▁father 301
303
+ ▁fe 302
304
+ fe 303
305
+ fect 304
306
+ ▁feel 305
307
+ ▁feet 306
308
+ ▁felt 307
309
+ ▁few 308
310
+ ff 309
311
+ ▁fin 310
312
+ ▁find 311
313
+ ▁fir 312
314
+ ▁first 313
315
+ ▁five 314
316
+ ▁fl 315
317
+ ▁fo 316
318
+ ▁follow 317
319
+ ▁for 318
320
+ ▁fore 319
321
+ fore 320
322
+ ▁form 321
323
+ fort 322
324
+ ▁found 323
325
+ ▁four 324
326
+ ▁fr 325
327
+ ▁friend 326
328
+ ▁from 327
329
+ ft 328
330
+ ful 329
331
+ ▁full 330
332
+ fully 331
333
+ ▁g 332
334
+ g 333
335
+ ▁gave 334
336
+ ge 335
337
+ ged 336
338
+ ▁gen 337
339
+ ▁gener 338
340
+ ▁gent 339
341
+ ▁get 340
342
+ get 341
343
+ gether 342
344
+ gg 343
345
+ gh 344
346
+ ght 345
347
+ ▁gi 346
348
+ ▁girl 347
349
+ ▁give 348
350
+ ▁gl 349
351
+ ▁go 350
352
+ ▁god 351
353
+ ▁going 352
354
+ ▁good 353
355
+ ▁got 354
356
+ ▁gr 355
357
+ ▁gra 356
358
+ ▁gre 357
359
+ ▁great 358
360
+ ▁gu 359
361
+ ▁h 360
362
+ h 361
363
+ ▁ha 362
364
+ ▁had 363
365
+ ▁half 364
366
+ ▁hand 365
367
+ ▁hands 366
368
+ ▁happ 367
369
+ haps 368
370
+ ▁hard 369
371
+ ▁has 370
372
+ ▁have 371
373
+ ▁having 372
374
+ ▁he 373
375
+ he 374
376
+ ▁head 375
377
+ ▁hear 376
378
+ ▁heard 377
379
+ ▁heart 378
380
+ hed 379
381
+ ▁hel 380
382
+ ▁her 381
383
+ her 382
384
+ ▁here 383
385
+ ▁herself 384
386
+ hes 385
387
+ ▁high 386
388
+ ▁him 387
389
+ ▁himself 388
390
+ hing 389
391
+ ▁his 390
392
+ hn 391
393
+ ▁ho 392
394
+ ▁home 393
395
+ ▁hope 394
396
+ ▁hor 395
397
+ ▁hour 396
398
+ ▁house 397
399
+ ▁how 398
400
+ ▁however 399
401
+ ▁hu 400
402
+ ▁hum 401
403
+ ▁hundred 402
404
+ ▁i 403
405
+ i 404
406
+ ia 405
407
+ ial 406
408
+ ian 407
409
+ ib 408
410
+ ible 409
411
+ ic 410
412
+ ical 411
413
+ ice 412
414
+ ich 413
415
+ ick 414
416
+ ict 415
417
+ id 416
418
+ ▁ide 417
419
+ ide 418
420
+ ie 419
421
+ ied 420
422
+ iend 421
423
+ ier 422
424
+ ies 423
425
+ iet 424
426
+ ▁if 425
427
+ if 426
428
+ ife 427
429
+ ig 428
430
+ igh 429
431
+ ight 430
432
+ ign 431
433
+ il 432
434
+ ild 433
435
+ ile 434
436
+ iled 435
437
+ ill 436
438
+ ily 437
439
+ ▁im 438
440
+ im 439
441
+ ▁imm 440
442
+ ▁imp 441
443
+ ▁in 442
444
+ in 443
445
+ ▁inc 444
446
+ ▁ind 445
447
+ ind 446
448
+ ▁inde 447
449
+ ▁indeed 448
450
+ ine 449
451
+ ined 450
452
+ iness 451
453
+ ▁inf 452
454
+ ing 453
455
+ ings 454
456
+ ink 455
457
+ ▁ins 456
458
+ ins 457
459
+ ▁inst 458
460
+ ▁int 459
461
+ int 460
462
+ ▁inte 461
463
+ ▁inter 462
464
+ ▁into 463
465
+ ion 464
466
+ ions 465
467
+ ious 466
468
+ ip 467
469
+ ir 468
470
+ ire 469
471
+ ired 470
472
+ irl 471
473
+ ▁is 472
474
+ is 473
475
+ ise 474
476
+ ised 475
477
+ ish 476
478
+ ished 477
479
+ iss 478
480
+ ist 479
481
+ ▁it 480
482
+ it 481
483
+ ite 482
484
+ ited 483
485
+ ith 484
486
+ ither 485
487
+ ities 486
488
+ ition 487
489
+ ▁its 488
490
+ its 489
491
+ itt 490
492
+ ittle 491
493
+ ity 492
494
+ iv 493
495
+ ive 494
496
+ iver 495
497
+ ix 496
498
+ ▁j 497
499
+ j 498
500
+ ject 499
501
+ ▁jo 500
502
+ ▁john 501
503
+ ▁just 502
504
+ ▁k 503
505
+ k 504
506
+ ▁ke 505
507
+ ke 506
508
+ ked 507
509
+ ▁keep 508
510
+ ▁kind 509
511
+ ▁king 510
512
+ ▁kn 511
513
+ ▁knew 512
514
+ ▁know 513
515
+ ks 514
516
+ ▁l 515
517
+ l 516
518
+ ▁la 517
519
+ ▁land 518
520
+ land 519
521
+ ▁lar 520
522
+ ▁last 521
523
+ ▁lay 522
524
+ ld 523
525
+ ▁le 524
526
+ le 525
527
+ led 526
528
+ ▁left 527
529
+ les 528
530
+ ▁less 529
531
+ less 530
532
+ ▁let 531
533
+ lf 532
534
+ ▁li 533
535
+ lic 534
536
+ ▁life 535
537
+ ▁light 536
538
+ ▁like 537
539
+ ling 538
540
+ ▁little 539
541
+ ll 540
542
+ llow 541
543
+ ▁lo 542
544
+ ▁long 543
545
+ ▁loo 544
546
+ ▁look 545
547
+ ▁looked 546
548
+ ▁looking 547
549
+ ▁love 548
550
+ lt 549
551
+ ly 550
552
+ ▁m 551
553
+ m 552
554
+ ▁ma 553
555
+ ▁made 554
556
+ ▁make 555
557
+ ▁man 556
558
+ man 557
559
+ ▁many 558
560
+ ▁mar 559
561
+ ▁mas 560
562
+ ▁mat 561
563
+ ▁may 562
564
+ ▁me 563
565
+ ▁mean 564
566
+ ▁men 565
567
+ ment 566
568
+ ▁mer 567
569
+ ▁met 568
570
+ ▁might 569
571
+ ▁mil 570
572
+ ▁min 571
573
+ ▁mind 572
574
+ ▁mis 573
575
+ ▁miss 574
576
+ ▁missus 575
577
+ ▁mister 576
578
+ ▁mo 577
579
+ ▁moment 578
580
+ ▁mon 579
581
+ ▁money 580
582
+ ▁more 581
583
+ ▁morn 582
584
+ ▁morning 583
585
+ ▁most 584
586
+ most 585
587
+ ▁mother 586
588
+ ▁mount 587
589
+ ▁mu 588
590
+ ▁much 589
591
+ ▁must 590
592
+ ▁my 591
593
+ ▁myself 592
594
+ ▁n 593
595
+ n 594
596
+ ▁name 595
597
+ ▁nat 596
598
+ nd 597
599
+ nded 598
600
+ nder 599
601
+ ▁ne 600
602
+ ne 601
603
+ ▁near 602
604
+ ned 603
605
+ ▁need 604
606
+ ner 605
607
+ ness 606
608
+ ▁never 607
609
+ ▁new 608
610
+ ▁next 609
611
+ ng 610
612
+ ▁night 611
613
+ ning 612
614
+ ▁no 613
615
+ ▁nor 614
616
+ ▁not 615
617
+ not 616
618
+ ▁nothing 617
619
+ ▁now 618
620
+ nt 619
621
+ ▁o 620
622
+ o 621
623
+ ▁ob 622
624
+ ▁occ 623
625
+ ock 624
626
+ od 625
627
+ ▁of 626
628
+ ▁off 627
629
+ og 628
630
+ ▁oh 629
631
+ ol 630
632
+ ▁old 631
633
+ om 632
634
+ ome 633
635
+ omet 634
636
+ ▁on 635
637
+ on 636
638
+ ▁once 637
639
+ ond 638
640
+ ▁one 639
641
+ one 640
642
+ oney 641
643
+ ong 642
644
+ ▁only 643
645
+ ons 644
646
+ ont 645
647
+ oo 646
648
+ ood 647
649
+ ook 648
650
+ ool 649
651
+ ▁op 650
652
+ op 651
653
+ ▁open 652
654
+ ople 653
655
+ ▁or 654
656
+ or 655
657
+ ▁ord 656
658
+ ord 657
659
+ ore 658
660
+ orm 659
661
+ orn 660
662
+ ors 661
663
+ ort 662
664
+ ory 663
665
+ os 664
666
+ ose 665
667
+ osed 666
668
+ oss 667
669
+ ost 668
670
+ ot 669
671
+ oth 670
672
+ ▁other 671
673
+ other 672
674
+ ▁others 673
675
+ ou 674
676
+ oub 675
677
+ oud 676
678
+ ough 677
679
+ ought 678
680
+ ould 679
681
+ ound 680
682
+ ount 681
683
+ ▁our 682
684
+ our 683
685
+ ous 684
686
+ ouse 685
687
+ ▁out 686
688
+ out 687
689
+ ove 688
690
+ ▁over 689
691
+ ow 690
692
+ owed 691
693
+ ower 692
694
+ ▁own 693
695
+ own 694
696
+ ows 695
697
+ oy 696
698
+ ▁p 697
699
+ p 698
700
+ ▁par 699
701
+ ▁part 700
702
+ ▁pass 701
703
+ ▁passed 702
704
+ ▁pat 703
705
+ ▁pe 704
706
+ pe 705
707
+ pect 706
708
+ ▁people 707
709
+ ▁per 708
710
+ per 709
711
+ ▁perhaps 710
712
+ ▁pers 711
713
+ ▁person 712
714
+ ▁ph 713
715
+ ph 714
716
+ ▁pl 715
717
+ pl 716
718
+ ▁place 717
719
+ ▁play 718
720
+ ▁ple 719
721
+ ple 720
722
+ ▁pleas 721
723
+ ▁po 722
724
+ ▁point 723
725
+ ▁poor 724
726
+ ▁poss 725
727
+ ▁power 726
728
+ pp 727
729
+ pped 728
730
+ ▁pr 729
731
+ ▁pre 730
732
+ ▁pres 731
733
+ ▁present 732
734
+ ▁prin 733
735
+ ▁pro 734
736
+ ps 735
737
+ pt 736
738
+ ▁pur 737
739
+ ▁put 738
740
+ q 739
741
+ ▁qu 740
742
+ qu 741
743
+ ▁quest 742
744
+ ▁quite 743
745
+ ▁r 744
746
+ r 745
747
+ ra 746
748
+ ▁rather 747
749
+ ▁re 748
750
+ re 749
751
+ ▁read 750
752
+ reat 751
753
+ ▁rec 752
754
+ ▁red 753
755
+ red 754
756
+ ree 755
757
+ ▁ref 756
758
+ ▁reg 757
759
+ ▁rel 758
760
+ ▁rem 759
761
+ ren 760
762
+ rent 761
763
+ ▁rep 762
764
+ ▁repl 763
765
+ ▁replied 764
766
+ ▁res 765
767
+ res 766
768
+ ress 767
769
+ ressed 768
770
+ ▁rest 769
771
+ rest 770
772
+ ▁ret 771
773
+ ret 772
774
+ ▁return 773
775
+ ri 774
776
+ ried 775
777
+ ▁right 776
778
+ ▁ro 777
779
+ ro 778
780
+ ▁room 779
781
+ ross 780
782
+ ▁round 781
783
+ row 782
784
+ ru 783
785
+ ry 784
786
+ ▁s 785
787
+ s 786
788
+ ▁sa 787
789
+ ▁said 788
790
+ ▁same 789
791
+ ▁sat 790
792
+ ▁saw 791
793
+ ▁say 792
794
+ ▁sc 793
795
+ ▁se 794
796
+ se 795
797
+ ▁sec 796
798
+ ▁see 797
799
+ ▁seem 798
800
+ ▁seemed 799
801
+ ▁seen 800
802
+ sel 801
803
+ self 802
804
+ selves 803
805
+ ▁sent 804
806
+ ▁ser 805
807
+ ▁serv 806
808
+ ▁set 807
809
+ ▁sh 808
810
+ ▁shall 809
811
+ ▁she 810
812
+ ▁short 811
813
+ ▁should 812
814
+ ▁side 813
815
+ ▁sil 814
816
+ ▁sim 815
817
+ ▁sin 816
818
+ ▁since 817
819
+ ▁sir 818
820
+ ▁six 819
821
+ ▁sk 820
822
+ ▁sl 821
823
+ ▁sle 822
824
+ ▁sm 823
825
+ ▁small 824
826
+ ▁sn 825
827
+ ▁so 826
828
+ so 827
829
+ ▁some 828
830
+ ▁somet 829
831
+ ▁something 830
832
+ ▁soon 831
833
+ ▁sou 832
834
+ ▁sp 833
835
+ ▁spe 834
836
+ ss 835
837
+ ▁st 836
838
+ st 837
839
+ ▁stand 838
840
+ ▁start 839
841
+ ▁ste 840
842
+ ▁still 841
843
+ ▁stood 842
844
+ ▁str 843
845
+ ▁stre 844
846
+ ▁su 845
847
+ ▁sub 846
848
+ ▁such 847
849
+ ▁sudden 848
850
+ ▁sun 849
851
+ ▁supp 850
852
+ ▁sur 851
853
+ ▁sure 852
854
+ ▁sw 853
855
+ sw 854
856
+ ▁sy 855
857
+ ▁t 856
858
+ t 857
859
+ tain 858
860
+ ▁take 859
861
+ ▁te 860
862
+ te 861
863
+ ted 862
864
+ ▁tell 863
865
+ ten 864
866
+ ▁ter 865
867
+ ter 866
868
+ ters 867
869
+ ▁th 868
870
+ th 869
871
+ ▁than 870
872
+ ▁that 871
873
+ ▁the 872
874
+ ▁their 873
875
+ ▁them 874
876
+ ▁then 875
877
+ ther 876
878
+ ▁there 877
879
+ ▁these 878
880
+ ▁they 879
881
+ ▁thing 880
882
+ thing 881
883
+ ▁things 882
884
+ ▁think 883
885
+ ▁thir 884
886
+ ▁this 885
887
+ ▁those 886
888
+ ▁though 887
889
+ ▁thought 888
890
+ ▁thr 889
891
+ ▁three 890
892
+ ▁through 891
893
+ ▁tim 892
894
+ ▁time 893
895
+ ting 894
896
+ ▁to 895
897
+ ▁together 896
898
+ ▁told 897
899
+ ton 898
900
+ ▁too 899
901
+ ▁took 900
902
+ ▁toward 901
903
+ ▁tr 902
904
+ ▁tra 903
905
+ ▁tre 904
906
+ ▁tri 905
907
+ ▁turn 906
908
+ ▁turned 907
909
+ ▁tw 908
910
+ ▁twenty 909
911
+ ▁two 910
912
+ ty 911
913
+ ▁u 912
914
+ u 913
915
+ ual 914
916
+ ub 915
917
+ uck 916
918
+ ud 917
919
+ ue 918
920
+ ued 919
921
+ ul 920
922
+ ular 921
923
+ ull 922
924
+ ully 923
925
+ ult 924
926
+ um 925
927
+ ▁un 926
928
+ un 927
929
+ ▁unc 928
930
+ ▁under 929
931
+ ▁underst 930
932
+ ung 931
933
+ ▁unt 932
934
+ ▁until 933
935
+ ▁up 934
936
+ up 935
937
+ ▁upon 936
938
+ ur 937
939
+ ure 938
940
+ ured 939
941
+ ures 940
942
+ uring 941
943
+ urn 942
944
+ ▁us 943
945
+ us 944
946
+ ▁use 945
947
+ used 946
948
+ ust 947
949
+ ut 948
950
+ ute 949
951
+ uth 950
952
+ ▁v 951
953
+ v 952
954
+ ve 953
955
+ ved 954
956
+ vel 955
957
+ ven 956
958
+ vent 957
959
+ ver 958
960
+ ▁very 959
961
+ very 960
962
+ ves 961
963
+ ving 962
964
+ ▁vis 963
965
+ ▁vo 964
966
+ ▁voice 965
967
+ ▁w 966
968
+ w 967
969
+ ▁wa 968
970
+ ▁want 969
971
+ ▁war 970
972
+ ward 971
973
+ ▁was 972
974
+ ▁water 973
975
+ ▁way 974
976
+ way 975
977
+ ways 976
978
+ ▁we 977
979
+ ▁well 978
980
+ ▁went 979
981
+ ▁were 980
982
+ ▁wh 981
983
+ ▁what 982
984
+ ▁whe 983
985
+ ▁when 984
986
+ ▁where 985
987
+ ▁which 986
988
+ ▁while 987
989
+ ▁white 988
990
+ ▁who 989
991
+ ▁whole 990
992
+ ▁whom 991
993
+ ▁why 992
994
+ ▁will 993
995
+ ▁wind 994
996
+ ▁with 995
997
+ ▁without 996
998
+ wn 997
999
+ ▁wom 998
1000
+ ▁woman 999
1001
+ ▁wond 1000
1002
+ ▁wood 1001
1003
+ ▁wor 1002
1004
+ ▁word 1003
1005
+ ▁words 1004
1006
+ ▁work 1005
1007
+ ▁world 1006
1008
+ ▁would 1007
1009
+ ▁wr 1008
1010
+ x 1009
1011
+ xt 1010
1012
+ ▁y 1011
1013
+ y 1012
1014
+ ▁ye 1013
1015
+ ▁years 1014
1016
+ ▁yes 1015
1017
+ ▁yet 1016
1018
+ ying 1017
1019
+ ▁you 1018
1020
+ ▁young 1019
1021
+ ▁your 1020
1022
+ ys 1021
1023
+ z 1022
1024
+ zz 1023