Interesting AI papers - a qwerty87 Collection

qwerty87 's Collections

Dialogue datasets

Text Generation Model list

Interesting AI papers

Interesting AI papers

updated Dec 18, 2023

Attention Is All You Need

Paper • 1706.03762 • Published Jun 12, 2017 • 115
BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

Paper • 1810.04805 • Published Oct 11, 2018 • 26
Universal Language Model Fine-tuning for Text Classification

Paper • 1801.06146 • Published Jan 18, 2018 • 8
Language Models are Few-Shot Learners

Paper • 2005.14165 • Published May 28, 2020 • 19
EELBERT: Tiny Models through Dynamic Embeddings

Paper • 2310.20144 • Published Oct 31, 2023 • 3
Scaling Laws for Neural Language Models

Paper • 2001.08361 • Published Jan 23, 2020 • 9
Training Compute-Optimal Large Language Models

Paper • 2203.15556 • Published Mar 29, 2022 • 11
BloombergGPT: A Large Language Model for Finance

Paper • 2303.17564 • Published Mar 30, 2023 • 30
MARRS: Multimodal Reference Resolution System

Paper • 2311.01650 • Published Nov 3, 2023 • 2
Scaling Instruction-Finetuned Language Models

Paper • 2210.11416 • Published Oct 20, 2022 • 7
GLUE: A Multi-Task Benchmark and Analysis Platform for Natural Language Understanding

Paper • 1804.07461 • Published Apr 20, 2018 • 4
SuperGLUE: A Stickier Benchmark for General-Purpose Language Understanding Systems

Paper • 1905.00537 • Published May 2, 2019 • 2
Measuring Massive Multitask Language Understanding

Paper • 2009.03300 • Published Sep 7, 2020 • 3
Scaling Down to Scale Up: A Guide to Parameter-Efficient Fine-Tuning

Paper • 2303.15647 • Published Mar 28, 2023 • 4
LoRA: Low-Rank Adaptation of Large Language Models

Paper • 2106.09685 • Published Jun 17, 2021 • 58
QLoRA: Efficient Finetuning of Quantized LLMs

Paper • 2305.14314 • Published May 23, 2023 • 59
The Power of Scale for Parameter-Efficient Prompt Tuning

Paper • 2104.08691 • Published Apr 18, 2021 • 10
Learning to summarize from human feedback

Paper • 2009.01325 • Published Sep 2, 2020 • 4
ReAct: Synergizing Reasoning and Acting in Language Models

Paper • 2210.03629 • Published Oct 6, 2022 • 33
Training language models to follow instructions with human feedback

Paper • 2203.02155 • Published Mar 4, 2022 • 24
Proximal Policy Optimization Algorithms

Paper • 1707.06347 • Published Jul 20, 2017 • 11
Direct Preference Optimization: Your Language Model is Secretly a Reward Model

Paper • 2305.18290 • Published May 29, 2023 • 64
Constitutional AI: Harmlessness from AI Feedback

Paper • 2212.08073 • Published Dec 15, 2022 • 4
Automatic Chain of Thought Prompting in Large Language Models

Paper • 2210.03493 • Published Oct 7, 2022 • 2
PAL: Program-aided Language Models

Paper • 2211.10435 • Published Nov 18, 2022 • 4