Pagine popolari
Vengono mostrati sotto 50 risultati dal 151 al 200.
- Finding Structure in Time (1 435 visualizzazioni)
- Andrej Karpathy (1 433 visualizzazioni)
- Why think step by step? Reasoning emerges from the locality of experience (2023) (1 416 visualizzazioni)
- Generating Sequences With Recurrent Neural Networks (2014) (1 406 visualizzazioni)
- Large Language Models as Zero-shot Dialogue State Tracker through Function Calling (16/02/2024) (1 380 visualizzazioni)
- General Language Understanding Evaluation (GLUE) (1 379 visualizzazioni)
- Learning Phrase Representations using RNN Encoder–Decoder for Statistical Machine Translation (1 360 visualizzazioni)
- A Large-Scale Document-Level Relation Extraction Dataset (1 355 visualizzazioni)
- Schema di Winograd (1 317 visualizzazioni)
- Extended Long Short-Term Memory (1 311 visualizzazioni)
- Alice in Wonderland: Simple Tasks Showing Complete Reasoning Breakdown in State-Of-the-Art Large Language Models (1 306 visualizzazioni)
- Detection Transformer (1 304 visualizzazioni)
- Sequence to Sequence Learning with Neural Networks (12/12/2014) (1 279 visualizzazioni)
- AlexNet (1 278 visualizzazioni)
- Allineamento dell'Intelligenza Artificiale (1 263 visualizzazioni)
- Ilya Sutskever (1 252 visualizzazioni)
- Libero Arbitrio (1 244 visualizzazioni)
- Andrew NG (1 235 visualizzazioni)
- Proximal Policy Optimization (1 223 visualizzazioni)
- RoBERTa: A Robustly Optimized BERT Pretraining Approach (1 215 visualizzazioni)
- Output Strutturato, Function Calling e Agenti (1 203 visualizzazioni)
- Ricerca ANN (1 198 visualizzazioni)
- ImageNet Large Scale Visual Recognition Challenge (1 191 visualizzazioni)
- Grokking (1 190 visualizzazioni)
- Alex Krizhevsky (1 176 visualizzazioni)
- Confabulazione (1 173 visualizzazioni)
- A Neural Algorithm of Artistic Style (2015) (1 160 visualizzazioni)
- M3-Embedding: Multi-Linguality, Multi-Functionality, Multi-Granularity Text Embeddings Through Self-Knowledge Distillation (1 133 visualizzazioni)
- Automatic Stylistic Composition of Bach Chorales With Deep LSTM (2017) (1 078 visualizzazioni)
- Generative Adversarial Nets (1 066 visualizzazioni)
- Tomáš Mikolov (1 054 visualizzazioni)
- SPLADE (1 054 visualizzazioni)
- BART: Denoising Sequence-to-Sequence Pre-training for Natural Language Generation, Translation, and Comprehension (1 053 visualizzazioni)
- Test-Time Compute Scaling (1 018 visualizzazioni)
- Training language models to follow instructions with human feedback (1 013 visualizzazioni)
- OpenAI o1 (1 009 visualizzazioni)
- Powers of 10: Modeling Complex information-seeking systems at multiple scales (1 008 visualizzazioni)
- Ian Goodfellow (1 007 visualizzazioni)
- Dall-e 3 (2023) (1 006 visualizzazioni)
- Prefix-tuning: Optimizing continuous prompts for generation (995 visualizzazioni)
- GoogLeNet (984 visualizzazioni)
- Training Compute-Optimal Large Language Models (955 visualizzazioni)
- Natural language inference (NLI) (954 visualizzazioni)
- Vision Transformer (ViT) (953 visualizzazioni)
- Geoffrey Hinton (950 visualizzazioni)
- Neural Information Retrieval (927 visualizzazioni)
- BART (918 visualizzazioni)
- Demis Hassabis (907 visualizzazioni)
- The Schema-Guided Dialogue Dataset (907 visualizzazioni)
- Are We Done with MMLU? (905 visualizzazioni)