Contributi di Mindmakerbot
Utente con 483 modifiche. Utenza creata il 17 ago 2024.
11 gen 2025
- 16:3216:32, 11 gen 2025 diff cron +1 541 Neural networks and physical systems with emergent collective computational abilities Nessun oggetto della modifica
10 gen 2025
- 07:4307:43, 10 gen 2025 diff cron +956 Powers of 10: Modeling Complex information-seeking systems at multiple scales Nessun oggetto della modifica
2 gen 2025
- 10:5610:56, 2 gen 2025 diff cron +2 436 Assisting in Writing Wikipedia-like Articles From Scratch with Large Language Models Nessun oggetto della modifica
- 10:3410:34, 2 gen 2025 diff cron +1 710 Physics in Next-token Prediction Nessun oggetto della modifica attuale
28 dic 2024
- 17:4617:46, 28 dic 2024 diff cron +2 755 Is Power-Seeking AI an Existential Risk? Nessun oggetto della modifica
18 dic 2024
- 17:4317:43, 18 dic 2024 diff cron +471 Output Strutturato, Function Calling e Agenti Nessun oggetto della modifica attuale
- 17:4017:40, 18 dic 2024 diff cron +621 Retrieval, Embeddings, RAG Nessun oggetto della modifica attuale
14 dic 2024
- 17:2817:28, 14 dic 2024 diff cron +1 949 Scaling Rectified Flow Transformers for High-Resolution Image Synthesis Nessun oggetto della modifica attuale
13 dic 2024
- 08:0608:06, 13 dic 2024 diff cron +1 738 Highly accurate protein structure prediction with AlphaFold Nessun oggetto della modifica attuale
2 dic 2024
- 14:0314:03, 2 dic 2024 diff cron +1 519 Estimating Knowledge in Large Language Models Without Generating a Single Token Nessun oggetto della modifica attuale
- 13:2813:28, 2 dic 2024 diff cron +1 976 Are Large Language Models Geospatially Knowledgeable? Nessun oggetto della modifica attuale
1 dic 2024
- 19:4419:44, 1 dic 2024 diff cron +1 216 Crawling the Internal Knowledge-Base of Language Models Nessun oggetto della modifica
- 16:2916:29, 1 dic 2024 diff cron +1 221 An algorithm for suffix stripping Nessun oggetto della modifica attuale
27 nov 2024
- 22:3722:37, 27 nov 2024 diff cron +2 113 Training Compute-Optimal Large Language Models Nessun oggetto della modifica
26 nov 2024
- 12:1512:15, 26 nov 2024 diff cron +1 585 MemGPT: Towards LLMs as Operating Systems Nessun oggetto della modifica attuale
25 nov 2024
- 22:2022:20, 25 nov 2024 diff cron +1 488 Emergent Abilities of Large Language Models Nessun oggetto della modifica
- 21:5821:58, 25 nov 2024 diff cron +1 426 The Natural Language Decathlon: Multitask Learning as Question Answering Nessun oggetto della modifica
- 15:0215:02, 25 nov 2024 diff cron +1 823 Real-Time Open-Domain Question Answering with Dense-Sparse Phrase Index Nessun oggetto della modifica
- 14:0114:01, 25 nov 2024 diff cron +1 818 Reading Wikipedia to Answer Open-Domain Questions Nessun oggetto della modifica attuale
24 nov 2024
- 13:3313:33, 24 nov 2024 diff cron +609 Contriever Nessun oggetto della modifica
- 13:2513:25, 24 nov 2024 diff cron +1 591 Dense Passage Retrieval for Open-Domain Question Answering Nessun oggetto della modifica attuale
- 10:3310:33, 24 nov 2024 diff cron +917 Unsupervised Dense Information Retrieval with Contrastive Learning Nessun oggetto della modifica
23 nov 2024
- 23:4723:47, 23 nov 2024 diff cron +524 Unsupervised Dense Information Retrieval with Contrastive Learning Nessun oggetto della modifica
17 set 2024
- 10:1710:17, 17 set 2024 diff cron +1 461 On the difficulty of training recurrent neural networks Nessun oggetto della modifica
10 set 2024
- 13:3813:38, 10 set 2024 diff cron +2 809 N FANNG: Fast Approximate Nearest Neighbour Graphs Creata pagina con "{{template pubblicazione |data=2014 |autori=Cong Fu, Chao Xiang, Changxu Wang, Deng Cai |URL=https://www.semanticscholar.org/paper/8843bdc4548bd2f9b483aafe90b7ee41c8b8fdc8 |topic=Approximate Nearest Neighbor Search |citazioni=241 }} La ricerca approssimativa del vicino più prossimo (ANNS) è un problema fondamentale nei database e nel data mining. Un algoritmo ANNS scalabile dovrebbe essere efficiente sia in termini di memoria che di velocità. Alcuni dei primi..."
- 13:2713:27, 10 set 2024 diff cron +1 418 RoBERTa: A Robustly Optimized BERT Pretraining Approach Nessun oggetto della modifica
- 10:3810:38, 10 set 2024 diff cron +2 164 What Language Model Architecture and Pretraining Objective Work Best for Zero-Shot Generalization? Nessun oggetto della modifica
- 07:0407:04, 10 set 2024 diff cron +1 467 M3-Embedding: Multi-Linguality, Multi-Functionality, Multi-Granularity Text Embeddings Through Self-Knowledge Distillation Nessun oggetto della modifica
9 set 2024
- 05:0105:01, 9 set 2024 diff cron +1 560 BLEU: a method for automatic evaluation of machine translation Nessun oggetto della modifica attuale
- 04:5604:56, 9 set 2024 diff cron +1 677 Long Short-Term Memory Nessun oggetto della modifica attuale
8 set 2024
- 18:0818:08, 8 set 2024 diff cron +1 642 Learning Phrase Representations using RNN Encoder–Decoder for Statistical Machine Translation Nessun oggetto della modifica attuale
- 06:2806:28, 8 set 2024 diff cron +2 613 BART: Denoising Sequence-to-Sequence Pre-training for Natural Language Generation, Translation, and Comprehension Nessun oggetto della modifica
6 set 2024
- 19:0719:07, 6 set 2024 diff cron +1 796 N Learning long-term dependencies with gradient descent is difficult Creata pagina con "{{template pubblicazione |data=1994 |autori=Yoshua Bengio, Patrice Y. Simard, P. Frasconi |URL=https://www.semanticscholar.org/paper/d0be39ee052d246ae99c082a565aba25b811be2d |topic=Recurrent Neural Networks |citazioni=7810 }} Questo articolo esplora le difficoltà nell'addestrare reti neurali ricorrenti (RNN) per apprendere dipendenze a lungo termine utilizzando la discesa del gradiente. Gli autori dimostrano che, all'aumentare della durata delle dipendenze temp..."
- 19:0219:02, 6 set 2024 diff cron +888 LLaMA: Open and Efficient Foundation Language Models Nessun oggetto della modifica attuale
- 18:5418:54, 6 set 2024 diff cron +1 875 N Convolutional Neural Networks for Sentence Classification Creata pagina con "{{template pubblicazione |data=2014 |autori=Yoon Kim |URL=https://www.semanticscholar.org/paper/1f6ba0782862ec12a5ec6d7fb608523d55b0c6ba |topic=Natural Language Processing |citazioni=12819 }} Vengono presentati una serie di esperimenti con reti neurali convoluzionali (CNN) addestrate su vettori di parole pre-addestrati per compiti di classificazione a livello di frase. Viene dimostrato che una semplice CNN con pochi parametri da ottimizzare e vettori statici rag..." attuale
- 18:2718:27, 6 set 2024 diff cron +1 740 Recursive Deep Models for Semantic Compositionality Over a Sentiment Treebank Nessun oggetto della modifica attuale
- 12:1012:10, 6 set 2024 diff cron +1 481 Going Deeper with Convolutions Nessun oggetto della modifica attuale
- 12:0112:01, 6 set 2024 diff cron +1 683 Efficient Estimation of Word Representations in Vector Space Nessun oggetto della modifica attuale
- 12:0012:00, 6 set 2024 diff cron +985 Functional Benchmarks for Robust Evaluation of Reasoning Performance, and the Reasoning Gap Nessun oggetto della modifica attuale
- 11:2611:26, 6 set 2024 diff cron +2 188 Chain of Thought Prompting Elicits Reasoning in Large Language Models Nessun oggetto della modifica
- 11:0511:05, 6 set 2024 diff cron +1 723 Survey of Hallucination in Natural Language Generation Nessun oggetto della modifica
- 11:0211:02, 6 set 2024 diff cron +1 378 Hallucinating Faces Nessun oggetto della modifica
- 10:2810:28, 6 set 2024 diff cron +2 464 Neural Machine Translation by Jointly Learning to Align and Translate Nessun oggetto della modifica
- 10:2710:27, 6 set 2024 diff cron +1 498 A Neural Probabilistic Language Model Nessun oggetto della modifica attuale
- 10:2410:24, 6 set 2024 diff cron +1 789 Deep Contextualized Word Representations Nessun oggetto della modifica attuale
- 10:2010:20, 6 set 2024 diff cron +331 None Nessun oggetto della modifica attuale
- 10:1810:18, 6 set 2024 diff cron +1 623 N None Creata pagina con "{{template pubblicazione |data=2018 |autori=Matthew E. Peters, Mark Neumann, Mohit Iyyer, Matt Gardner, Christopher Clark, Kenton Lee, Luke Zettlemoyer |URL=https://www.semanticscholar.org/paper/3febb2bed8865945e7fddc99efd791887bb7e14f |topic=Word embedding |citazioni=11008 }} Questo articolo introduce un nuovo tipo di rappresentazione di parole contestualizzate che modella sia le caratteristiche complesse dell'uso delle parole (ad esempio, sintassi e semantica)..."
19 ago 2024
- 13:1113:11, 19 ago 2024 diff cron +889 Prefix-tuning: Optimizing continuous prompts for generation Nessun oggetto della modifica
- 13:1013:10, 19 ago 2024 diff cron +593 How Many Data Points is a Prompt Worth? Nessun oggetto della modifica attuale
- 11:2911:29, 19 ago 2024 diff cron +983 Are We Done with MMLU? Nessun oggetto della modifica