<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="it">
	<id>https://wiki.mindmaker.it/index.php?action=history&amp;feed=atom&amp;title=Speculative_Decoding</id>
	<title>Speculative Decoding - Cronologia</title>
	<link rel="self" type="application/atom+xml" href="https://wiki.mindmaker.it/index.php?action=history&amp;feed=atom&amp;title=Speculative_Decoding"/>
	<link rel="alternate" type="text/html" href="https://wiki.mindmaker.it/index.php?title=Speculative_Decoding&amp;action=history"/>
	<updated>2026-05-14T09:43:02Z</updated>
	<subtitle>Cronologia della pagina su questo sito</subtitle>
	<generator>MediaWiki 1.41.0</generator>
	<entry>
		<id>https://wiki.mindmaker.it/index.php?title=Speculative_Decoding&amp;diff=3127&amp;oldid=prev</id>
		<title>Alesaccoia: Creata pagina con &quot;Tecnica per ottimizzare il tempo di inferenza dei modelli Transformer.  E&#039; stata proposta nella pubblicazione Fast Inference from Transformers via Speculative Decoding.  Ha in comune concetti con la Distillazione Della Conoscenza.  === Collegamenti === https://huggingface.co/blog/whisper-speculative-decoding Categoria:Tecnica&quot;</title>
		<link rel="alternate" type="text/html" href="https://wiki.mindmaker.it/index.php?title=Speculative_Decoding&amp;diff=3127&amp;oldid=prev"/>
		<updated>2024-10-03T06:01:24Z</updated>

		<summary type="html">&lt;p&gt;Creata pagina con &amp;quot;Tecnica per ottimizzare il tempo di inferenza dei modelli &lt;a href=&quot;/index.php/Transformer&quot; class=&quot;mw-redirect&quot; title=&quot;Transformer&quot;&gt;Transformer&lt;/a&gt;.  E&amp;#039; stata proposta nella pubblicazione &lt;a href=&quot;/index.php/Fast_Inference_from_Transformers_via_Speculative_Decoding&quot; title=&quot;Fast Inference from Transformers via Speculative Decoding&quot;&gt;Fast Inference from Transformers via Speculative Decoding&lt;/a&gt;.  Ha in comune concetti con la &lt;a href=&quot;/index.php/Distillazione_Della_Conoscenza&quot; title=&quot;Distillazione Della Conoscenza&quot;&gt;Distillazione Della Conoscenza&lt;/a&gt;.  === Collegamenti === https://huggingface.co/blog/whisper-speculative-decoding &lt;a href=&quot;/index.php/Categoria:Tecnica&quot; title=&quot;Categoria:Tecnica&quot;&gt;Categoria:Tecnica&lt;/a&gt;&amp;quot;&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Nuova pagina&lt;/b&gt;&lt;/p&gt;&lt;div&gt;Tecnica per ottimizzare il tempo di inferenza dei modelli [[Transformer]].&lt;br /&gt;
&lt;br /&gt;
E&amp;#039; stata proposta nella pubblicazione [[Fast Inference from Transformers via Speculative Decoding]].&lt;br /&gt;
&lt;br /&gt;
Ha in comune concetti con la [[Distillazione Della Conoscenza]].&lt;br /&gt;
&lt;br /&gt;
=== Collegamenti ===&lt;br /&gt;
https://huggingface.co/blog/whisper-speculative-decoding&lt;br /&gt;
[[Categoria:Tecnica]]&lt;/div&gt;</summary>
		<author><name>Alesaccoia</name></author>
	</entry>
</feed>