Document Deduplication with Locality Sensitive Hashing
Tecnica per la de-duplicazione di Documenti utilizzata anche come step di preprocessing nei Modelli Foundational di Apple .
Links
https://machinelearning.apple.com/research/apple-intelligence-foundation-language-models
https://mattilyra.github.io/2017/05/23/document-deduplication-with-lsh.html