Cosa sono gli n-grammi in R?
ngram è un pacchetto R per la costruzione di n-grammi ("tokenizzazione"), nonché per la generazione di nuovo testo basato sulla struttura di n-grammi di un dato input di testo ("balbettio"). Il pacchetto può essere utilizzato per analisi serie o per creare "bot" che dicono cose divertenti. Vedere la sezione dei dettagli di seguito per ulteriori informazioni.
Cos'è un sacco di parole da n-grammi??
La borsa di n-grammi è un'estensione naturale della borsa di parole. Un n-grammo è semplicemente una qualsiasi sequenza di n token (parole). Di conseguenza, dato il seguente testo di recensione - "Assolutamente meraviglioso - setoso e sexy e confortevole", potremmo suddividerlo in: 1-grammo: Assolutamente, meraviglioso, setoso e, sexy e, confortevole.
Qual è l'esempio di n-gram??
Un N-grammo significa una sequenza di N parole. Quindi, ad esempio, "blog medio" è un 2 grammi (un bigramma), "un post sul blog medio" è un 4 grammi e "Scrivi su un supporto" è un 3 grammi (trigramma). Beh, non è stato molto interessante o eccitante.