Neste artigo vou utilizar gensim para criar uma modelo capaz de identificar a similaridade entre textos. A ideia é que você consiga identificar o(s) texto(s) mais similares(s) a um determinado texto de entrada.
Você pode usar este modelo em inúmeras aplicações, por exemplo, pesquisa de produtos ou serviços por meio de suas descrições ou até mesmo em aplicações mais complexas de análise de sentimentos.
Neste post resolvi criar um notebook com o passo a passo + explicações, segue o link:
https://anaconda.org/weslleymoura/tf_idf_similarity/notebook
Boa leitura 🙂
Weslley Moura