Gensim 3.1.0 发布,主题模型 Python 工具包

Gensim 是用于主题模型、文档索引和海量文本的相似检索的 Python 库,目标受众是自然语言处理(NLP)和信息检索(IR)社区。

Gensim 3.1.0 已发布,主要更新如下:

  • 大幅度优化 LSI 模型训练

  • 将常用术语添加至 Phrases

  • 新增 segment_wiki.py 脚本

  • FastText 测试提速

  • 优化 SlicedCorpus.__len__

  • word_vec 将返回不可变量

  • 不再支持 win x32,新增滚动构建

点此可查阅完整更新内容

下载地址:

Read original article – 

Gensim 3.1.0 发布,主题模型 Python 工具包