首页 文章详情

共词矩阵 | cntext更新至1.1 版本

大邓和他的Python | 402 2021-12-28 22:03 0 0 0
UniSMS (合一短信)

cntext更新至1.1 版本

本次更新了共(现)词矩阵的计算函数。

更新方法

pip3 install cntext --upgrade

或指定版本安装

pip3 install cntext==1.1

co_occurrence_matrix

词共现矩阵

from cntext.dictionary import co_occurrence_matrix

documents = ["I go to school every day by bus .",
         "i go to theatre every night by bus"]

co_occurrence_matrix(documents, window_size=2, lang='english')

documents2 = ["编程很好玩",
             "Python是最好学的编程"]

co_occurrence_matrix(documents2, window_size=2, lang='chinese')


近期文章

视频专栏课 | Python网络爬虫与文本分析

如何在DataFrame中使用If-Else条件语句创建新列

BERTopic 主题建模库 | 建议收藏

Top2Vec | 主题建模和语义搜索库

PNAS | 历史语言记录揭示了近几十年来认知扭曲的激增

Python自动化利器RPA爬数据so easy

案例实战 | 企业信息数据采集

KeyBERT库 | 自动挖掘文本中的关键词

SmartScraper | 简单、自动、快捷的Python网络爬虫

SHAP | 机器学习模型解释库

ashares库 | A股市场历史行情数据

Backtrader库 | 均线买入卖出策略实现

读完本文你就了解什么是文本分析

文本分析在经管领域中的应用概述

综述:文本分析在市场营销研究中的应用

在会计研究中使用Python进行文本分析

文本分析方法在《管理世界》(2021.5)中的应用

Phonemizer | Python文本语音(音素)表征包

hiResearch 定义自己的科研首页

SciencePlots | 科研样式绘图库

Wow~70G上市公司定期报告数据集

漂亮~pandas可以无缝衔接Bokeh  

YelpDaset: 酒店管理类数据集10+G

good-icon 0
favorite-icon 0
收藏
回复数量: 0
    暂无评论~~
    Ctrl+Enter