利用python做数据分析,要掌握几个包,先做一名调包侠。
-
numpy:NumPy是用Python进行科学计算的基础软件包.
-
re:python正则表达式匹配包.
-
jieba:“结巴”中文分词:做最好的 Python 中文分词组件 .
-
nltk:python环境下NLP工具包,包含了丰富的文本处理和文本挖掘API.
-
sklearn:
Scikit learn 也简称 sklearn, 是机器学习领域当中最知名的 python 模块之一.Sklearn 包含了很多种机器学习的方式: Classification 分类 Regression 回归 Clustering 非监督分类 Dimensionality reduction 数据降维 Model Selection 模型选择 Preprocessing 数据预处理 -
wordcloud:wordcloud是优秀的词云展示第三方库,以词语为基本单位,通过图形可视化的方式,更加直观和艺术的展示文本
-
scipy:scipy包含致力于科学计算中常见问题的各个工具箱。它的不同子模块相应于不同的应用。像插值,积分,优化,图像处理,统计,特殊函数等等
-
gensim:一款开源的第三方Python工具包,用于从原始的非结构化的文本中,无监督地学习到文本隐层的主题向量表达。它支持包括TF-IDF,LSA,LDA,和word2vec在内的多种主题模型算法,支持流式训练,并提供了诸如相似度计算,信息检索等一些常用任务的API接口.
-
matplotlib:Matplotlib 可能是 Python 2D-绘图领域使用最广泛的套件
-
networkx:networkx是一个python包,用于创建、操作和研究复杂网络的结构、动态和功能.
我想做数据分析师

- 四懂:懂业务、懂管理、懂分析、懂技术。
- 为什么:90%市场决策依赖于数据分析。
在学习数据分析的道路上,python只是工具。
最后
以上就是俊逸黑裤最近收集整理的关于数据分析笔记1利用python做数据分析,要掌握几个包,先做一名调包侠。我想做数据分析师的全部内容,更多相关数据分析笔记1利用python做数据分析内容请搜索靠谱客的其他文章。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复