Python教程栏目介绍概述数据。
推荐(免费):Python教程
/products/inpidual下载安装包,选择下载Python3.8的安装包个人版即可,但是官网下载速度较慢,因此我已经将Python3.8对应的Anaconda安装包下载整理好了,可以直接点击加QQ群 在群文件夹Python相关安装包中下载即可。
下载完成后直接安装,需要注意,在点击过程中会出现添加环境变量的提示,需要勾选,如下:
最后依次点击下一步、安装完成后,点击Win键(Windows系统下)可以看到最近添加或应用列表A下如图:
可以看到环境为Python 3.8.3,Anaconda创建的基础环境名为base,也是默认环境,也可以看到默认安装的库。
可以在命令行中执行conda list
查看已经安装的库,如下:
3.conda工具的介绍和包管理
conda是Anaconda下用于包管理和环境管理的工具,功能上类似pip和virtualenv的组合,conda的环境管理与virtualenv是基本上是类似的操作。
安装成功后conda会默认加入到环境变量中,因此可直接在命令行窗口运行conda命令。
常见的conda命令和含义如下:
conda的包管理常见命令如下:
在conda中,anything is a package一切皆是包
,conda本身可以看作是一个包,python环境可以看作是一个包,anaconda也可以看作是一个包,因此除了普通的第三方包支持更新之外,这3个包也支持如下命令:
在命令行中执行jupyter notebook
,就会在当前目录下启动Jupyter服务并使用默认浏览器打开页面,还可以复制链接到其他浏览器中打开,如下:
可以看到,notebook界面由以下部分组成:
(2)主工具栏,提供了保存、导出、重载notebook,以及重启内核等选项;
在Jupyter页面下方的主要区域,由被称为单元格的部分组成。每个notebook由多个单元格构成,而每个单元格又可以有不同的用途。
上图中看到的是一个代码单元格(code cell),以[ ]
开头,在这种类型的单元格中,可以输入任意代码并执行。
例如,输入1 + 2
并按下Shift + Enter
,单元格中的代码就会被计算,光标也会被移动到一个新的单元格中。
如果想新建一个notebook,只需要点击New,选择希望启动的notebook类型即可。
可以看到,notebook可以修改之前的单元格,对其重新计算,这样就可以更新整个文档了。如果你不想重新运行整个脚本,只想用不同的参数测试某个程式的话,这个特性显得尤其强大。
再测试标题和其他代码如下:
可以看到,在顶部添加了一个notebook的标题,还可以执行for循环等语句。
测试Python函数如下:
测试Python模块如下:
可以看到,在执行出错时,也会抛出异常。
数据读写很重要,因为进行数据分析时必须先读取数据,进行数据处理后也要进行保存。
加载csv数据,处理数据,保存到MongoDB数据库
如需获取数据、代码等相关文件进行测试学习,可以直接点击加QQ群 在群文件夹Python数据分析实战中下载即可。
在启动MongoDB服务后,运行Python代码,运行完成后,再通过Robo 3T查看数据库如下:
使用Jupyter处理商铺数据
待处理的数据是商铺数据,如下:
包括名称、评论数、价格、地址、评分列表等,其中评论数、价格和评分均不规则、需要进行数据清洗。
如需获取数据、代码等相关文件进行测试学习,可以直接点击加QQ群 在群文件夹Python数据分析实战中下载即可。
可以看到,最后得到了经过清洗后的规则数据。
完整Python代码如下:
'''comment清洗函数:用空格分段,选取结果list的第一个为点评数,并且转化为整型''' '''price清洗函数:用¥分段,选取结果list的最后一个为人均价格,并且转化为浮点型''' '''commentlist清洗函数:用空格分段,分别清洗出质量、环境及服务数据,并转化为浮点型'''更多编程相关知识,请访问:编程教学!!