python常用机器学习库相关内容讲解
树图思维导图提供 python常用机器学习库 在线思维导图免费制作,点击“编辑”按钮,可对 python常用机器学习库 进行在线思维导图编辑,本思维导图属于思维导图模板主题,文件编号是:aaa500292b4ae9c9cec855b85afd067f
python常用机器学习库思维导图模板大纲
ndarray 对象
NumPy的强大功能主要基于底层的一个ndarray结构,其可以生成N维数组对象。
ndarray 对象是一系列同类型数据的集合,下标索引从0开始,是一个用于存放同类型元素的多维数组。ndarray中的每个元素在内存中都具有相同大小的存储区域。
与Python 中的其他容器对象一样,ndarray可以通过对数组建立索引或切片来访问数组内容,也可以使用 ndarray的方法和属性来访问和修改 ndarray的内容。
NumPy数据类型
在NumPy中,数组的数据类型(dtype)是指数组中元素的数据类型。NumPy提供了多种数据类型,有符号整数类型,无符号整数类型,浮点数类型,复数类型。
在创建NumPy数组时,可以通过指定dtype参数来指定数组的数据类型
NumPy数组属性
在 NumPy 中,数组(ndarray)有许多属性可以用来获取有关数组的信息。
shape:数组的维度。例如,一个 3x4 的数组的 shape 将是 (3, 4)。 size:数组中元素的总数。 dtype:数组中元素的数据类型。 itemsize:数组中每个元素的字节大小。
其他创建数组的方式
numpy.empty()
numpy.ones()
numpy.zeros()
使用随机函数创建数组
产生数列的函数
range()
arange()
linspace()
切片,迭代,索引
通过切片操作,你可以获取数组的子集。语法为 array[start:stop:step]
迭代:可以使用循环来迭代数组中的元素。
索引:通过索引访问数组中的单个元素或一组元素。
numpy计算
条件运算
统计运算
Series数据结构
创建series对象(pd.series)
访问Series数据对象
Dataframe对象
这是一个表格型的数据结构,包含一组有序数列。列索引对应表格的行号,值是一个二维数组。每列表示一个独立的属性,各个列的数据类型可以不同
数据对齐
数据对齐(alignment)通常指的是在打印或显示数据时,使数据在某个位置对齐,以便更容易阅读和理解。数据对齐在表格、报告、日志等输出中非常常见。 可以使用字符串的格式化来实现数据对齐。其中,str.format() 方法和 f-string 是两种常用的方式。
图表一般包括画布,图标标题,绘图区,x轴和y轴以及图例
Matplotlib中比较常用的是pyplot子模块,其内部包含绘制图形所需要的功能函数
OpenCV是一个开源计算机视觉和图像处理库,提供丰富的图像处理工具和算法。它能够处理图像、视频流以及计算机视觉任务,并且具有广泛的应用领域,包括人脸识别、目标检测、图像分割等。python通过OpenCV接口提供了方便易用的功能,使得处理图像和视频变得简单而高效。
SKlearn 简介
是一个专门在python中提供实现机器学习功能的模块,也是一个简单高效的数据分析算法工具。
SKlearn的一般步骤
获取数据,创建数据集,数据预处理,数据集拆分,定义模型,模型评估与选择
WordCloud制作词云
是一种可视化工具,用于展示文本数据中词语的频率。它以词语为基本单位,根据词语在文本中出现的频率和重要性,将其以不同大小、颜色和位置呈现在图像中,从而形成一个独特的词语云图
jieba中文分词
是一款流行的中文文本分词库,它提供了有效的中文分词功能,支持多种分词模式和应用场景。
PIL
PIL是 Python 中用于图像处理的功能库。它提供了广泛的图像文件格式支持以及强大的图像处理和操作功能,包括图像打开、保存、转换、剪裁、调整大小、滤镜应用等。
树图思维导图提供 一、研究内容 在线思维导图免费制作,点击“编辑”按钮,可对 一、研究内容 进行在线思维导图编辑,本思维导图属于思维导图模板主题,文件编号是:4f21797dd3e8b08f1951dfc24e7be94f
树图思维导图提供 如何从大历史观学习中国历史 在线思维导图免费制作,点击“编辑”按钮,可对 如何从大历史观学习中国历史 进行在线思维导图编辑,本思维导图属于思维导图模板主题,文件编号是:5a22832470b2860422e8670dd763724d