继续讲一点python读取数据相关的操作为数据分析作准备。
一般在做数据分析时最常接触的就是逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样被解读的数据。CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的是逗号或制表符。通常,所有记录都有完全相同的字段序列。
而大多数情况下读csv文件用pandas就可以搞定。
有任何疑问欢迎发私信给我或者搜索公众号:早起python,一起学习
BMP即bitmap,也就是位图,一般由4部分组成:文件头信息块、图像描述信息块、颜色表(在真彩色模式无颜色表)和图像数据区。
在图像数据之前,如图所示,共有54位数据
在C语言中,short
类型为16位,即2字节;int
为4字节。考虑到BMP格式的文件头中,每个信息基本都是2字节的倍数,故而用int
和short
便可描述出bmp
格式的文件头。
文件信息头[14 bytes]存储着文件类型,文件大小等信息
接下来的40bytes存储图像的尺寸,颜色索引,位平面数等信息
在54位的文件头之后,如果需要的话,bmp文件可存放调色板信息,对于rgb
图像来说,可以如下
位图信息头和颜色表组成位图信息,BITMAPINFO结构定义如下:
颜色表接下来为图像数据区,存储每个像素对应的颜色号,单像素点颜色号的位长度与图像类型有关
但是,由于BMP以字节为单位,按行存储图片的数据,也就是说每一行必须为字节数。而对于16色以及2色图像而言,当每行像素个数为奇数时,则必然导致出现空位,从而实际所占存储空间要大于上述计算值。
读取文件之后第一件事即判断我们读取的是否为BMP图像,即
其中,fread
命令表示读取文件fp
,并将读取到的内容存储在s
中。1
表示要读取的数据的大小,2
表示将要读取的元素的个数。由前文可知,位图的文件类型必须是BM
,十六进制下0x4d42,十进制为19778。
然后需要得到图像的宽度和高度,从而确定数据区的范围
其中,fseek
可以为fp
提供一个偏移量,SEEK_SET
表示从文件的开头进行移动。由上文可知,图片高度所在位置是第22个字节。
若想读取其他信息,以此类推即可。
身份认证 购VIP最低享 7 折!
C语言文件读写。针对dat文件的读写。 注意文件路径。
一直想把一个DAT文件类型的字符库整合进代码,这个例程正好可以用上,赞!
和我的dat数据格式不一致,不过学习了
觉得还好 给了方向 知道怎么弄了