VB.net 2010 视频教程 VB.net 2010 视频教程 python基础视频教程
SQL Server 2008 视频教程 c#入门经典教程 Visual Basic从门到精通视频教程
当前位置:
首页 > temp > python入门教程 >
  • Python爬虫基础讲解(八):数据持久化——文件操作

计算机的文件,就是存储在某种长期储存设备上的一段数据长期存储设备包括:硬盘、U盘、移动硬盘、光盘...

文本文件和二进制文件

文本文件:

  • 可以使用文本编辑软件查看o本质上还是二进制文件
  • 例如: python的源程序

二进制文件:

  • 保存的内容不是给人直接阅读的,而是提供给其他软件使用的。
  • 例如:图片文件、音频文件、视频文件等等
  • 二进制文件不能使用文本编辑软件查看

 

关注微信公众号,免费领取资料

1. 文件的基本操作

操作文件的函数/方法

在Python中要操作文件需要记住1个函数和3个方法

Python爬虫基础讲解:数据持久化——文件操作

 

  • open函数负责打开文件,并且返回文件对象
  • read / write/ close三个方法都需要通过文件对象来调用

1. 1读取文件

open

 

函数的第一个参数是要打开的文件名(文件名区分大小写)

  • 如果文件存在,返回文件操作对象
  • 如果文件不存在,会抛出异常
  • read方法可以一次性读入并返回文件的所有内容
  • close方法负责关闭文件
    如果忘记关闭文件,会造成系统资源消耗,而且会影响到后续对文件的访问
  • 注意:read方法执行后,会把文件指针移动到文件的末尾
复制代码
# 1.打开-文件名需要注意大小写
file = open("README")

#2.读取
text = file.read()
print(text)

#3.关闭
file.close()
复制代码

 

1.2 打开文件的方式

open函数默认以只读方式打开文件,并且返回文件对象
语法如下:

f = open("文件名""访问方式")

 

Python爬虫基础讲解:数据持久化——文件操作

 

提示

  • 频繁的移动文件指针,会影响文件的读写效率,开发中更多的时候会以只读、只写的方式来操作文件

写入文件示例

复制代码
#打开文件
f = open ("README""w")

f.write( "he17o python! \n")
f.write("今天天气真好")

#关闭文件
f.close()
复制代码

 

1.3按行读取文件内容

  • read()方法
    默认会把文件的所有内容一次性读取到内存。如果文件太大,对内存的占用会非常严重。
  • readline方法
    readline方法可以一次读取一行内容。方法执行后,会把文件指针移动到下一行,准备再次读取。这是读取大文件的正确姿势。

2. 目录操作

  • 在终端/文件浏览器、中可以执行常规的文件/目录管理操作,例如:
    创建、重命名、删除、改变路径、查看目录内容、…….
  • 在Python中,如果希望通过程序实现上述功能,需要导入os模块

2.1 文件操作

Python爬虫基础讲解:数据持久化——文件操作

 

2.2 目录操作

Python爬虫基础讲解:数据持久化——文件操作

 

提示:文件或者目录操作都支持相对路径和绝对路径

文章出处:

https://www.cnblogs.com/qshhl/p/14781279.html

相关教程