千锋教育-做有情怀、有良心、有品质的职业教育机构

手机站

千锋教育

千锋学习站 | 随时随地免费学

千锋教育

扫一扫进入千锋手机站

领取全套视频

千锋教育

关注千锋学习站小程序
随时随地免费学习课程

行业头条

哈尔滨选择鸿蒙培训机构要注意些什么？选择千锋的理由？ 查看详情>>

哈密选择鸿蒙培训机构要注意些什么？选择千锋的理由？ 查看详情>>

呼和浩特选择鸿蒙培训机构要注意些什么？选择千锋的理由？ 查看详情>>

呼伦贝尔选择鸿蒙培训机构要注意些什么？选择千锋的理由？ 查看详情>>

吴忠选择鸿蒙培训机构要注意些什么？选择千锋的理由？ 查看详情>>

吕梁选择鸿蒙培训机构要注意些什么？选择千锋的理由？ 查看详情>>

吉安选择鸿蒙培训机构要注意些什么？选择千锋的理由？ 查看详情>>

合肥选择鸿蒙培训机构要注意些什么？选择千锋的理由？ 查看详情>>

台州选择鸿蒙培训机构要注意些什么？选择千锋的理由？ 查看详情>>

厦门选择鸿蒙培训机构要注意些什么？选择千锋的理由？ 查看详情>>

400-811-9990 全国咨询热线

首页精品课程

Java

鸿蒙开发

HTML5

物联网

云计算

Python

软件测试

网络安全

大数据

Unity

UI/UE设计

全媒体营销

影视剪辑

游戏原画

区块链

产品经理

商业插画

PMP认证

红帽RHCE

软考认证

华为认证

出国留学

安全认证

更多课程

免费教程
HTML5视频教程 Java视频教程 Python视频教程 UI视频教程云计算视频教程软件测试视频教程大数据视频教程物联网视频教程 Unity视频教程网络安全视频教程全媒体视频教程影视剪辑视频教程
教研实力
教研院项目库师资团队项目大赛
校企服务
企业内训高校合作学科共建
就业服务
就业服务双选会上门招聘人才定制促就业行动
认证考试
PMP培训软考培训红帽RHCE认证学历提升
千锋问问行业资讯技术干货热点话题
零基础学IT IT培训机构 IT面试题 IT就业前景
关于千锋
千锋简介锋益公益大赛组织品牌活动
联系我们

当前位置：首页 > 应聘面试 > Python面试题 > 【Python面试题】如何读取大文件？

【Python面试题】如何读取大文件？

来源：千锋教育

发布人：wjy

时间： 2022-08-23 10:29:00 1661221740

如何读取大文件，例如内存只有4G，如何读取一个大小为8G的文件？

很显然4G内存要一次性的加载大小为8G的文件是不现实的，遇到这种情况必须要考虑多次读取和分批次处理。

在Python中读取文件可以先通过open函数获取文件对象，在读取文件时，可以通过read方法的size参数指定读取的大小，也可以通过seek方法的offset参数指定读取的位置，这样就可以控制单次读取数据的字节数和总字节数。

除此之外，可以使用内置函数iter将文件对象处理成迭代器对象，每次只读取少量的数据进行处理，代码大致写法如下所示。

with open('...', 'rb') as file: for data in iter(lambda: file.read(2097152), b''): pass 在Linux系统上，可以通过split命令将大文件切割为小片，然后通过读取切割后的小文件对数据进行处理。

例如下面的命令将名为filename的大文件切割为大小为512M的多个文件。

split -b 512m filename 如果愿意，也可以将名为filename的文件切割为10个文件

命令如下所示。 split -n 10 filename

扩展：外部排序跟上述的情况非常类似，由于处理的数据不能一次装入内存，只能放在读写较慢的外存储器（通常是硬盘）上。“排序-归并算法”就是一种常用的外部排序策略。

在排序阶段，先读入能放在内存中的数据量，将其排序输出到一个临时文件，依此进行，将待排序数据组织为多个有序的临时文件，然后在归并阶段将这些临时文件组合为一个大的有序文件，这个大的有序文件就是排序的结果。

tags:

声明：本站稿件版权均属千锋教育所有，未经许可不得擅自转载。

10年以上业内强师集结，手把手带你蜕变精英

请您保持通讯畅通，专属学习老师24小时内将与您1V1沟通

免费领取

今日已有369人领取成功

刘同学 138****2860 刚刚成功领取

王同学 131****2015 刚刚成功领取

张同学 133****4652 刚刚成功领取

李同学 135****8607 刚刚成功领取

杨同学 132****5667 刚刚成功领取

岳同学 134****6652 刚刚成功领取

梁同学 157****2950 刚刚成功领取

刘同学 189****1015 刚刚成功领取

张同学 155****4678 刚刚成功领取

邹同学 139****2907 刚刚成功领取

董同学 138****2867 刚刚成功领取

周同学 136****3602 刚刚成功领取

上一篇

【Python面试题】写一个记录函数执行时间的装饰器

下一篇

【Python面试题】运行下面的代码是否会报错

免费打包获取

相关推荐HOT

【Python面试题】谈谈你对“猴子补丁”（monkey patching）的理解

“猴子补丁”是动态类型语言的一个特性，代码运行时在不修改源代码的前提下改变代码中的方法、属性、函数等以达到热补丁（hot patch）的效果。详情>>

2022-08-23 10:29:17

【Python面试题】使用Python代码实现遍历一个文件夹的操作

Python标准库os模块的walk函数提供了遍历一个文件夹的功能，它返回一个生成器。import os g = os.walk('/Users/Hao/Downloads/') for path, dir...详情>>

2022-08-23 10:29:09

【Python面试题】如何理解python中的封装,继承,多态的

封装：封装就是把对象的属性和行为结合成一个独立的整体，把内部的实现细节隐藏起来，不能被外界所看见，调用的人只能执行，而看不到实现的细节...详情>>

2022-08-23 10:29:06

【Python面试题】运行下面的代码是否会报错

扩展：如果不希望代码运行时动态的给对象添加新属性，可以在定义类时使用__slots__魔法。例如，我们可以在上面的A中添加一行__slots__ = ('__va...详情>>

2022-08-23 10:29:03

【Python面试题】阅读下面的代码说出运行结果。

在没有多重继承的情况下，向对象发出一个消息，如果对象没有对应的方法，那么向上（父类）搜索的顺序是非常清晰的。如果向上追溯到object类（所...详情>>

2022-08-23 10:29:00

热门推荐

华为外包python面试题-Python实现斐波那契数列

常见Python程序员面试题

Python面试题及答案

matlab和python实现pca降维算法

【Python面试题】运行下面的代码是否会报错？

【Python面试题】对下面给出的字典按值从大到小对键进行排序。

【Python面试题】说一下你知道的Python编码规范

【Python面试题】说一下你对Python中模块和包的理解

【Python面试题】如何使用random模块生成随机数、实现随机乱序和随机抽样？

【Python面试题】举例说明什么情况下会出现KeyError、TypeError、ValueError

技术干货更多>>

如何实现服务器负载均衡

2023-12-06

linux有哪些优势和劣势

2023-12-06

linux需要驱动吗

2023-12-06

android与linux的区别

2023-12-06

如何搭建基于容器的深度学习环境

2023-12-06

职场就业更多>>

网络安全软件开发的就业前景

2023-12-09

学会python工程师后的就业前景

2023-12-09

学会java工程师后的就业前景

2023-12-09

云计算技术就业前景以及发展方向怎样？

2023-08-07

快速通道

培训机构
了解培训相关
就业前景
查看就业前景
培训门槛
了解学习门槛
应聘面试
常见面试考题
就业服务
毕业推荐就业
师资团队
了解师资团队

千锋教育

千锋学习站 | 随时随地免费学

千锋教育

扫一扫进入千锋手机站