12道必会的Python面试题，附详细讲解

技术学派 2018-06-14 17:59:00

无论是应聘Python方向的web开发，还是爬虫工程师，或是数据分析，还是自动化运维，都涉及到一些基础的知识！小编挑了一些Python的基础面试题，看看你能不能的答上来，也许面试的同学用的着！

1.Python这么好，说说它的特性吧

关键特性

Python是一种解释型语言，这意味着，与C，C++不同，Python不需要在运行之前进行编译。它是边运行边解释的。

Python是动态类型化的，这意味着当你声明它们或类似的东西时，你不需要声明变量的类型。你可以x=1 ，然后x="abc"是没有错误。

Python非常适合面向对象编程，因为它允许定义类以及组合和继承。Python没有访问修饰符。

在Python中函数是一等对象，这意味着它们可以在运行时动态创建，能赋值给变量或者作为参数传给函数，还能作为函数的返回值。

Python代码容易上手，开发速度很快，但运行速度通常比编译语言慢。幸运的是，Python允许包含基于C的扩展，所以瓶颈可以被优化掉。

2.单引号、双引号和三引号之间的区别

单引号和双引号主要是用来表示字符串

比如:

单引号:'python'

双引号:"python"

区别:

若你的字符串里面本身包含单引号,必须用双引号包裹。

比如:"can't find the log "

三引号

三单引号:'''python ''',也可以表示字符串一般用来输入多行文本,或者用于大段的注释。

三双引号："""python"""，一般用在类里面,用来注释类,这样省的写文档,直接用类的对象doc访问获得文档。

3.Python里面如何拷贝一个对象？

标准库中的copy模块提供了两个方法来实现拷贝.一个方法是copy,它返回和参数包含内容一样的对象.

使用deepcopy方法,对象中的属性也被复制

4.Python的参数传递，是值传递还是引用传递？

Python的参数传递有：

位置参数

默认参数

可变参数

关键字参数

函数的传值到底是值传递还是引用传递，要看情况

不可变参数用值传递：

比如像整数和字符串这样的不可变对象，是通过拷贝进行传递的，因为你无论如何都不可能在原处改变不可变对象。

可变参数是用引用传递：

比如像列表，字典这样的对象是通过引用传递，和C语言里面的用指针传递数组很相似，可变对象能在函数内部改变。

5.什么是lambda函数？它的好处是什么?

lambda 表达式，通常是在需要一个函数，但是又不想费神去命名一个函数的场合下使用，也就是指匿名函数。

lambda函数：首要用途是指点短小的回调函数。

lambda [arguments]:expression

>>> a=lambdax,y:x+y

>>> a(3,11)

好处：

lambda能和def做同样种类的工作，特别是对于那些逻辑简单的函数，直接用lambda会更简洁，而且省去取函数名的麻烦。

6.字符串格式化: %和 .format的区别是什么？

字符串的format函数非常灵活，很强大,可以接受的参数不限个数，并且位置可以不按顺序，而且有较为强大的格式限定符(比如:填充、对齐、精度等)。

7.Python是如何进行内存管理的？

Python引用了一个内存池(memory pool)机制，即Pymalloc机制(malloc:n.分配内存)，用于管理对小块内存的申请和释放

内存池（memory pool）的概念：

当创建大量消耗小内存的对象时，频繁调用new/malloc会导致大量的内存碎片，致使效率降低。内存池的概念就是预先在内存中申请一定数量的，大小相等的内存块留作备用，当有新的内存需求时，就先从内存池中分配内存给这个需求，不够了之后再申请新的内存。这样做最显著的优势就是能够减少内存碎片，提升效率。

内存池的实现方式有很多，性能和适用范围也不一样。

python中的内存管理机制——Pymalloc：

python中的内存管理机制都有两套实现，一套是针对小对象，就是大小小于256bits时,pymalloc会在内存池中申请内存空间；当大于256bits，则会直接执行new/malloc的行为来申请内存空间。关于释放内存方面，当一个对象的引用计数变为0时，python就会调用它的析构函数。在析构时，也采用了内存池机制，从内存池来的内存会被归还到内存池中，以避免频繁地释放动作。

8.如何用Python来进行查询和替换一个文本字符串？

可以使用sub()方法来进行查询和替换，sub方法的格式为：sub(replacement, string[, count=0])

replacement是被替换成的文本

string是需要被替换的文本

count是一个可选参数，指最大被替换的数量

9.Python里面search()和match()的区别？

match()函数只检测RE是不是在string的开始位置匹配，search()会扫描整个string查找匹配, 也就是说match()只有在0位置匹配成功的话才有返回，如果不是开始位置匹配成功的话，match()就返回none 。

10.线程如何在Python中实现

Python有一个多线程包threading，可以使用多线程来加快你的代码。但是Python有一个叫做Global Interpreter Lock（GIL）的构造。GIL确保只有一个'线程'可以在任何时候执行。

线程获取GIL，做一些工作，然后将GIL传递到下一个线程。这种情况发生得非常快，所以对于人眼而言，它可能看起来像你的线程并行执行，但它们实际上只是轮流使用相同的CPU内核。因此GIL的存在使得Python中的多线程无法真正的利用多核的优势来提高性能。

对于IO密集型操作，在等待操作系统返回的时候会释放GIL；再比如爬虫因为有等待的服务器的响应时间，可以利用多线程来加速！但是对于CPU密集型操作，只能通过多进程Multiprocess来加速。

11.Python的参数传递，是值传递还是引用传递？

Python的参数传递有：

位置参数

默认参数

可变参数

关键字参数

函数的传值到底是值传递还是引用传递，要看情况

不可变参数用值传递：

比如像整数和字符串这样的不可变对象，是通过拷贝进行传递的，因为你无论如何都不可能在原处改变不可变对象。

可变参数是用引用传递：

比如像列表，字典这样的对象是通过引用传递，和C语言里面的用指针传递数组很相似，可变对象能在函数内部改变。

12.数据仓库是什么？

数据仓库是一个面向主题的、集成的、稳定的、反映历史变化的、随着时间的流逝发生变化的数据集合。它主要支持管理人员的决策分析。

数据仓库收集了企业相关内部和外部各个业务系统数据源、归档文件等一系列历史数据，最后转化成企业需要的战略决策信息。

特点：

面向主题：根据业务的不同而进行的内容划分；

集成特性：因为不同的业务源数据具有不同的数据特点，当业务源数据进入到数据仓库时，需要采用统一的编码格式进行数据加载，从而保证数据仓库中数据的唯一性；

非易失性：数据仓库通过保存数据不同历史的各种状态，并不对数据进行任何更新操作。

历史特性：数据保留时间戳字段，记录每个数据在不同时间内的各种状态。

本页共82段，3017个字符，7471 Byte(字节)

﻿12道必会的Python面试题，附详细讲解

12道必会的Python面试题，附详细讲解