最近在看python面试题的时候,找到了一个非常典型的题库,原博主号称是BAT经典面试题,苦于原博主只有题目,没有答案,所以本人就稍微整理了一下,能力所限,如有错误,请留言修改。
python语法以及其他基础部分
可变与不可变类型;
- 可变类型: list dict set
- 不可变类型: int,str,tuple,bool
浅拷贝与深拷贝的实现方式、区别;deepcopy如果你来设计,如何实现;
- 深浅拷贝的区别:
浅拷贝是将原始对象中的数据型字段拷贝到新对象中去,将引用型字段的“引用”复制到新对象中去,不把“引用的对象”复制进去,所以原始对象和新对象引用同一对象,新对象中的引用型字段发生变化会导致原始对象中的对应字段也发生变化。
深拷贝是在引用方面不同,深拷贝就是创建一个新的和原始字段的内容相同的字段,是两个一样大的数据段,所以两者的引用是不同的,之后的新对象中的引用型字段发生改变,不会引起原始对象中的字段发生改变。 - 简单来说,浅拷贝复制的是对象的引用,当原对象发生改变时,拷贝的对象也会发生改变;深拷贝则是拷贝内容,当原对象发生改变的时候,拷贝的对象不会发生改变。
new() 与 init()的区别;
- __init__方法是面向对象编程中,给未来创建的对象所定义的初始化属性。当对象一旦被创建,Python将会自动调用__init__方法,里面的属性将会赋予这个对象
- __new__是在实例创建之前被调用的,因为它的任务就是创建实例然后返回该实例,是个静态方法。
- 故而“ 本质上 ”来说,new()方法负责创建实例,而__init__()仅仅是负责实例属性相关的初始化而已,执行顺序是,先new后init。
你知道几种设计模式;
- 总体来说设计模式分为三大类:
- 创建型模式,共五种:工厂方法模式、抽象工厂模式、单例模式、建造者模式、原型模式。
- 结构型模式,共七种:适配器模式、装饰器模式、代理模式、外观模式、桥接模式、组合模式、享元模式。
- 行为型模式,共十一种:策略模式、模板方法模式、观察者模式、迭代子模式、责任链模式、命令模式、备忘录模式、状态模式、访问者模式、中介者模式、解释器模式。
- 单例是一种设计模式,应用该模式的类只会生成一个实例。
单例模式保证了在程序的不同位置都可以且仅可以取到同一个对象实例:如果实例不存在,会创建一个实例;如果已存在就会返回这个实例。因为单例是一个类,所以你也可以为其提供相应的操作方法,以便于对这个实例进行管理。
编码和解码你了解过么;
- decode英文意思是解码,encode英文原意是编码。
- Python 里面的编码和解码也就是 unicode 和 str 这两种形式的相互转化。编码是 unicode -> str,解码是 str -> unicode。
- 字符串在Python内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码, 即先将其他编码的字符串解码(decode)成unicode,再从unicode编码(encode)成另一种编码。
列表推导list comprehension和生成器的优劣;
# 列表生成式是使用包含较少代码的for循环创建列表
comp_list = [x * 2 for x in range(10)]
print(comp_list)
# 在Python中,生成器提供了一种实现迭代器协议的便捷方式。Generator是一个使用带有yield语句的函数创建的迭代。
# 在语法方面,唯一的区别是你使用括号而不是方括号
gen_exp = (x ** 2 for x in range(10) if x % 2 == 0)
for x in gen_exp:
print(x)
- 区别 :
- 列表推导和生成器表达式返回的数据类型不同。列表生成式返回列表,生成器返回generator类型
- 生成器在列表中的主要优点是它占用的内存要少得多。
什么是装饰器;如果想在函数之后进行装饰,应该怎么做
- 装饰器的本质就是一个python的高级函数,在python中通过@表示符对函数进行装饰
- 高阶函数
-一个函数可以作为参数传给另外一个函数,或者一个函数的返回值为另外一个函数(若返回值为该函数本身,则为递归),满足其一则为高阶函数。
- 功能:
- 在不需要最原函数进行代码变动的前提下,给函数增加功能
手写个使用装饰器的实现;
def logging(func):
def _logging():
print("thie is a log")
func()
return _logging
@logging
def bar():
print('test log 装饰器')
bar()
使用装饰器的单例和使用其他方法的单例,在后续使用中,有何区别;
- 使用装饰器单例属性不会被覆盖。因为装饰器单例模式是直接返回之前生成的对象,
并不会重新初始化对象。像new方法构建的单例模式会重新调用init方法,为实例重新初始化属性。
手写:正则邮箱地址;
- ‘^[0-9a-zA-Z_]+@[0-9a-zA-Z]{1,13}.[com,cn,net]{1,3}$’
介绍下垃圾回收:引用计数/分代回收/孤立引用环;
- 分代回收
-
- 分代技术是一种典型的以空间换时间的技术,这也正是java里的关键技术。这种思想简单点说就是:对象存在时间越长,越可能不是垃圾,应该越少去收集。
-
- 这样的思想,可以减少标记-清除机制所带来的额外操作。分代就是将回收对象分成数个代,每个代就是一个链表(集合),代进行标记-清除的时间与代内对象
-
- 从上面代码可以看出python里一共有三代,每个代的threshold值表示该代最多容纳对象的个数。默认情况下,当0代超过700,或1,2代超过10,垃圾回收机制将触发。
-
- 0代触发将清理所有三代,1代触发会清理1,2代,2代触发后只会清理自己。
多进程与多线程的区别;CPU密集型适合用什么;
- python多线程适合io操作密集型的任务(如socket server 网络并发这一类的);python多线程不适合cpu密集操作型的任务,主要使用cpu来计算,如大量的数学计算。
那么如果有cpu密集型的任务怎么办,可以通过多进程来操作(不是多线程)。 - 假如CPU有8核,每核CPU都可以用1个进程,每个进程可以用1个线程来进行计算。
进程之间不需要使用gil锁,因为进程是独立的,不会共享数据。
进程可以起很多个,但是8核CPU同时只能对8个任务进行操作。
进程通信的方式有几种;
- socket
- a、使用socket通信的方式实现起来简单,可以使用因特网域和UNIX域来实现,使用因特网域可以实现不同主机之间的进出通信。
- b、该方式自身携带同步机制,不需要额外的方式来辅助实现同步。
- c、随进程持续。
- 共享内存
- a、最快的一种通信方式,多个进程可同时访问同一片内存空间,相对其他方式来说具有更少的数据拷贝,效率较高。
- b、需要结合信号灯或其他方式来实现多个进程间同步,自身不具备同步机制。
- c、随内核持续,相比于随进程持续生命力更强。
- 管道
- a、较早的一种通信方式,缺点明显:只能用于有亲缘关系进程之间的通信;只支持单向数据流,如果要双向通信需要多创建一个管道来实现。
- b、自身具备同步机制。
- c、随进程持续。
- 消息队列
- a、与共享内存类似,使用一个路径名来实现各个无亲缘关系进程之间的通信。消息队列相比于其他方式有很多优点:它提供有格式的字节流,减少了开发人员的工作量;消息具有类型(system V)或优先级(posix)。其他方式都没有这些优点。
- b、具备同步机制。
- c、随内核持续。
介绍下协程,为何比线程还快;
协程,是一种比线程更加轻量级的存在,协程不是被操作系统内核所管理,而完全是由程序所控制(也就是在用户态执行)。这样带来的好处就是性能得到了很大的提升,不会像线程切换那样消耗资源。
range和xrange的区别;
两者的区别是xrange返回的是一个可迭代的对象,range返回的则是一个列表.
在python3中,range返回可迭代对象,取消xrange
- 将IP地址字符串(比如“172.0.0.1”)转为32位二进制数的函数。
算法排序部分
手写快排;堆排;几种常用排序的算法复杂度是多少;快排平均复杂度多少,最坏情况如何优化;
手写:已知一个长度n的无序列表,元素均是数字,要求把所有间隔为d的组合找出来,你写的解法算法复杂度多少;
手写:一个列表A=[A1,A2,…,An],要求把列表中所有的组合情况打印出来;
手写:用一行python写出1+2+3+…+10**8 ;
手写python:用递归的方式判断字符串是否为回文;
单向链表长度未知,如何判断其中是否有环;
单向链表如何使用快速排序算法进行排序;
手写:一个长度n的无序数字元素列表,如何求中位数,如何尽快的估算中位数,你的算法复杂度是多少;
如何遍历一个内部未知的文件夹(两种树的优先遍历方式)
网络基础部分
TCP/IP分别在模型的哪一层;
OSI七层模型 | TCP/IP五层协议 | 网络协议 |
---|
应用层 | | |
表示层 | 应用层 | FTP;DNS;HTTP |
会话层 | | |
传输层 | 传输层 | TCP;UDP |
网络层 | 网络层 | IP,ARP;ICMP |
数据链路层 | 数据链路层 | |
物理层 | 物理层 | |
socket长连接是什么意思;
- 短连接:1 次 socket 连接后,只进行 1 次 HTTP 事务,然后断开 socket 连接;
- 长连接:1 次 socket 连接后,不管是否使用 socket 连接(进行多次 HTTP 事务),不断开 socket 连接。
select和epoll你了解么,区别在哪;
TCP UDP区别;三次握手四次挥手讲一下;
| TCP | UDP |
---|
连接方面 | 需要连接 | 不需要连接 |
安全方面 | 提供可靠的服务,无差错,不重复,保证有序传输 | 不保证可靠交付 |
传输效率 | 效率较低 | 传输效率高 |
连接对象,数量 | 点对点传输 | 支持一对一;一对多;多对多传输 |
-
三次握手:
- 客户端向服务器发起链接请求(问是否可以连接) 2.服务器接受到请求后进行确认(允许连接)返回报文 3.客户端收到许可,建立连接
-
四次挥手:
- 主动方发送报文告知被动方要断开连接 2.被动发返回报文没告知收到请求,准备断开 3.被动发发送报文给主动方告知准备就绪可以断开 4.主动方发送报文确定断开
TIME_WAIT过多是因为什么;
http一次连接的全过程:你来说下从用户发起request——到用户接收到response;
-
- 对www.baidu.com这个网址进行DNS域名解析,得到对应的IP地址
-
- 根据这个IP,找到对应的服务器,发起TCP的三次握手
-
- 建立TCP连接后发起HTTP请求
-
- 服务器响应HTTP请求,浏览器得到html代码
-
- 浏览器解析html代码,并请求html代码中的资源(如js、css、图片等)(先得到html代码,才能去找这些资源)
-
- 浏览器对页面进行渲染呈现给用户
-
- 服务器关闭关闭TCP连接
http连接方式。get和post的区别,你还了解其他的方式么;
get是从服务器上获取数据,post是向服务器传送数据。在客户端, get方式在通过URL提交数据, 数据在URL中可以看到;post方式,数据放置在HTML HEADER内提交。 对于get方式,服务器端用Request.QueryString获取变量的值, 对于post方式,服务器端用Request.Form获取提交的数据。 Get 方式提交数据,会带来安全问题,比如一个登陆页面,通过 Get 方式提交数据时, 用户名和密码将出现在 URL 上,如果页面可以被缓存或者其他人可以访问客户这台机器, 就可以从历史记录获得该用户的帐号和密码,所以表单提交建议使用 Post 方法。
restful你知道么;
- RESTful是目前最流行的API架构风格,用于Web数据接口的设计。
- RESTful的核心思想:请求方式 + URL的方式对资源发起命令。
- 比如:GET /user 这个命令中,GET 查询动作,user是被查询的对象。
- 比如:POST /user 这个命令中,POST 新增动作,user是被新增的对象。
状态码你知道多少,比如200/403/404/504等等;
- 2xx:成功——表示请求已经被成功接收、理解、接受。
- 3xx:重定向——要完成请求必须进行更进一步的操作
- 4xx:客户端错误——请求有语法错误或请求无法实现
- 5xx:服务器端错误——服务器未能实现合法的请求。
数据库部分
MySQL锁有几种;死锁是怎么产生的;为何,以及如何分区、分表;
一、 什么是死锁
死锁是指两个或两个以上的进程在执行过程中,因争夺资源而造成的一种互相等待的现象,若无外力作用,它们都将无法推进下去.此时称系统处于死锁状态或系统产生了死锁,这些永远在互相等的进程称为死锁进程.
二、 死锁产生的四个必要条件
- 互斥条件:指进程对所分配到的资源进行排它性使用,即在一段时间内某资源只由一个进程占用。如果此时还有其它进程请求资源,则请求者只能等待,直至占有资源的进程用毕释放
- 请求和保持条件:指进程已经保持至少一个资源,但又提出了新的资源请求,而该资源已被其它进程占有,此时请求进程阻塞,但又对自己已获得的其它资源保持不放
- 不剥夺条件:指进程已获得的资源,在未使用完之前,不能被剥夺,只能在使用完时由自己释放
- 环路等待条件:指在发生死锁时,必然存在一个进程——资源的环形链,即进程集合{P0,P1,P2,···,Pn}中的P0正在等待一个P1占用的资源;P1正在等待P2占用的资源,……,Pn正在等待已被P0占用的资源
这四个条件是死锁的必要条件,只要系统发生死锁,这些条件必然成立,而只要上述条件之一不满足,就不会发生死锁
MySQL的char varchar text的区别;
- 1、 char长度固定, 即每条数据占用等长字节空间;适合用在身份证号码、手机号码等定。
- 2、 varchar可变长度,可以设置最大长度;适合用在长度可变的属性。
- 3、 text不设置长度, 当不知道属性的最大长度时,适合用text。
- 按照查询速度: char最快, varchar次之,text最慢。
了解join么,有几种,有何区别,A LEFT JOIN B,查询的结果中,B没有的那部分是如何显示的(NULL);
索引类型有几种,BTree索引和hash索引的区别(我没答上来这俩在磁盘结构上的区别);
手写:如何对查询命令进行优化;
NoSQL了解么,和关系数据库的区别;
redis有几种常用存储类型;
Linux部分
讲一下你常用的Linux/git命令和作用;
- 常用命令
pwd :显示当前所在的目录
ls :显示当前目录下的文件
cd :切换路径
cd . . :返回到上一级路径
mkdir :新建目录
rmdir :删除目录
touch :新建文件
cp :复制文件
rm :删除文件
cat :将文件内容显示到终端中
clear :清除屏幕的显示内容 - git命令
git add 添加修改文件
git status 查看状态(查看工作区文件状态)
git checkout – file 丢弃工作区的修改
git commit -m "填写备注"提交修改到本地仓库
git merge 合并分支
git pull 拉取远程仓库版本
git push 推送本地仓到远程仓
git reset --hart HEAD^ 版本回退
git log 查看commit历史记录
git reflog 查看历史命令
git branch name 创建分支
git branch 查看分支
git checkout name 切换分支
git checkout -b name 创建+切换分支
git branch -D name 删除分支
git merge 分支 合并分支 - 磁盘空间
df -h 显示已经挂载的分区列表
ls -lSr |more 以尺寸大小排列文件和目录
du -sh dir1 估算目录 ‘dir1’ 已经使用的磁盘空间’
du -sk * | sort -rn 以容量大小为依据依次显示文件和目录的大小
查看当前进程是用什么命令,除了文件相关的操作外,你平时还有什么操作命令;
- 进程相关命令【关键字:PS】
-
1.查进程
ps命令查找与进程相关的PID号:
ps a 显示现行终端机下的所有程序,包括其他用户的程序。
ps -A 显示所有程序。
ps c 列出程序时,显示每个程序真正的指令名称,而不包含路径,参数或常驻服务的标示。
ps -e 此参数的效果和指定"A"参数相同。
ps e 列出程序时,显示每个程序所使用的环境变量。
ps f 用ASCII字符显示树状结构,表达程序间的相互关系。
ps -H 显示树状结构,表示程序间的相互关系。
ps -N 显示所有的程序,除了执行ps指令终端机下的程序之外。
ps s 采用程序信号的格式显示程序状况。
ps S 列出程序时,包括已中断的子程序资料。
ps -t<终端机编号> 指定终端机编号,并列出属于该终端机的程序的状况。
ps u 以用户为主的格式来显示程序状况。
ps x 显示所有程序,不以终端机来区分。
最常用的方法是ps aux,然后再通过管道使用grep命令过滤查找特定的进程,然后再对特定的进程进行操作。
ps aux | grep program_filter_word,ps -ef |grep tomcat
ps -ef|grep java|grep -v grep 显示出所有的java进程,去处掉当前的grep进程。
-
2.杀进程
使用kill命令结束进程:kill xxx
常用:kill -9 324
Linux下还提供了一个killall命令,可以直接使用进程的名字而不是进程标识号,例如:# killall -9 NAME
-
3.启动进程:
- 进入到进程的执行文件所在的路径下,执行文件 ./文件名
django项目部分(Diango没有很多客观题,就懒得找答案了,题目如下:)
PS:都是让简单的介绍下你在公司的项目,不管是不是后端相关的,主要是要体现出你干了什么;
你在项目中遇到最难的部分是什么,你是怎么解决的;
你看过django的admin源码么;看过flask的源码么;你如何理解开源;
MVC / MTV;
缓存怎么用;
中间件是干嘛的;
CSRF是什么,django是如何避免的;XSS呢;
如果你来设计login,简单的说一下思路;
session和cookie的联系与区别;session为什么说是安全的;
uWSGI和Nginx的作用;