准备Python工程师面试

之前在招聘网站放过简历，于是前2天有面试电话打来，是一家业内号称卖“理念”的公司，也的确还算有名气的公司，自称大公司中的小公司。职位是Python工程师。心想去去也好，看看自己到底是个什么水平，呆一家公司9年时间，都不知道外面的世界是什么样的了，偶尔会狂妄自大，偶尔会妄自菲薄。

比如说去这家公司面试心里就很紧张，Python实际只用了2年时间，期间一直仅仅忙于实现功能即可，对很多细节都是一知半解，程序能通就Ok。所以我还挺认真的开始找找资料，复习下。~~（当然还有个原因对方说有笔试，囧。心里很担心万一全不会多丢人啊！！）~~

这个总结是去之前写的，把它发出来的同时实际已经去过了，结果面试结果的感觉是不咋地，但也有好处，就是达到了认清自己、找到缺点的目的。ok，这块回头再写。

pyc pyo pyd

http://www.cnblogs.com/dkblog/archive/2009/04/16/1980757.html

什么是pyc文件

pyc是一种二进制文件，是由py文件经过编译后，生成的文件，是一种byte code，py文件变成pyc文件后，加载的速度有所提高，而且pyc是一种跨平台的字节码，是由python的虚拟机来执行的，这个是类似于JAVA或者.NET的虚拟机的概念。pyc的内容，是跟python的版本相关的，不同版本编译后的pyc文件是不同的，2.5编译的pyc文件，2.4版本的 python是无法执行的。

什么是pyo文件

pyo是优化编译后的程序 python -O 源文件即可将源程序编译为pyo文件

什么是pyd文件

pyd是python的动态链接库。

为什么需要pyc文件

这个需求太明显了，因为py文件是可以直接看到源码的，如果你是开发商业软件的话，不可能把源码也泄漏出去吧？所以就需要编译为pyc后，再发布出去。当然，pyc文件也是可以反编译的，不同版本编译后的pyc文件是不同的，根据python源码中提供的opcode，可以根据pyc文件反编译出 py文件源码，网上可以找到一个反编译python2.3版本的pyc文件的工具，不过该工具从python2.4开始就要收费了，如果需要反编译出新版本的pyc文件的话，就需要自己动手了（俺暂时还没这能力^—^）,不过你可以自己修改python的源代码中的opcode文件，重新编译 python，从而防止不法分子的破解。

py文件在运行时会产生pyc文件，用于缓存编译后代码不完全正确？？ why？？

zen of python

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren’t special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one— and preferably only one —obvious way to do it.
Although that way may not be obvious at first unless you’re Dutch.
Now is better than never.
Although never is often better than right now.
If the implementation is hard to explain, it’s a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea — let’s do more of those!

翻译

美比丑好
直言不讳比心照不宣好
简单比复杂好
复杂比难以理解好
平面的比嵌套的好
错落有致比密密匝匝的好
可读性很重要
虽然实用比纯粹更重要但特殊情况不能特殊到打破规律
永远别让错误悄悄地溜走除非是你故意的
碰到模棱两可的地方，绝对不要去作猜测
什么事情都应该有一个，而且最好只有一个显而易见的解决办法
虽然刚开始的时候，这个办法可能不是那么的显而易见，但谁叫你不是荷兰人
有些事情不理不睬可能会比过一会解决要好
但最好是现在就解决
如果一个想法实现起来很困难，那它本身就不是一个好想法
如果一个想法实现起来很容易，那它或许就是一个好想法
命名空间是一个很了不起的想法,让我们多多使用吧

排序

str_list = ['a', 'b', 'c']
str_list.sort(key=lambda x:x.lower(),reverse=True)

随机

import random
random.random()
random.sample(range(10), 2)
l = range(10)
random.shuffle(l)

文件

with open('1.txt', 'w') as f:
    f.write('abc')

with open('1.txt', 'r') as f:
    for s in f:
        print s

import os
os.listdir('.')

import shutil
shutil.copyfile('1.txt', '2.txt')

os.remove('2.txt')

.items() .iteritems()

一个生成全部，一个是迭代器

常用类型常用方法

dir(list)
['__add__', '__class__', '__contains__', '__delattr__', '__delitem__', '__delslice__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__getslice__', '__gt__', '__hash__', '__iadd__', '__imul__', '__init__', '__iter__', '__le__', '__len__', '__lt__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__reversed__', '__rmul__', '__setattr__', '__setitem__', '__setslice__', '__sizeof__', '__str__', '__subclasshook__', 'append', 'count', 'extend', 'index', 'insert', 'pop', 'remove', 'reverse', 'sort']

dir(tuple)
['__add__', '__class__', '__contains__', '__delattr__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__getnewargs__', '__getslice__', '__gt__', '__hash__', '__init__', '__iter__', '__le__', '__len__', '__lt__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__rmul__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', 'count', 'index']

dir(dict)
['__class__', '__cmp__', '__contains__', '__delattr__', '__delitem__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__gt__', '__hash__', '__init__', '__iter__', '__le__', '__len__', '__lt__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__setitem__', '__sizeof__', '__str__', '__subclasshook__', 'clear', 'copy', 'fromkeys', 'get', 'has_key', 'items', 'iteritems', 'iterkeys', 'itervalues', 'keys', 'pop', 'popitem', 'setdefault', 'update', 'values', 'viewitems', 'viewkeys', 'viewvalues']

dir(set)
['__and__', '__class__', '__cmp__', '__contains__', '__delattr__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__iand__', '__init__', '__ior__', '__isub__', '__iter__', '__ixor__', '__le__', '__len__', '__lt__', '__ne__', '__new__', '__or__', '__rand__', '__reduce__', '__reduce_ex__', '__repr__', '__ror__', '__rsub__', '__rxor__', '__setattr__', '__sizeof__', '__str__', '__sub__', '__subclasshook__', '__xor__', 'add', 'clear', 'copy', 'difference', 'difference_update', 'discard', 'intersection', 'intersection_update', 'isdisjoint', 'issubset', 'issuperset', 'pop', 'remove', 'symmetric_difference', 'symmetric_difference_update', 'union', 'update']

dir(str)
['__add__', '__class__', '__contains__', '__delattr__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__getnewargs__', '__getslice__', '__gt__', '__hash__', '__init__', '__le__', '__len__', '__lt__', '__mod__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__rmod__', '__rmul__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '_formatter_field_name_split', '_formatter_parser', 'capitalize', 'center', 'count', 'decode', 'encode', 'endswith', 'expandtabs', 'find', 'format', 'index', 'isalnum', 'isalpha', 'isdigit', 'islower', 'isspace', 'istitle', 'isupper', 'join', 'ljust', 'lower', 'lstrip', 'partition', 'replace', 'rfind', 'rindex', 'rjust', 'rpartition', 'rsplit', 'rstrip', 'split', 'splitlines', 'startswith', 'strip', 'swapcase', 'title', 'translate', 'upper', 'zfill']

list

list可以作为栈

list可以作为队列

list到list的映射。??不明白

any和all在list中的使用。

l = range(10)
all(n<10 for n in l)
any(n==0 for n in l)

list与for的结合，相当于高级语言中的foreach功能。

对list的enumerate与for的结合，相当于高级语言中的for功能。

list的嵌套使用，相当于多维数组。

del相当于list本身的remove，都可以用来删除list中的元素。

l = range(10)
del l[9]

zip

tuple

tuple相当于是不可修改的list，所以同时也不具有list的很多修改的方法，例如append，insert，remove等；但是tuples仍然可以使用count，index等查找方法。

使用 t2 = (2,4,8)来定义tuple，也可以使用list来定义tuple如 l = [1,2,3] 和 t = tuple(l)

set

set的定义使用{}。

可以将list使用set显示的转化为set。

可以用in来判断指定元素是否存在于set中。

set于for结合使用，相当于foreach。

set可以进行|，&，^,-操作。

dict

dictionary使用{1 : ‘tom’, 2 : ‘bill’}来定义，也可以使用dict([(‘sape’, 4139), (‘guido’, 4127), (‘jack’, 4098)])来从list定义dictionary。

[]=来增加新的值。

del来删除指定的key和value。

in用来查找key是否存在。

语法糖

isinstance([], list)
isinstance((), tuple)
isinstance({}, dict)
isinstance({1:2}, dict)
isinstance({1}, set)

Pythonic

只可意会不可言传！

或者参见

import this

help

参看方法参数

help(''.index)

lambda

好处

匿名函数, 方便, 类函数式, 写回调方便

filter

filter(function, sequence)：对sequence中的item依次执行function(item)，将执行结果为True的item组成一个List/String/Tuple（取决于sequence的类型）返回：

map

map(function, sequence) ：对sequence中的item依次执行function(item)，见执行结果组成一个List返回：

reduce

reduce(function, sequence, starting_value)：对sequence中的item顺序迭代调用function，如果有starting_value，还可以作为初始值调用，例如可以用来对List求和：

range xrange

一个列表 ~~一个迭代器~~ xrange

yield

？？？

python支持多线程，能够单进程无缝发挥多路CPU的优势

支持，不能够

为什么不能？并行计算？Python的线程实际上是使用单核在运行。

https://wiki.python.org/moin/ParallelProcessing

在大多数系统上，Python同时支持消息传递和基于线程的并发编程。尽管大多数程序员熟悉的往往是线程接口，但实际上Python线程受到的限制有很多。尽管最低限度是线程安全的，但Python解释器还是使用了内部的GIL(Global Interperter Lock,全局解释器锁定)，在任意指定的时刻只能在一个处理器上运行。尽管GIL经常是Python社区中争论的热点，但在可以预见的将来它都不可能消失。

号称来源于《python参考手册》但我没去证实。

在python中，使用for从列表中删除元素是错误的做法，会导致漏删元素。正确的做法是使用python内置的filter函数

题目考虑Decorator 装饰器

def wrap_info (f):
    b = {"b":10};
    def inner_func (*p, **k):
        print b['b'], p, k;
        b['b'] += 1;
        f(*p, **k);
    return inner_func;

def info (s):    print "func info: %s" % s;

if __name__ == "__main__":
    f1 = wrap_info (info);
    f1 ("a");
    f2 = wrap_info (info);
    f1 ("b");
    f2 ("c");

Python装饰器学习（九步入门）

题目纯卖弄！

a="a=%s%s%s;print a%%(chr(34),a,chr(34));";print a%(chr(34),a,chr(34));

题目单例模式

class singleton (object):
    """ 单例模式的实现 """
    def __new__ (cls, **kargs):
        if '_instance' not in cls.__dict__:
            cls._instance = object.__new__ (cls, **kargs);
        return cls._instance;

动态加载反射等

Python自省（反射）指南

访问元数据

使用inspect

unicode

s.decode('utf-8')
u.encode()

传值？传引用？传值！

stackoverflow

简单来说，你在方法里重新对一个参数赋值可能不会改变。

建议是return出来然后改变

class PassByReference:
  def __init__(self):
    self.variable = 'Original'
    self.Change(self.variable)
    print self.variable
  def Change(self, var):
    var = 'Changed'

p = PassByReference()
p.Change(p.variable)
print p.variable # Original

改为

class PassByReference:
  def __init__(self):
    self.variable = 'Original'
    self.Change()
    print self.variable
  def Change(self):
    self.variable = 'Changed'

p = PassByReference()
p.Change()
print p.variable # Changed

或者

class PassByReference:
  def __init__(self):
    self.variable = 'Original'
    self.Change(p.variable)
    print self.variable
  def Change(self, var):
    return 'Changed'

p = PassByReference()
p.variable = p.Change(p.variable)
print p.variable # Changed

甚至是变成一个数组传进去等等，但真不是个好办法了。太丑！

进阶链接

Python Interview Question and Answers

Python的内存是使用的heap？

http://docs.python.org/2/c-api/memory.html

阮一峰对堆和栈的解释

virtualenv

source activate
deactivate

pip freeze > filename
pip install -r filename