美文网首页
计算机科学和Python编程导论week5

计算机科学和Python编程导论week5

作者: 瘦长的丰一禾 | 来源:发表于2018-07-29 22:21 被阅读30次
    算法复杂度

    不再使用毫秒测量时间,而是以程序执行的基本步数为单位进行测量。而人们通常最关注最差情形。

    通常对于规模特别大的输入,我们才会担心算法的效率。作为一种对“特别大”的表示方法,渐近表示法描述了输入规模
    趋近于无穷大时的算法复杂度。

    渐进复杂度

    # 书中例子练习如下:
    
    >>> def f(x):
    ...         """假设x是正整数"""
    ...         ans = 0
    ...         #常数时间循环
    ...         for i in range(1000):
    ...                 ans += 1
    ...         print('Number of additions so far', ans)
    ...         #x时间循环
    ...         for i in range(x):
    ...                 ans += 1
    ...         print('Number of additions so far', ans)
    ...         #x**2时间的嵌套循环
    ...         for i in range(x):
    ...                 for j in range(x):
    ...                         ans += 1
    ...                         ans += 1
    ...         print('Number of additions so far', ans)
    ...         return ans
    ... 
    # 调用10次
    >>> f(10)
    Number of additions so far 1000
    Number of additions so far 1010
    Number of additions so far 1210
    1210
    
    #调用1000次数
    >>> f(1000)
    Number of additions so far 1000
    Number of additions so far 2000
    Number of additions so far 2002000
    2002000
    
    

    如果假设执行每行代码需要一个单位时间,那么这个函数的运行时间可以描述为1000 + x +2x^2 。常数1000对应着第一个循环执行的次数。x项对应着第二个循环执行的次数。

    通过上面的分析,我们可以使用以下规则描述算法的渐近复杂度:
    1、如果运行时间是一个多项式的和,那么保留增长速度最快的项,去掉其他各项;
    2、如果剩下的项是个乘积,那么去掉所有常数。

    1、常数复杂度
    2、对数复杂度
    >>> def intToStr(i):
    ...     """假设i是非负整数,返回一个表示i的十进制字符串"""
    ...     digits = '0123456789'
    ...     if i == 0:
    ...             return '0'
    ...     result = ''
    ...     while i > 0:
    ...             result = digits[i%10] + result
    ...             i = i//10
    ...     return result
    ... 
    >>> intToStr(10)
    '10'
    
    # intToStr 的复杂度是O(log(i))。
    
    3、线性复杂度
    >>> def addDigits(s):
    ...     """假设s是字符串,其中每个字符都是十进制数。decimal digit. 返回s中所有数值之和"""
    ...     val = 0 
    ...     for c in s:
    ...             val += int(c)
    ...     return val
    ... 
    >>> addDigits('12345')
    15
    
    # 我们仍然假设表示数字的字符在常数时间内被转换为整数,那么这个函数的复杂度就与s的长度成线性关系,也就是O(len(s))。
    
    
    4、对数线性复杂度
    5、多项式复杂度
    >>> def isSubset(L1, L2):
    ...     """假设L1和L2是列表。
    ...     如果L1中的每个元素也在L2中出现,则返回True
    ...     否则返回False。"""
    ...     for e1 in L1:
    ...             matched = False
    ...             for e2 in L2:
    ...                     if e1 == e2:
    ...                             matched = True
    ...                             break
    ...             if not matched:
    ...                     return False
    ...     return True
    ... 
    >>> isSubset([1,2,3],[3])
    False
    >>> isSubset([1,2,3],[3,2,1,6,9])
    True
    >>> 
    """
    程序每次执行到内层循环时,内层循环都要执行O(len(L2))次。函数 isSubset 要执行外部循
    环O(len(L1))次,所以执行到内层循环的次数也是O(len(L1))。因此,函数 isSubset 的复杂度是
    O(len(L1))*O(len(L2))。
    """
    
    6、指数复杂度
    >>> def getBinaryRep(n, numDigits):
    ...     """
    ...     假设n和numDigits为非负整数
    ...     返回一个长度为numDigits的字符串,为n的二进制表示
    ...     """
    ...     result = ''
    ...     while n > 0:
    ...             result = str(n%2) + result
    ...             n = n//2
    ...     if len(result) > numDigits:
    ...             raise ValueError('not enough digits')
    ...     for i in range(numDigits - len(result)):
    ...             result = '0' + result
    ...     return result
    ... 
    >>> def genPowerset(L):
    ...     """
    ...     假设L是列表
    ...     返回一个列表,包含L中元素所有可能的集合。例如,如果L=[1, 2],则返回的列表包含元素[1]、[2]和[1,2]
    ...     """
    ...     powerset = []
    ...     for i in range(0, 2**len(L)):
    ...             binStr = getBinaryRep(i, len(L))
    ...             subset = []
    ...             for j in range(len(L)):
    ...                     if binStr[j] == '1':
    ...                             subset.append(L[j])
    ...             powerset.append(subset)
    ...     return powerset
    ... 
    >>> genPowerset(['x','y',1])
    [[], [1], ['y'], ['y', 1], ['x'], ['x', 1], ['x', 'y'], ['x', 'y', 1]]
    """
    函数 genPowerset(L) 具有指数复杂度,函数中调用getBinaryRep()函数。
    返回一个列表的列表,包含 L 中元素所有可能的组合。
    例如,如果 L 是['x', 'y'] ,那么 L 的幂集就是包含 [ ] 、 ['x'] 、 ['y'] 和 ['x', 'y'] 这些列表的列表。
    """
    

    一些简单算法和数据结构

    下面列出了一些最常用的大O表示法实例。 n表示函数的输入规模。
    1、O(1)表示常数运行时间。
    2、 O(logn)表示对数运行时间。
    3、O(n)表示线性运行时间。
    4、 O(nlogn)表示对数线性运行时间。
    5、 O(nk)表示多项式运行时间,注意k是常数。
    6、 O(cn)表示指数运行时间,这时常数c为底数,复杂度为c的n次方。

    简单算法及数据结构
    1、归并排序
    # 书中的这个例子,自己练习完后发现无输出,应该是哪里出现问题了。
    >>> def merge(left, right, compare):
    ...     """
    ...     假设left和right是两个有序列表,compare定义了一种元素排序规则。
    ...     返回一个新的有序列表(按照compare定义的顺序),其中包含与
    ...     (left+right)相同的元素。"""
    ...     result = []
    ...     i,j = 0, 0
    ...     while i < len(left) and j < len(right):
    ...             if compare(left[i], right[j]):
    ...                     result.append(left[i])
    ...                     i += 1
    ...             else:
    ...                     result.append(right[j])
    ...     j += 1
    ...     while (i < len(left)):
    ...             result.append(left[i])
    ...             i += 1
    ...     while (j < len(right)):
    ...             result.append(right[j])
    ...             j += 1
    ...     return result
    ... 
    >>> def mergeSort(L, compare = lambda x, y: x < y):
    ...     """
    ...     假设L是列表,compare定义了L中元素的排序规则
    ...     on elements of L
    ...     返回一个新的具有L中相同元素的有序列表。"""
    ...     if len(L) < 2:
    ...             return L[:]
    ...     else:
    ...             middle = len(L)//2
    ...             left = mergeSort(L[:middle], compare)
    ...             right = mergeSort(L[middle:], compare)
    ...             return merge(left, right, compare)
    
    
    2、将函数用作参数
    >>> def lastNameFirstName(name1, name2):
    ...     arg1 = name1.split(' ')
    ...     arg2 = name2.split(' ')
    ...     if arg1[1] != arg2[1]:
    ...             return arg1[1] < arg2[1]
    ...     else: #姓相同,则按照名排序
    ...             return arg1[0] < arg2[0]
    ... 
    >>> def firstNameLastName(name1, name2):
    ...     arg1 = name1.split(' ')
    ...     arg2 = name2.split(' ')
    ...     if arg1[0] != arg2[0]:
    ...             return arg1[0] < arg2[0]
    ...     else: #名相同,则按照姓排序
    ...             return arg1[1] < arg2[1]
    ... 
    >>> L = ['Tom Brady', 'Eric Grimson', 'Gisele Bundchen']
    >>> newL = mergeSort(L, lastNameFirstName)
    print('Sorted by last name =', newL)
    
    # 也是按照书中的例子输入完之后,并没有输出。也应该是哪里有问题,可能是版本问题。
    
    3、python中的排序
    >>> L = [3,5,2]
    >>> L
    [3, 5, 2]
    >>> sorted(L)
    [2, 3, 5]
    >>> D = {'a':12,'c':5,'b':'dog'}
    >>> L.sort()
    >>> print(L)
    [2, 3, 5]
    >>> L
    [2, 3, 5]
    >>> sorted(D)
    ['a', 'b', 'c']
    >>> D.sort()
    Traceback (most recent call last):
      File "<stdin>", line 1, in <module>
    AttributeError: 'dict' object has no attribute 'sort'
    
    

    视频中的一些练习

    对列表进行升序排序
    In [27]: def swapSort(L): 
        ...:     """ L is a list on integers """
        ...:     print ("Original L: ", L)
        ...:     for i in range(len(L)):
        ...:         for j in range(i+1, len(L)):
        ...:             if L[j] < L[i]:
        ...:                 # the next line is a short 
        ...:                 # form for swap L[i] and L[j]
        ...:                 L[j], L[i] = L[i], L[j] 
        ...:                 print (L)
        ...:     print ("Final L: ", L)
        ...:     
    
    In [28]: L = [3,4,1,2,9,8]
    
    In [30]: swapSort(L)
    Original L:  [3, 4, 1, 2, 9, 8]
    [1, 4, 3, 2, 9, 8]
    [1, 3, 4, 2, 9, 8]
    [1, 2, 4, 3, 9, 8]
    [1, 2, 3, 4, 9, 8]
    [1, 2, 3, 4, 8, 9]
    Final L:  [1, 2, 3, 4, 8, 9]
    
    变为降序排序

    注意与上面进行区分,以及复杂度之间的变化

    In [31]: def modSort(L): 
        ...:     """ L is a list on integers """
        ...:     print ("Original L: ", L)
        ...:     for i in range(len(L)):
        ...:         for j in range(len(L)):  #与上面的代码相比,这里进行一下变更,
        ...:             if L[j] < L[i]:
        ...:                 # the next line is a short 
        ...:                 # form for swap L[i] and L[j]
        ...:                 L[j], L[i] = L[i], L[j] 
        ...:                 print (L)
        ...:     print ("Final L: ", L)
        ...:     
    
    In [32]: modSort(L)
    Original L:  [1, 2, 3, 4, 8, 9]
    [2, 1, 3, 4, 8, 9]
    [3, 1, 2, 4, 8, 9]
    [3, 2, 1, 4, 8, 9]
    [4, 2, 1, 3, 8, 9]
    [4, 3, 1, 2, 8, 9]
    [4, 3, 2, 1, 8, 9]
    [8, 3, 2, 1, 4, 9]
    [8, 4, 2, 1, 3, 9]
    [8, 4, 3, 1, 2, 9]
    [8, 4, 3, 2, 1, 9]
    [9, 4, 3, 2, 1, 8]
    [9, 8, 3, 2, 1, 4]
    [9, 8, 4, 2, 1, 3]
    [9, 8, 4, 3, 1, 2]
    [9, 8, 4, 3, 2, 1]
    Final L:  [9, 8, 4, 3, 2, 1]
    
    

    第10讲 内存和查找

    L10 PROBLEM 4
    
    In [16]: def search(L, e):
        ...:     for i in range(len(L)):
        ...:         if L[i] == e:
        ...:             return True
        ...:         if L[i] > e:
        ...:             return False
        ...:     return False
        ...: 
    
    In [17]: def search3(L, e):
        ...:     if L[0] == e:
        ...:         return True
        ...:     elif L[0] > e:
        ...:         return False
        ...:     else:
        ...:         return search3(L[1:], e)
    
    答案给的是:
    search and search3 return the same answers provided L is non-empty and e is in L
    
    实际上下面这样输出结果也是一致的
    In [18]: search([2,3,4,8],5)
    Out[18]: False
    
    In [19]: search3([2,3,4,8],5)
    Out[19]: False
    
    

    参考链接:
    计算机科学和Python编程导论

    相关文章

      网友评论

          本文标题:计算机科学和Python编程导论week5

          本文链接:https://www.haomeiwen.com/subject/wxkemftx.html