想处理的问题是:统计一个单词相邻前后两位的数量,如有w1,w2,w3,w4,w5,w6,则:
概述 Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop实现了一个分布式文件系统(Hadoop Distributed ...
range()是一个内置函数,它返回一个数字序列,功能和Linux下的seq命令差不多。
基础版:https://tech.meituan.com/2016/04/29/spark-tuning-basic.html
map()函数接收两个参数,一个是函数,一个是Iterable,map将传入的函数依次作用到序列的每个元素,并把结果作为新的Iterator返回。
高阶函数:简单来讲,一个函数可以接收另一个函数来作为参数,这样的函数称之为高阶函数
迭代相关iter(): 将一个序列转换成迭代器next(): 自动调用对象的__next__()方法来迭代对象map(): 将一个序列值作为参数,依次调用一个函数,在python2中直接返回列表,但在python3中返回迭代器# map经常配合lambdas来使用i...
建一个K个数的最小堆,与堆顶比较,大于(等于)堆顶,依次插入堆,超过K个数,踢出堆顶
装饰器:装饰器的实质就是一个闭包,而闭包又是嵌套函数的一种。所以也可以理解装饰器是一种特殊的函数。因为程序一般都遵守开放封闭原则,软件在设计初期不可能把所有情况都想到,所以一般软件都支持功能上的扩展,而对源代码...
3.函数可以当作一个值赋值给一个变量 例:a=myprint() a()