案例
根据几个实际的应用案例来学会spark
中map、filter、take
等函数的使用
案例1
找出TOP5的值
- filter(func):筛选出符合条件的数据
- map(func):对传入数据执行func操作
- sortByKey():只能对键值对进行操作,默认是升序
1 | from pyspark import SparkConf, SparkContext |
文件全局排序
1 | from pyspark import SparkConf, SparkContext |
二次排序
1 | from operator import gt |