pyspark之textFile和parallelize对应的分区数目

2020-08-26 09:56:26 浏览数 (1)

textFile:

defaultParallelism=max(totalCoreCount,2)

min(defaultParallelism,2)

parallelize:

max(totalCoreCount,2)

假设是4核的,那么:

对于textFile:

defaultParallelism=max(4,2)=4

  分区数=min(defaultParallelism,2)=2

对于parallelize:

  分区数=max(4,2)=4

0 人点赞