pyspark对mongo数据库的基本操作 (๑• . •๑)
|
|
有几点需要注意的:
- 不要安装最新的pyspark版本,请安装
pip3 install pyspark==2.3.2
spark-connector
与平常的MongoDB写法不同,格式是:mongodb://127.0.0.1:database.collection
- 如果计算数据量比较大,你的电脑可能会比较卡,^_^
|
|
完整代码地址:spark_count_diff_uid.py
人生苦短,我学Python
pyspark对mongo数据库的基本操作 (๑• . •๑)
|
|
有几点需要注意的:
pip3 install pyspark==2.3.2
spark-connector
与平常的MongoDB写法不同,格式是:mongodb://127.0.0.1:database.collection
|
|
完整代码地址:spark_count_diff_uid.py