您的位置:首页 > 娱乐 > 八卦 > 天津网站建设公司最好_如何打开网站根目录_淘宝seo优化是什么_百度seo收费

天津网站建设公司最好_如何打开网站根目录_淘宝seo优化是什么_百度seo收费

2025/4/11 2:04:30 来源:https://blog.csdn.net/m0_74035163/article/details/146308430  浏览:    关键词:天津网站建设公司最好_如何打开网站根目录_淘宝seo优化是什么_百度seo收费
天津网站建设公司最好_如何打开网站根目录_淘宝seo优化是什么_百度seo收费

官网下载spark

下载spark
在这里插入图片描述
解压就好

本地配置环境变量

配置环境变量(系统环境变量)

  1. 新增 SPARK_HOME
    变量名:SPARK_HOME
    变量值:F:\class\spark\Spark_env\spark-3.4.4-bin-hadoop3
    配置 PATH,新增如下:

%SPARK_HOME%\bin

创建虚拟环境

conda create -n spark python=3.10
激活虚拟环境
conda activate spark
然后在spark环境下安装 pyspark
然后运行下面的python代码就跑通了

import os
from pyspark.sql import SparkSession# 设置 PYSPARK_PYTHON 和 PYSPARK_DRIVER_PYTHON 为当前环境的 Python 路径
os.environ['PYSPARK_PYTHON'] = r'E:\download_ware\conda\envs\spark\python.exe'
os.environ['PYSPARK_DRIVER_PYTHON'] = r'E:\download_ware\conda\envs\spark\python.exe'# 创建 Spark 会话
spark = SparkSession.builder \.appName("Simple App") \.config("spark.sql.shuffle.partitions", "4") \.config("spark.default.parallelism", "4") \.getOrCreate()# 设置日志级别
spark.sparkContext.setLogLevel("DEBUG")# 打印日志信息,确认 Spark 会话已经成功创建
print("Spark session created successfully!")# 创建一个简单的 DataFrame
data = [("Alice", 1), ("Bob", 2), ("Cathy", 3)]
columns = ["Name", "Value"]df = spark.createDataFrame(data, columns)# 显示 DataFrame 内容
print("Displaying DataFrame:")
df.show()# 关闭 Spark 会话
spark.stop()

显示如下就是成功了
在这里插入图片描述

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com