Apache Spark 환경 설정

Hadoop

Apache Spark 환경 설정

PON_Z 2022. 12. 26. 15:54

1. Anaconda (Python + Jupyter Notebook)

2. Java (19.0.1)

3. Spark (spark-3.2.3-bin-hadoop2.7)

=> 다운로드 후 로컬디스크 C에서 Spark 폴더를 만든 후 압축 해제

pip install pyspark==3.2.3

4. Hadoop

=> 2.7.7 다운 후 bin 폴더를 복사해 로컬디스크 C에 Hadoop 폴더를 만든 후 붙여넣기

5. PySpark

Anaconda Prompt에서pip install pyspark==3.2.3

6. 환경변수 편집 (java, hadoop, spark)

=> PYSPARK_PYTHON은 anaconda 창에서 where pip 후 나오는 경로 입력

728x90

'Hadoop' 카테고리의 다른 글

Spark Dataframe Tips (1)	2023.03.23
Hadoop Ecosystem 정리 #2 (Spark) (0)	2023.01.10
Hadoop Ecosystem 정리 #1 (0)	2022.12.20

현재글Apache Spark 환경 설정

지나가던 컴공생

안녕하세요 지나가던 컴공생입니다. 계속 지나가겠습니다 (_ _)

이더리움, 블록체인, server, dapp, CS, blockchain, Docker, HADOOP, k8s, spark, kubenetes, PYTHON, 프로그래머스, web, programmers, AWS, Ethereum, 환경설치, NFT, elasticsearchelasticsearch,

Today :
Yesterday :

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

지나가던 컴공생