🔥 Apache Spark (스파크)빅데이터 분산 처리 프레임워크로, 대량의 데이터를 빠르게 처리하는 데 사용됨.메모리 기반 연산을 활용하여 기존 하둡(Hadoop)보다 빠른 데이터 처리 가능.PySpark(Python 기반 Spark API) 같은 인터페이스를 제공하여, 데이터 분석 및 머신러닝 작업에 활용됨.클러스터 환경에서 동작하며, 여러 노드(서버)에서 데이터를 병렬로 처리함.🐧 Linux (리눅스)스파크는 리눅스 기반 서버에서 실행되는 경우가 많음.리눅스는 분산 컴퓨팅 환경에서 안정성과 성능이 뛰어남.Spark의 설치, 실행, 배포(예: 클러스터 관리) 과정에서 리눅스 명령어와 쉘 스크립트(Bash, Zsh 등)가 필수적으로 활용됨.☁ AWS (Amazon Web Services)AWS는 스..