GCIセミナーでpythonで大規模データを扱えるPySparkの存在を知りました。 環境構築は各自挑戦とのことでしたので、やってみたところ、うまくいったのでまとめます。 前提は以下のとおりです。 ・ローカル環境での構築には成功したが、Anacondaなどの仮想環境…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。