Re: [分享] sparklyr

作者: pk790127 (<>)   2016-11-24 22:59:51
※ 引述《celestialgod (天)》之銘言:
: [關鍵字]: sparklyr
: [出處]: http://spark.rstudio.com/index.html
: [重點摘要]:
: 煩請移駕到我的部落格觀看:http://goo.gl/SSor3y
: 最近花了點時間研究Spark
: 終於研究到了一個段落
: 回來研究一下自己最愛的R
: 而且又看到rstudio釋出了sparklyr就手癢想說試試看了
: 於是就有這篇心得了XD
: 只是我還沒去測試machine learning相關的東西
: 就留給其他人慢慢賞玩了
感謝celestialgod大大 無私分享這個關於spark的套件
小弟目前著手研究這個套件,並搭配出處原文參考
但是在安裝的時候發現了一些問題
例如說是
Error:
To run Spark on Windows you need a copy of Hadoop winutils.exe:
1. Download Hadoop winutils.exe from:
2. Copy winutils.exe to
C:\Users\XXXXXX
這個問題網路上問的人蠻多的,只要將winutils放入指定路徑即可
但是衍生成別的問題 就找不到解法,想請教大大
問題如下:
> library(sparklyr)
> sc <- spark_connect(master = "local")
Error in start_shell(master = master, spark_home = spark_home, spark_version
= version, :
Failed to launch Spark shell. Ports file does not exist.
Path: C:\spark-2.0.0-bin-hadoop2.7\bin\spark-submit.cmd
Parameters:
作者: pk790127 (<>)   2016-11-24 23:04:00
備註 我是只要在local端執行運算即可
作者: celestialgod (天)   2016-11-24 23:11:00
你可以試試看直接用最新版的rstudio + sparklyr就好不要自己設置HADOOP跟SPARK路徑用sparklyr的install_spark成功機率應該會比較高很多自己設定的東西 跑掉是不好找的(攤手除非你真的對R, 系統, Spark都很熟
作者: clansoda (小笨)   2016-11-24 23:13:00
對 sparlyr已經建在rstudio上了,只要你有安裝sparklyr他就會跟git一樣出現在environment那邊,很容易可以使用
作者: celestialgod (天)   2016-11-24 23:14:00
在linux玩這個套件還是我最推薦的方式拉(攤手windows = 浪費時間現在架一個,用rstudio server不用太久/vm
作者: Edster (Edster)   2016-11-25 02:18:00
真的windows=浪費時間,我今天花一天時間處理big5跟unicod混用的檔名,在windows下真的很討厭。看來該要跳槽linux了
作者: andrew43 (討厭有好心推文後刪文者)   2016-11-25 04:01:00
急的話用virtualbox安裝個順手熱門的linux distro吧
作者: pk790127 (<>)   2016-11-26 15:14:00
感謝各位的回覆 問題可能傾向板本問題

Links booklink

Contact Us: admin [ a t ] ucptt.com