[問題] 投影尋蹤相關問題

作者: elegantnight (elegantnight)   2015-11-15 23:00:52
[問題類型]:
程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來)
不好意思打擾,我有個台灣去北京大學唸書的朋友,遇到一份需要使用R的作業,希望可以
請大家幫忙 >"< 他是第一次寫R的新手,完全不知道該怎麼處理,
所以希望可以得到一點建議或是方向,謝謝大家!
問題如下:
4. 探索性数据分析部分
在loan data中,自选合适的定量变量,通过投影寻踪来研究影响grade的因素。要求:
(1)指出你所选择的投影指标,并说明理由;
(2)给出投影向量,你是否能通过投影向量说明哪些变量对grade的影响比较大?
(3)在投影结果中,对不同grade的样本点进行染色,说明投影结果是否能够反应grade变量的分组情况
(4)数据中是否存在特异点?如果有,请指出来。
會需要用到REPPlab中的函數
3. 统计制图部分
在loan data中,自选合适的变量,绘制以下图形:
(1)分面的风玫瑰图,玫瑰叶片的颜色至少三种;
(2)某一个连续型变量的分布直方图,并加入拟合分布线,直方图的组距和组数自己设定
(不要使用默认的),并且每个柱子里面填上相应的组的频数,整个图片加上一个蓝色的
外框,并且图的底色为深色,柱子为浅色;
(3)某两个连续型变量的密度图,并且在图中找出一个部分加上一个方框与其他部分区
别开来(比如说,密度最高或者最低的区域,用一个矩形的方框加以标示);
(4)挑选多个连续型变量,进行聚类,并且绘制相应的热图(可以不用全部样本)。
要求:以上所有图表都要求有图表名称、图例、行标题、列标题等要素。
data 如下:https://www.dropbox.com/s/t7madvx8dmj4ai6/LoanStats3d.csv.zip?dl=0
因為我也完全不會R,但是朋友希望我可以幫他問問看,如果有不洽當的地方,
再麻煩跟我說,我會自己刪文,拜託大家了,謝謝! >"<
作者: Wush978 (拒看低質媒體)   2015-11-15 23:22:00
請建議你朋友把R 學起來之後再嘗試看看。可以參考置底也歡迎試試看我最近寫的教材:https://github.com/wush978/DataScienceAndR
作者: elegantnight (elegantnight)   2015-11-15 23:49:00
謝謝W大,但是因為她明天就得交,所以還是希望得到一些方向的建議 >"<
作者: Wush978 (拒看低質媒體)   2015-11-16 01:13:00
對於完全不懂R 的新手,我覺得除了學R 以外的建議都多餘

Links booklink

Contact Us: admin [ a t ] ucptt.com