tag:blogger.com,1999:blog-486244449122404425.post7964566939166410947..comments2024-03-08T11:56:03.801+08:00Comments on 数据科学中的R和Python: 决策树之三国争霸写长城的诗http://www.blogger.com/profile/00652199274036685555noreply@blogger.comBlogger15125tag:blogger.com,1999:blog-486244449122404425.post-16911473457407527552013-03-06T20:32:45.923+08:002013-03-06T20:32:45.923+08:00data <- data.frame(c50=rate.c,rpart=rate.r,part...data <- data.frame(c50=rate.c,rpart=rate.r,party=rate.p)<br />data.melt <- melt(data)<br />这段代码中的data已经包含了三组100个数值,为什么需要用melt呢?如果不用reshape的话结果也是一样的吧?Anonymoushttps://www.blogger.com/profile/01800747524908650670noreply@blogger.comtag:blogger.com,1999:blog-486244449122404425.post-42482150292786369932013-02-04T08:32:26.929+08:002013-02-04T08:32:26.929+08:00我是懒人啊,因为用到sample,所以没加set.seed是会造成每次结果不一样。你自己加一个也行。...我是懒人啊,因为用到sample,所以没加set.seed是会造成每次结果不一样。你自己加一个也行。写长城的诗https://www.blogger.com/profile/00652199274036685555noreply@blogger.comtag:blogger.com,1999:blog-486244449122404425.post-84687300044487882812013-02-04T06:45:14.081+08:002013-02-04T06:45:14.081+08:00博主,我的问题每次都很低级啊:您这个代码不需要set.seed吗?那么是不是每次运行的结果可能会不同...博主,我的问题每次都很低级啊:您这个代码不需要set.seed吗?那么是不是每次运行的结果可能会不同?谢谢啦!Anonymoushttps://www.blogger.com/profile/01800747524908650670noreply@blogger.comtag:blogger.com,1999:blog-486244449122404425.post-72999514149432148712013-01-15T11:37:59.683+08:002013-01-15T11:37:59.683+08:00这个不是绝对的平均,不过也差不多,也可以保证每个观测值都被检验。这个不是绝对的平均,不过也差不多,也可以保证每个观测值都被检验。写长城的诗https://www.blogger.com/profile/00652199274036685555noreply@blogger.comtag:blogger.com,1999:blog-486244449122404425.post-1479362440118109032013-01-13T21:32:25.425+08:002013-01-13T21:32:25.425+08:00写错了,是‘十个’,另外如果不是平均随机分配的话,是不是就不能保证每一个观测值都被检验一次了?写错了,是‘十个’,另外如果不是平均随机分配的话,是不是就不能保证每一个观测值都被检验一次了?Anonymoushttps://www.blogger.com/profile/01800747524908650670noreply@blogger.comtag:blogger.com,1999:blog-486244449122404425.post-90236984320080078512013-01-13T21:26:45.115+08:002013-01-13T21:26:45.115+08:00num <- sample(1:10,nrow(churnTrain),replace=T)
...num <- sample(1:10,nrow(churnTrain),replace=T)<br /><br />这个不是平均分配吧?做检验时候分成是个子集是否需要平均分配呢?Anonymoushttps://www.blogger.com/profile/01800747524908650670noreply@blogger.comtag:blogger.com,1999:blog-486244449122404425.post-69680923734337730122013-01-04T22:36:02.204+08:002013-01-04T22:36:02.204+08:00分类方法不用NMSE,回归才会用到。分类方法就是用混淆矩阵分类方法不用NMSE,回归才会用到。分类方法就是用混淆矩阵写长城的诗https://www.blogger.com/profile/00652199274036685555noreply@blogger.comtag:blogger.com,1999:blog-486244449122404425.post-5224645181303018222013-01-04T00:55:49.780+08:002013-01-04T00:55:49.780+08:00博主,您的这个‘预测准确度’是怎么计算的?为什么不用NMSE呢?谢谢!博主,您的这个‘预测准确度’是怎么计算的?为什么不用NMSE呢?谢谢!Anonymoushttps://www.blogger.com/profile/01800747524908650670noreply@blogger.comtag:blogger.com,1999:blog-486244449122404425.post-18012425446839696602012-12-04T16:55:37.605+08:002012-12-04T16:55:37.605+08:00原来这样,既然你都没有比较直接的了,那我只能试试我通常的笨办法,看draw.tree之类函数的输入参...原来这样,既然你都没有比较直接的了,那我只能试试我通常的笨办法,看draw.tree之类函数的输入参数,改写C5.0的结果变成一个符合draw.tree的输入参数。Anonymousnoreply@blogger.comtag:blogger.com,1999:blog-486244449122404425.post-3134603416574142142012-12-04T15:51:58.158+08:002012-12-04T15:51:58.158+08:00或许可以自己编写个函数,估计有点困难的或许可以自己编写个函数,估计有点困难的写长城的诗https://www.blogger.com/profile/00652199274036685555noreply@blogger.comtag:blogger.com,1999:blog-486244449122404425.post-5715018992910204752012-12-04T15:06:14.086+08:002012-12-04T15:06:14.086+08:00也没有别的办法可视化了吗也没有别的办法可视化了吗Anonymousnoreply@blogger.comtag:blogger.com,1999:blog-486244449122404425.post-77825717374293717542012-12-04T11:23:42.795+08:002012-12-04T11:23:42.795+08:00它这个包没提供画图函数它这个包没提供画图函数写长城的诗https://www.blogger.com/profile/00652199274036685555noreply@blogger.comtag:blogger.com,1999:blog-486244449122404425.post-21439773335780925662012-12-04T10:45:13.785+08:002012-12-04T10:45:13.785+08:00C5.0为什么不能用plot作图呢?谢谢博主指教!(要求填的资料我都没有啊,只好匿名了)C5.0为什么不能用plot作图呢?谢谢博主指教!(要求填的资料我都没有啊,只好匿名了)Anonymousnoreply@blogger.comtag:blogger.com,1999:blog-486244449122404425.post-80477296231891661152012-11-29T20:16:46.000+08:002012-11-29T20:16:46.000+08:00人民邮电出的数据挖掘导论入门很好人民邮电出的数据挖掘导论入门很好写长城的诗https://www.blogger.com/profile/00652199274036685555noreply@blogger.comtag:blogger.com,1999:blog-486244449122404425.post-28555922381374701072012-11-29T16:57:24.127+08:002012-11-29T16:57:24.127+08:00决策树和随机森林也可以用来做预测模型?能推荐本基础的书吗?谢谢博主!决策树和随机森林也可以用来做预测模型?能推荐本基础的书吗?谢谢博主!Anonymoushttps://www.blogger.com/profile/01800747524908650670noreply@blogger.com