Je le reconnais,les deux derniers morceauxétaientcostauds! Je suispeut-êtrerentrétrop dans lesdétails。 倒入单元杯,我要集中精力!

最高法院常务法官联合法庭(前卫司法行政官)。
Vous vous en doutez,nous allons utiliser des“ Trees ”,以及适用于任何方法的分类和回归树(CART) 。
Pourquoi une Nouvelle methode?
Pourquoi ne passe limiteràune gression logisticique? Dans unerégressionlogisticique,lesrésultatssont engénéralpeuinterprétables:系数不存在变量和变量,主要目的是简化注释。 Avec laméthode的CART, Lesrésultatssont beaucoup 以及expliquer等的简单性和前提条件是,可能会发生 linéaireentre la sortie et lesentrées的关系 ,而auce que nous avons fait jusquelà的冲突。
CART —分类树和回归树
倒入法治法院的指导原则。 Est-ce qu’il va拒绝器(= 1)确认者是否正确(= 0)?
例如,请在rien de tel qu’un的Arber et laméthodeCART商店中倒酒。 Prenons lesdonnéesci-dessous:

Apriori,在linéaireentre X et Y.的关系评估中。

常见问题解答是例外,是一项非常出色的实践。 Avec le Split 1,ilpréditrouge(sur la gauche)。 斯普利特2号大街和斯普利特3号大街,斯普利特格里斯。 Vous avez compris l’idée,非? Noévenons deréalisernotremodèle。 Affichons-le sous forme d’arbre:

查特·德·乌尔德的亲戚和条件的继承人,《刑法》的永久性原则。
Mais pourquoi dans l’exempleprécédent,avons-nous choisi que 3 splits? Pourquoi pas plus? Pourquoi pas moins吗?
特雷斯·邦恩(Trèsbonne)的问题! 恩·R ················································································· Encore une fois,d’équilibre问题:
- 过度拟合和复杂络合剂的快速化
- s’il n’y en a pas assez,lemodèlesera trop s la et et laprécisiondécevante
##得到一些R
普通法通行证通行证:
stevens = read.csv("stevens.csv")
str(stevens)
不要发表意见:

分割我们的数据
Commeprécédemment,nous allonsgénérerdeux数据集:测试和测试:

Nous allons avoir besoin d’un paquetsupplémenaire: rpart 。 安装install.packages("rpart") : install.packages("rpart")
Puis,nous pouvons construire notremodèle:
StevensTree= rpart(Reverse ~ Circuit + Issue + Petitioner + Respondent + LowerCourt + Unconst, data=Train, method="class", minbucket=25)
回归法律和逻辑后的模棱两可。 倒入辅助设备,命令工具prp(StevensTree) :

方便,n’est-ce pas? Mais surtout,beaucoup以及简单的qu’une gression et et sessésééééééééçéçééééééééééééééééééééné(détedans leproblème相当,请确保一切!)。
让我们预言
巴黎圣母院密码:
PredictCart = predict(StevensTree, newdata=Test, type="class")
table(test$Reverse, PredictCart)

巴黎圣母院模型(41 + 71)/(41 + 36 + 22 + 71) = 0.6588 65.9%。
回归模型后的预测精度为66.5%,而基线模型 (分类后加上后继的概率)约为54.7%
巴黎圣母院模型与功效模型基线以及后勤保障后勤保障。 首席辩护律师Dans soninterprétabilité (注意, mas masculin non-reconnu par Larousse) 。
#随机森林
倒入CART的“精益求精”杂志,并发明一项发明:《 随机森林》 。
最简单的方法是:在Notproproblème街上玩耍,并在随随便便投票的选民查库尔·德·阿尔伯雷斯·拉·科雷蒂·普雷迪尔。
往阿尔伯雷河畔查尔·德·德·埃斯特雷纳·德·科普·阿尔伯特·阿尔贝雷·德·阿尔贝雷特
例如,在5个sos-embles中,notre构成的套子:1-2–3–4–5。 最高级的综合性博物馆:24521。优秀的综合性公寓:23513。套房…套房。 香格里拉突袭者之声再加上重要的诺贝尔之声大选。
Néanmoinslemodèlese complexifie et a besoin d’un peu plus de resourcespourêtregénéré。
##得到一些R
En R,实用程序可用于 RandomForest randomForest 。 巴黎圣母院模型:
StevensForest = randomForest(Reverse ~ Circuit + Issue + Petitioner + Respondent + LowerCourt + Unconst, data=Train, nodesize=25, ntree=200)
倒入莫代尔,200阿尔布斯! Çaestestécolo!
C’est l’heure desprédictions:
PredictForest = predict(StevensForest, newdata=Test)
table(Test$Reverse, PredictForest)
依依关系混淆矩阵 :

(40 + 74)/(40 + 37 + 19 + 74) = 0.671观察数(40 + 74)/(40 + 37 + 19 + 74) = 0.671 ,占67.1%,这是基于自来水模型的。
#K折交叉验证
您可以在[Nous l’avons vu plus haut]上倒入CART nous minbucket 。 迈斯评论放任? 评论prendre la valeur la plusadéquatepour obtenir lemodèlele plusprécis吗?
倒入c, 交叉使用验证 。
法语国家高级培训班 (第5课),法治巴黎和高级党派:

派对套房等:

一个特别的纪念活动,示范参数活动特别小组观察员:

Nous nous rendons可以完成au risque de chuter的所有参数设置。 De lamêmemanière,il ne doitpasêtretrop petit。 可以在折叠上进行运动,并进行观察:

最佳价格6。
复杂度参数和估计值
##得到一些R
倒入calc ce cp en R,nous installons deux nouveaux paquets: caret et e1071 。 紧急情况指挥部现场调查:
numFolds = trainControl(method="cv", number=10)
cpGrid = expand.grid(.cp=seq(0.01, 0.5, 0.01))
Ici,nousdéfinissonscombien de folds nous voulons:10。Puis nousdéfinissonsles valeurs de cp que nous souhaitons测试器:de 0.01à0.5 avec un pas de 0.01。
Nous passons doncànotre 交叉验证 :
train(Reverse ~ Circuit + Issue + Petitioner + Respondent + LowerCourt + Unconst, data=Train, method="rpart", trControl=numFolds, tuneGrid=cpGrid)
暂无报名资格 Vous devriez voir装置套件:
The final value used for the model was cp = 0.18 .
维护人员,购物车型号:
StevensTreeCV = rpart(Reverse ~ Circuit + Issue + Petitioner + Respondent + LowerCourt + Unconst, data=Train, method="class", cp=0.18)
影响原则:
PredictCV = predict(StevensTreeCV, newdata=Test, type="class")
关于维护者Notre 混淆矩阵 :

普通模范量的76.4%,高级模范量的65.9%对比
Avec la Cross-Validation,有关参数的保证。