Filtrer
Rayons
Support
Éditeurs
Langues
Prix
Edp Sciences
-
Régression avec R
Pierre-andré Cornillon, Nicolas Hengartner, Eric Matzner-lober, Laurent Rouvière
- EDP Sciences
- Pratique R
- 11 Mai 2023
- 9782759831456
Cet ouvrage expose de manière détaillée, exemples à l'appui, différentes façons de répondre à un des problèmes statistiques les plus courants : la régression. Cette nouvelle édition se décompose en cinq parties. La première donne les grands principes des régressions simple et multiple par moindres carrés. Les fondamentaux de la méthode, tant au niveau des choix opérés que des hypothèses et leur utilité, sont expliqués. La deuxième partie est consacrée à l'inférence et présente les outils permettant de vérifier les hypothèses mises en oeuvre. Les techniques d'analyse de la variance et de la covariance sont également présentées dans cette partie. Le cas de la grande dimension est ensuite abordé dans la troisième partie. Différentes méthodes de réduction de la dimension telles que la sélection de variables, les régressions sous contraintes (lasso, elasticnet ou ridge) et sur composantes (PLS ou PCR) sont notamment proposées. Un dernier chapitre propose des algorithmes, basés sur des méthodes de rééchantillonnage comme l'apprentissage/validation ou la validation croisée, qui permettent d'établir une comparaison entre toutes ces méthodes. La quatrième partie se concentre sur les modèles linéaires généralisés et plus particulièrement sur les régressions logistique et de Poisson avec ou sans technique de régularisation. Une section particulière est consacrée aux comparaisons de méthodes en classification supervisée. Elle introduit notamment des critères de performance pour scorer des individus comme les courbes ROC et lift et propose des stratégies de choix seuil (Younden, macro F1...) pour les classer. Ces notions sont ensuite mises en oeuvre sur des données réelles afin de sélectionner une méthode de prévision parmi plusieurs algorithmes basés sur des modèles logistiques (régularisés ou non). Une dernière section aborde le problème des données déséquilibrées qui est souvent rencontré en régression binaire. Enfin, la dernière partie présente l'approche non paramétrique à travers les splines, les estimateurs à noyau et des plus proches voisins. La présentation témoigne d'un réel souci pédagogique des auteurs qui bénéficient d'une expérience d'enseignement auprès de publics très variés. Les résultats exposés sont replacés dans la perspective de leur utilité pratique grâce à l'analyse d'exemples concrets. Les commandes permettant le traitement des exemples sous R figurent dans le corps du texte. Enfin, chaque chapitre est complété par une suite d'exercices corrigés. Les codes, les données et les corrections des exercices se trouvent sur le site https://regression-avec-r.github.io/ Cet ouvrage s'adresse principalement à des étudiants de Master et d'écoles d'ingénieurs ainsi qu'aux chercheurs travaillant dans les divers domaines des sciences appliquées
-
Réseaux bayésiens avec R
Jean-baptiste Denis, Marco Scutari
- EDP Sciences
- Pratique R
- 21 Novembre 2014
- 9782759811984
Un réseau bayésien est en informatique et en statistique un modèle graphique probabiliste. Ces réseaux sont surtout utilisés pour le diagnostic (médical et industriel), l'analyse de risques, la détection des spams et le data mining.
Le propos de cet ouvrage est double : (i) introduire le lecteur ayant un bagage (ou un usage) minimal en probabilité et statistique à la construction de réseaux bayésiens pour modéliser une situation concrète ; (ii) lui donner les moyens de le faire dans le cadre des paquets disponibles en R.
Les trois premiers chapitres présentent les caractéristiques basiques et communes aux réseaux bayésiens à partir d'exemples traités de bout en bout par l'appel détaillé de fonctions de R ou de paquets de R. A partir des éléments exposés sur les exemples, le chapitre 4 présente de manière intuitive la théorie générale sous-jacente. Le chapitre 5 passe en revue les différents softwares disponibles. Le chapitre 6 expose deux exemples d'application réels qu'ont traités personnellement chacun des deux auteurs.
-
Cet ouvrage couvre un programme complet de statistiques pour la licence de psychologie (L1 à L3), depuis les bases élémentaires de combinatoire et de probabilités jusqu'aux modèles élaborés permettant de mettre à l'épreuve des hypothèses psychologiques. Présentés à partir de données réelles, les modèles étudiés sont facilement applicables dans les champs divers de la psychologie (cognition,cognition sociale, développement de l'enfant, psychologie de la santé, psychologie du travail, psychocriminologie...). La mise en oeuvre pratique des procédures est développée dans des exercices types présentés en un format unique, de la définition du problème statistique à la conclusion psychologique.
La démarche adoptée par l'auteur est celle de la comparaison de modèles : chaque situation à modéliser fait d'abord l'objet d'hypothèses psychologiques, traduites sous forme de modèles de probabilités, au sein desquels on cherche le meilleur, en termes de qualité d'ajustement et de parcimonie. Cette démarche de sélection de modèle est illustrée aussi bien avec les outils fishériens traditionnels (la valeur p), qu'avec les outils les plus récents de la statistique bayésienne (le facteur de Bayes). Les dernières recommandations de l'American Psychological Association en matière d'analyse, notamment l'inférence directe sur les tailles d'effet, on été intégrées. à ce titre, l'ouvrage intéressera autant l'étudiant que le chercheur désireux de s'initier à ces nouveaux outils.
Deux librairies spécialisées pour R (R2STATS et AtelieR), librement téléchargeables en ligne et dotées d'une interface graphique, permettent de retrouver facilement tous les résultats numériques présentés dans les exemples.
-
Analyse factorielle multiple avec R
Jérôme Pagès
- EDP Sciences
- Pratique R
- 12 Septembre 2013
- 9782759809639
Ce type de tableau multiple est aujourd'hui le format des données le plus courant car les utilisateurs souhaitent toujours analyser conjointement plusieurs sources d'information. C'est le cas des enquêtes (les questionnaires comportent toujours plusieurs thèmes : des opinions, des comportements, etc.) mais aussi des données expérimentales (dans l'industrie agro-alimentaire, par exemple, on caractérise les produits à la fois par des données physico-chimiques et des données issues de dégustations).
Autre exemple : en écologie, on dispose classiquement de données biologiques (animaux, plantes) et environnementales. L'auteur détaille la marche à suivre pour appliquer la méthode AFM avec le package FactoMineR ; on commence par mettre en oeuvre l'AFM via un menu déroulant (dans R Commander) ; ensuite, on décrit les lignes de code pour obtenir des graphiques et des tableaux personnalisés. Ces codes sont disponibles sur le site du LMA (Agrocampus).
-
Régression avec R
Pierre-andré Cornillon, Nicolas Hengartner, Eric Matzner-Lober, Laurent Rouvière
- EDP Sciences
- Pratique R
- 7 Novembre 2019
- 9782759820764
Cet ouvrage expose en détail l'une des méthodes statistiques les plus courantes : la régression. Il concilie théorie et applications, en insistant notamment sur l'analyse de données réelles avec le logiciel R.
La présentation témoigne d'un réel souci pédagogique des auteurs qui bénéficient d'une expérience d'enseignement auprès de publics très variés. Les résultats exposés sont replacés dans la perspective de leur utilité pratique grâce à l'analyse d'exemples concrets. Les commandes permettant le traitement des exemples sous le logiciel R figurent dans le corps du texte.
Chaque chapitre est complété par une suite d'exercices corrigés.
Le niveau mathématique requis rend ce livre accessible aux élèves ingénieurs, aux étudiants de niveau Master et aux chercheurs actifs dans divers domaines des sciences appliquées.
-
Calcul parallèle avec R
Vincent Miele, Violaine Louvet
- EDP Sciences
- Pratique R
- 25 Juin 2016
- 9782759820603
L'évolution des architectures des ordinateurs, mais aussi celle des besoins relatifs au volume de données ou à la complexification des algorithmes sont un véritable défi pour les utilisateurs et développeurs R. Il faut nécessairement s'adapter au parallélisme intrinsèque des ordinateurs, et cet ouvrage a pour objectif principal d'initier ses lecteurs aux multiples facettes du calcul parallèle avec R. Le premier chapitre pose la problématique de l'efficacité des programmes et de leur optimisation en abordant en particulier les bonnes pratiques à adopter pour améliorer son code. L'architecture des ordinateurs est détaillée dans le deuxième chapitre qui permet de comprendre l'impact du matériel sur les performances des programmes et qui invite à penser « parallèle ». Les chapitres 3 et 4 sont le coeur de cet ouvrage et détaillent les outils disponibles pour programmer efficacement avec R sur une machine multi-coeurs, d'une part nativement dans le langage R et d'autre part en utilisant des fonctions C++ appelées depuis R. Enfin le dernier chapitre aborde l'exploitation de clusters de calcul au travers de R..
-
Régression avec Python
Pierre-André Cornillon, Eric Matzner-Løber, Laurent Rouvière
- EDP Sciences
- Pratique R
- 15 Mai 2025
- 9782759824328
Unique ouvrage en français dédié à la régression et ses implémentations en python Cet ouvrage expose en détail l'une des méthodes statistiques les plus courantes : la régression. Il concilie théorie et applications, en insistant notamment sur l'analyse de données réelles dans le langage python. La présentation témoigne d'un réel souci pédagogique des auteurs qui bénéficient d'une expérience d'enseignement auprès de publics très variés. Les résultats exposés sont replacés dans la perspective de leur utilité pratique grâce à l'analyse d'exemples concrets. Les commandes permettant le traitement des exemples en langage python figurent dans le corps du texte. Chaque chapitre est complété par une suite d'exercices corrigés. Le niveau mathématique requis rend ce livre accessible aux élèves ingénieurs, aux étudiants de niveau Master et aux chercheurs actifs dans divers domaines des sciences appliquées.
-
Ce livre étudie sous un angle original le concept de « série temporelle », dont la complexité théorique et l'utilisation sont souvent source de difficultés. La théorie distingue par exemple les notions de séries « stationnaire » et « non stationnaire », mais il n'est pas rare de pouvoir modéliser une série par deux modèles incompatibles. De plus, un peu d'intimité avec les séries montre qu'on peut s'appuyer sur des graphiques variés pour en comprendre assez rapidement la structure, avant toute modélisation.
Ainsi, au lieu d'étudier des méthodes de modélisation, puis de les illustrer, l'auteur prend ici le parti de s'intéresser à un nombre limité de séries afin de trouver ce qu'on peut dire de chacune.
Avant d'aborder ces études de cas, il procède à quelques rappels et présente les graphiques pour séries temporelles générées avec R. Il revient ensuite sur des notions fondamentales de statistique mathématique, puis révise les concepts et les modèles classiques de séries. Il présente les structures de séries temporelles dans R et leur importation. Il revisite le lissage exponentiel à la lumière des travaux les plus récents. Un chapitre est consacré à la simulation.
Sept séries sont ensuite étudiées en confrontant plusieurs approches.