Artwork

Marc Sanselme and Marc Sanselme - Scopeo - Agence d'Intelligence Artificielle에서 제공하는 콘텐츠입니다. 에피소드, 그래픽, 팟캐스트 설명을 포함한 모든 팟캐스트 콘텐츠는 Marc Sanselme and Marc Sanselme - Scopeo - Agence d'Intelligence Artificielle 또는 해당 팟캐스트 플랫폼 파트너가 직접 업로드하고 제공합니다. 누군가가 귀하의 허락 없이 귀하의 저작물을 사용하고 있다고 생각되는 경우 여기에 설명된 절차를 따르실 수 있습니다 https://ko.player.fm/legal.
Player FM -팟 캐스트 앱
Player FM 앱으로 오프라인으로 전환하세요!

Reinforcement Learning : un large champ d’applications industrielles - Thomas Lecat (Staff Research Engineer @ InstaDeep) #65

44:28
 
공유
 

Manage episode 427753009 series 3426234
Marc Sanselme and Marc Sanselme - Scopeo - Agence d'Intelligence Artificielle에서 제공하는 콘텐츠입니다. 에피소드, 그래픽, 팟캐스트 설명을 포함한 모든 팟캐스트 콘텐츠는 Marc Sanselme and Marc Sanselme - Scopeo - Agence d'Intelligence Artificielle 또는 해당 팟캐스트 플랫폼 파트너가 직접 업로드하고 제공합니다. 누군가가 귀하의 허락 없이 귀하의 저작물을 사용하고 있다고 생각되는 경우 여기에 설명된 절차를 따르실 수 있습니다 https://ko.player.fm/legal.

Thomas Lecat, Staff Research Engineer chez InstaDeep, est l'invité de l'épisode 65 de Data Driven 101.

Il nous plonge dans l'univers du Deep Reinforcement Learning, une technologie révolutionnaire pour l'optimisation industrielle.

Thomas nous parle de ses applications concrètes, de l'optimisation des réseaux électriques à la planification des transports, en passant par le routage des circuits imprimés. Il nous apprend que cette approche permet de résoudre des problèmes complexes avec une flexibilité et une performance accrues par rapport aux méthodes traditionnelles.

🔑 MOTS CLÉS
Deep Reinforcement Learning (DRL)
: Une sous-branche de l'intelligence artificielle où les algorithmes apprennent en interagissant avec leur environnement, optimisant les décisions prises en fonction des récompenses reçues.

Optimisation combinatoire : Un domaine des mathématiques appliquées dédié à la recherche des solutions optimales parmi un ensemble fini de solutions possibles, crucial dans la planification industrielle.

JAX : Une bibliothèque open-source de Google utilisée pour le calcul différentiable en Python, permettant l'optimisation et la parallélisation sur GPU, essentielle pour des simulations rapides et efficaces.

Evolutionary Algorithms (EA) : Une classe d'algorithmes inspirés de la théorie de l'évolution naturelle, utilisés en combinaison avec le reinforcement learning pour explorer de vastes espaces de solutions.

Policy Gradient Methods : Techniques de reinforcement learning qui optimisent directement la politique de prise de décision de l'agent, en fonction des gradients de récompense.

Soft Actor-Critic (SAC) : Un algorithme avancé de reinforcement learning qui combine les avantages de l'apprentissage par politiques stochastiques et déterministes pour une exploration efficace et une stabilité accrue.

🎙 SOUTENEZ LE PODCAST

> Abonnez-vous 🔔

> Laissez 5 étoiles et un avis 🥰

Sur Spotify : ici

Sur Apple Podcast : ici

Sur Deezer : ici

Sur Google Podcast : ici

🧐 DANS LA MÊME THÉMATIQUE

Épisode 23 : Hamza Tajmouati (Head of AI & Data @ Iktos ) : L’IA générative pour créer des médicaments

Épisode 59 : IA dans la consultation médicale - Samuel Humeau (Lead Machine Learning @ Nabla)

Épisode 52 : Météo, océan et climat : prédire et modéliser grâce à l’intelligence artificielle - Louis Thiry (chercheur @ INRIA)

👋 PLUS DE CONTENU DATA ?

> Suivez-moi sur LinkedIn (tips/réflexions) ici 🤳

> Suivez-nous sur Tiktok 📳

> Abonnez-vous à notre chaîne Youtube

🚀 BESOIN D’EXPERTISE IA & DATA ?

Scopeo vous accompagne de A à Z dans vos projets IA : découvrez nos solutions :

  • Diagnostic IA & Data : évaluation du potentiel de l'Intelligence Artificielle pour votre entreprise, compréhension de ce qui est réalisable avec les technologies actuelles, et mesure des risques et des opportunités associés à l'IA pour votre activité

  • IA sur mesure : création d'une Intelligence Artificielle sur mesure, adaptée à vos besoins spécifiques, développement et intégration des meilleures solutions sur mesure pour répondre à vos problématiques uniques

  continue reading

83 에피소드

Artwork
icon공유
 
Manage episode 427753009 series 3426234
Marc Sanselme and Marc Sanselme - Scopeo - Agence d'Intelligence Artificielle에서 제공하는 콘텐츠입니다. 에피소드, 그래픽, 팟캐스트 설명을 포함한 모든 팟캐스트 콘텐츠는 Marc Sanselme and Marc Sanselme - Scopeo - Agence d'Intelligence Artificielle 또는 해당 팟캐스트 플랫폼 파트너가 직접 업로드하고 제공합니다. 누군가가 귀하의 허락 없이 귀하의 저작물을 사용하고 있다고 생각되는 경우 여기에 설명된 절차를 따르실 수 있습니다 https://ko.player.fm/legal.

Thomas Lecat, Staff Research Engineer chez InstaDeep, est l'invité de l'épisode 65 de Data Driven 101.

Il nous plonge dans l'univers du Deep Reinforcement Learning, une technologie révolutionnaire pour l'optimisation industrielle.

Thomas nous parle de ses applications concrètes, de l'optimisation des réseaux électriques à la planification des transports, en passant par le routage des circuits imprimés. Il nous apprend que cette approche permet de résoudre des problèmes complexes avec une flexibilité et une performance accrues par rapport aux méthodes traditionnelles.

🔑 MOTS CLÉS
Deep Reinforcement Learning (DRL)
: Une sous-branche de l'intelligence artificielle où les algorithmes apprennent en interagissant avec leur environnement, optimisant les décisions prises en fonction des récompenses reçues.

Optimisation combinatoire : Un domaine des mathématiques appliquées dédié à la recherche des solutions optimales parmi un ensemble fini de solutions possibles, crucial dans la planification industrielle.

JAX : Une bibliothèque open-source de Google utilisée pour le calcul différentiable en Python, permettant l'optimisation et la parallélisation sur GPU, essentielle pour des simulations rapides et efficaces.

Evolutionary Algorithms (EA) : Une classe d'algorithmes inspirés de la théorie de l'évolution naturelle, utilisés en combinaison avec le reinforcement learning pour explorer de vastes espaces de solutions.

Policy Gradient Methods : Techniques de reinforcement learning qui optimisent directement la politique de prise de décision de l'agent, en fonction des gradients de récompense.

Soft Actor-Critic (SAC) : Un algorithme avancé de reinforcement learning qui combine les avantages de l'apprentissage par politiques stochastiques et déterministes pour une exploration efficace et une stabilité accrue.

🎙 SOUTENEZ LE PODCAST

> Abonnez-vous 🔔

> Laissez 5 étoiles et un avis 🥰

Sur Spotify : ici

Sur Apple Podcast : ici

Sur Deezer : ici

Sur Google Podcast : ici

🧐 DANS LA MÊME THÉMATIQUE

Épisode 23 : Hamza Tajmouati (Head of AI & Data @ Iktos ) : L’IA générative pour créer des médicaments

Épisode 59 : IA dans la consultation médicale - Samuel Humeau (Lead Machine Learning @ Nabla)

Épisode 52 : Météo, océan et climat : prédire et modéliser grâce à l’intelligence artificielle - Louis Thiry (chercheur @ INRIA)

👋 PLUS DE CONTENU DATA ?

> Suivez-moi sur LinkedIn (tips/réflexions) ici 🤳

> Suivez-nous sur Tiktok 📳

> Abonnez-vous à notre chaîne Youtube

🚀 BESOIN D’EXPERTISE IA & DATA ?

Scopeo vous accompagne de A à Z dans vos projets IA : découvrez nos solutions :

  • Diagnostic IA & Data : évaluation du potentiel de l'Intelligence Artificielle pour votre entreprise, compréhension de ce qui est réalisable avec les technologies actuelles, et mesure des risques et des opportunités associés à l'IA pour votre activité

  • IA sur mesure : création d'une Intelligence Artificielle sur mesure, adaptée à vos besoins spécifiques, développement et intégration des meilleures solutions sur mesure pour répondre à vos problématiques uniques

  continue reading

83 에피소드

Alle episoder

×
 
Loading …

플레이어 FM에 오신것을 환영합니다!

플레이어 FM은 웹에서 고품질 팟캐스트를 검색하여 지금 바로 즐길 수 있도록 합니다. 최고의 팟캐스트 앱이며 Android, iPhone 및 웹에서도 작동합니다. 장치 간 구독 동기화를 위해 가입하세요.

 

빠른 참조 가이드