Artwork

Marc Sanselme and Marc Sanselme - Scopeo - Agence d'Intelligence Artificielle에서 제공하는 콘텐츠입니다. 에피소드, 그래픽, 팟캐스트 설명을 포함한 모든 팟캐스트 콘텐츠는 Marc Sanselme and Marc Sanselme - Scopeo - Agence d'Intelligence Artificielle 또는 해당 팟캐스트 플랫폼 파트너가 직접 업로드하고 제공합니다. 누군가가 귀하의 허락 없이 귀하의 저작물을 사용하고 있다고 생각되는 경우 여기에 설명된 절차를 따르실 수 있습니다 https://ko.player.fm/legal.
Player FM -팟 캐스트 앱
Player FM 앱으로 오프라인으로 전환하세요!

#33 Guillaume Lample (Co-fondateur & Chief Scientist @ Mistral AI) : Les secrets des Large Language Models

38:44
 
공유
 

Manage episode 378496374 series 3426234
Marc Sanselme and Marc Sanselme - Scopeo - Agence d'Intelligence Artificielle에서 제공하는 콘텐츠입니다. 에피소드, 그래픽, 팟캐스트 설명을 포함한 모든 팟캐스트 콘텐츠는 Marc Sanselme and Marc Sanselme - Scopeo - Agence d'Intelligence Artificielle 또는 해당 팟캐스트 플랫폼 파트너가 직접 업로드하고 제공합니다. 누군가가 귀하의 허락 없이 귀하의 저작물을 사용하고 있다고 생각되는 경우 여기에 설명된 절차를 따르실 수 있습니다 https://ko.player.fm/legal.

Guillaume Lample, Cofounder & Chief Scientist chez Mistral AI est l’invité de l’épisode 33 de Data Driven 101. Mistral AI entraîne des modèles de langues à destination des entreprises avec un accès open source. Il nous explique notamment :

  • les difficultés et subtilités pour entraîner un LLM
  • les découvertes inattendues faites sur le chemin
  • les caractéristiques de leur premier modèle à destination du grand public

🔑 MOTS CLÉS

  • Dataset : un ensemble de données utilisé pour entraîner un modèle d'apprentissage automatique.
  • Token : un morceau de mot utilisé pour entraîner un modèle de langage. Un mot peut être découpé en plusieurs tokens.
  • Embedding : une représentation vectorielle d'un mot ou d'une phrase utilisée pour entraîner un modèle de langage.
  • Open source : un logiciel dont le code source est disponible pour tout le monde et peut être modifié et distribué librement.
  • Fine-tuning : une technique d'entraînement de modèles de langage qui consiste à ajuster un modèle pré-entraîné sur un ensemble de données spécifique à une tâche donnée.
  • NLP (Natural Language Processing) : un domaine de l'informatique qui se concentre sur l'interaction entre les ordinateurs et le langage humain.

🎙 SOUTENEZ LE PODCAST GRATUITEMENT

> Abonnez-vous 🔔

> Laissez 5 étoiles et un avis 🥰

Sur Spotify : ici

Sur Apple Podcast : ici

Sur Deezer : ici

Sur Google Podcast : ici

🧐 DANS LA MÊME THÉMATIQUE

👉🏼Episode 29 : Arthur André ( Co-fondateur @ Praiz ) : Synthétiser ses réunions grâce à l'IA

👉🏼 Episode 23 : Hamza Tajmo uati (Head of AI & Data @ Iktos ) : L’IA générative pour créer des médicaments

👉🏼Episode HS1 : Nikolaj Groeneweg (Founder @ Everyme.ai) - Générer des images grâce à l'IA

👋 PLUS DE CONTENU DATA ?

> Suivez-moi sur LinkedIn (tips/réflexions) ici 🤳

> Suivez-nous sur Tiktok 📳

> Abonnez-vous à notre chaîne Youtube

🚀 BESOIN D’EXPERTISE IA & DATA ?

Réserver un créneau de 30 min avec Marc Sanselme et profiter des connaissances et du savoir-faire d’un expert IA qui saura vous aiguiller sur vos projets d’IA.

Réservez votre séance de 30 minutes maintenant


Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

  continue reading

62 에피소드

Artwork
icon공유
 
Manage episode 378496374 series 3426234
Marc Sanselme and Marc Sanselme - Scopeo - Agence d'Intelligence Artificielle에서 제공하는 콘텐츠입니다. 에피소드, 그래픽, 팟캐스트 설명을 포함한 모든 팟캐스트 콘텐츠는 Marc Sanselme and Marc Sanselme - Scopeo - Agence d'Intelligence Artificielle 또는 해당 팟캐스트 플랫폼 파트너가 직접 업로드하고 제공합니다. 누군가가 귀하의 허락 없이 귀하의 저작물을 사용하고 있다고 생각되는 경우 여기에 설명된 절차를 따르실 수 있습니다 https://ko.player.fm/legal.

Guillaume Lample, Cofounder & Chief Scientist chez Mistral AI est l’invité de l’épisode 33 de Data Driven 101. Mistral AI entraîne des modèles de langues à destination des entreprises avec un accès open source. Il nous explique notamment :

  • les difficultés et subtilités pour entraîner un LLM
  • les découvertes inattendues faites sur le chemin
  • les caractéristiques de leur premier modèle à destination du grand public

🔑 MOTS CLÉS

  • Dataset : un ensemble de données utilisé pour entraîner un modèle d'apprentissage automatique.
  • Token : un morceau de mot utilisé pour entraîner un modèle de langage. Un mot peut être découpé en plusieurs tokens.
  • Embedding : une représentation vectorielle d'un mot ou d'une phrase utilisée pour entraîner un modèle de langage.
  • Open source : un logiciel dont le code source est disponible pour tout le monde et peut être modifié et distribué librement.
  • Fine-tuning : une technique d'entraînement de modèles de langage qui consiste à ajuster un modèle pré-entraîné sur un ensemble de données spécifique à une tâche donnée.
  • NLP (Natural Language Processing) : un domaine de l'informatique qui se concentre sur l'interaction entre les ordinateurs et le langage humain.

🎙 SOUTENEZ LE PODCAST GRATUITEMENT

> Abonnez-vous 🔔

> Laissez 5 étoiles et un avis 🥰

Sur Spotify : ici

Sur Apple Podcast : ici

Sur Deezer : ici

Sur Google Podcast : ici

🧐 DANS LA MÊME THÉMATIQUE

👉🏼Episode 29 : Arthur André ( Co-fondateur @ Praiz ) : Synthétiser ses réunions grâce à l'IA

👉🏼 Episode 23 : Hamza Tajmo uati (Head of AI & Data @ Iktos ) : L’IA générative pour créer des médicaments

👉🏼Episode HS1 : Nikolaj Groeneweg (Founder @ Everyme.ai) - Générer des images grâce à l'IA

👋 PLUS DE CONTENU DATA ?

> Suivez-moi sur LinkedIn (tips/réflexions) ici 🤳

> Suivez-nous sur Tiktok 📳

> Abonnez-vous à notre chaîne Youtube

🚀 BESOIN D’EXPERTISE IA & DATA ?

Réserver un créneau de 30 min avec Marc Sanselme et profiter des connaissances et du savoir-faire d’un expert IA qui saura vous aiguiller sur vos projets d’IA.

Réservez votre séance de 30 minutes maintenant


Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

  continue reading

62 에피소드

Minden epizód

×
 
Loading …

플레이어 FM에 오신것을 환영합니다!

플레이어 FM은 웹에서 고품질 팟캐스트를 검색하여 지금 바로 즐길 수 있도록 합니다. 최고의 팟캐스트 앱이며 Android, iPhone 및 웹에서도 작동합니다. 장치 간 구독 동기화를 위해 가입하세요.

 

빠른 참조 가이드