Player FM 앱으로 오프라인으로 전환하세요!
DeepSeek R1
Fetch error
Hmmm there seems to be a problem fetching this series right now. Last successful fetch was on August 29, 2025 07:37 ()
What now? This series will be checked again in the next day. If you believe it should be working, please verify the publisher's feed link below is valid and includes actual episode links. You can contact support to request the feed be immediately fetched.
Manage episode 465086680 series 1998876
DeepSeek R1 sorgte im Januar für Aufsehen: Ein chinesisches KI-Modell, das mit offenen Gewichten und ausgefeiltem Chain-of-Thought Reasoning die etablierten US-amerikanischen Modelle wie o1 herausfordert – und das zu einem Bruchteil der bisher als notwendig erachteten Kosten. Die Ankündigung ließ sogar die Aktienkurse namhafter Chiphersteller einbrechen. Wie gelang DeepSeek dieser Durchbruch? Welche innovativen Engineering-Ansätze ermöglichten den Sprung vom klassischen Foundation Model zum leistungsstarken Reasoning-Modell? Ole und Robert nehmen die Evolution von DeepSeek R1 unter die Lupe und analysieren die mehrschichtigen technischen Innovationen, die hinter diesem Erfolg stehen. Sie diskutieren außerdem die konkreten Auswirkungen dieser Entwicklung auf den deutschen Unternehmenssektor.
Shownotes:
- Buch: "Thinking, Fast and Slow"
- Chain of Thought Prompting
- How cheap, outsourced labour in Africa is shaping AI English (RLHF)
- AlphaGo: The Movie
- Group Relative Policy Optimization (GRPO)
- Running DeepSeek V3 671B on M4 Mac Mini Cluster
- DeepSeek FAQ von Ben Thompson auf Stratecherry
- Gewinner und Verlierer nach dem KI-Erdbeben: Analyse von Marcel Weiß für FAZ (Paywall)
- DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning (das Paper zur Veröffentlichung von R1)
- DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models
- ARC Prize: ARC-AGI Benchmark
175 에피소드
Fetch error
Hmmm there seems to be a problem fetching this series right now. Last successful fetch was on August 29, 2025 07:37 ()
What now? This series will be checked again in the next day. If you believe it should be working, please verify the publisher's feed link below is valid and includes actual episode links. You can contact support to request the feed be immediately fetched.
Manage episode 465086680 series 1998876
DeepSeek R1 sorgte im Januar für Aufsehen: Ein chinesisches KI-Modell, das mit offenen Gewichten und ausgefeiltem Chain-of-Thought Reasoning die etablierten US-amerikanischen Modelle wie o1 herausfordert – und das zu einem Bruchteil der bisher als notwendig erachteten Kosten. Die Ankündigung ließ sogar die Aktienkurse namhafter Chiphersteller einbrechen. Wie gelang DeepSeek dieser Durchbruch? Welche innovativen Engineering-Ansätze ermöglichten den Sprung vom klassischen Foundation Model zum leistungsstarken Reasoning-Modell? Ole und Robert nehmen die Evolution von DeepSeek R1 unter die Lupe und analysieren die mehrschichtigen technischen Innovationen, die hinter diesem Erfolg stehen. Sie diskutieren außerdem die konkreten Auswirkungen dieser Entwicklung auf den deutschen Unternehmenssektor.
Shownotes:
- Buch: "Thinking, Fast and Slow"
- Chain of Thought Prompting
- How cheap, outsourced labour in Africa is shaping AI English (RLHF)
- AlphaGo: The Movie
- Group Relative Policy Optimization (GRPO)
- Running DeepSeek V3 671B on M4 Mac Mini Cluster
- DeepSeek FAQ von Ben Thompson auf Stratecherry
- Gewinner und Verlierer nach dem KI-Erdbeben: Analyse von Marcel Weiß für FAZ (Paywall)
- DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning (das Paper zur Veröffentlichung von R1)
- DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models
- ARC Prize: ARC-AGI Benchmark
175 에피소드
모든 에피소드
×플레이어 FM에 오신것을 환영합니다!
플레이어 FM은 웹에서 고품질 팟캐스트를 검색하여 지금 바로 즐길 수 있도록 합니다. 최고의 팟캐스트 앱이며 Android, iPhone 및 웹에서도 작동합니다. 장치 간 구독 동기화를 위해 가입하세요.