Player FM 앱으로 오프라인으로 전환하세요!
Julekalender luke 3: AI for kontinuerlig læring
Manage episode 348729563 series 2497947
De fleste forsterkningslæringsalgoritmer er episodiske. Det betyr at de lærer ved å utføre en oppgave i et miljø som starter på nytt hver gang agenten feiler. Inntil nå. Bak denne luke skjuler det seg en helt annen måte å trene forsterkningslæring på.
Artikkel: Autonomous Reinforcement Learning: Formalism and Benchmarking (EARL),https://arxiv.org/abs/2112.09605
Prøv selv: https://architsharma97.github.io/earl_benchmark/overview.html
145 에피소드
Manage episode 348729563 series 2497947
De fleste forsterkningslæringsalgoritmer er episodiske. Det betyr at de lærer ved å utføre en oppgave i et miljø som starter på nytt hver gang agenten feiler. Inntil nå. Bak denne luke skjuler det seg en helt annen måte å trene forsterkningslæring på.
Artikkel: Autonomous Reinforcement Learning: Formalism and Benchmarking (EARL),https://arxiv.org/abs/2112.09605
Prøv selv: https://architsharma97.github.io/earl_benchmark/overview.html
145 에피소드
Todos los episodios
×플레이어 FM에 오신것을 환영합니다!
플레이어 FM은 웹에서 고품질 팟캐스트를 검색하여 지금 바로 즐길 수 있도록 합니다. 최고의 팟캐스트 앱이며 Android, iPhone 및 웹에서도 작동합니다. 장치 간 구독 동기화를 위해 가입하세요.