研究

Rllib:分布式強化學習的抽象

作者:Eric Liang,Richard Liaw,Philipp Moritz,Robert Nishihara,Roy Fox,Ken Goldberg,Joseph E. Gonzalez,Michael I. Jordan,Ion Stoica

下載紙張

抽象的

增強學習(RL)算法涉及高度不規則的計算模式的深嵌套,每個計算模式通常都表現出分布式計算的機會。我們通過調整自上而下的分層控製的算法來分發RL組件以可協調的方式分發,從而在短期運行的計算任務中封裝並行性和資源要求。我們通過RLLIB展示了這一原則的好處:一個為RL提供可擴展軟件原語的庫。這些基元能夠以高性能,可擴展性和大量代碼重用來實現廣泛的算法。RLLIB可作為開源射線項目的一部分提供。

相關內容

作者:Andrew Chen,Andy Chen,Arjun Dcidson,Arjun Dcunha,Ali Ghodsi,Sue Ann Hong,Andy Konwinski,Clemens Mewald,Siddharth Murching,Tomas Nykodym,Paul Ogilvie,Mani Parkhe,Avesh Singh,Fen Xie,Matei Zaharia,Richard Zang,Juntai鄭,科羅裏州Zumar,Databricks,Inc。

作者:Matei Zaharia,Andrew Chen,Aaron Davidson,Ali Ghodsi,Sue Ann Hong,Andy Konwinski,Siddharth Murching,Tomas Nykodym,Paul Ogilvie,Mani Parkhe,Fen Xie,Corey Zumar,DataBricks Inc.

作者:Philipp Moritz,Robert Nishihara,Stepher Nishihara,斯蒂芬·王,Richard Liaw,Richard Liang,Eric Liang,Melih Elibol,Zongheng Yang,William Paul,Michael I. Jordan和Ion Stoica,UC Berkeley

作者:Roy Fox,Richard Shin,Sanjay Krishnan,Ken Goldberg,Dawn Song,Ion Stoica

作者:Firas Abuzaid,Joseph Bradley,Feynman Liang,Andrew Feng,Lee Yang,Matei Zaharia,Ameet Talwalkar

作者:Cody Coleman,Deadak Narayanan,Daniel Kang,Tian Zhao,Jian Zhang,Luigi Nardi,Peter Bailis,Kunle Olukotun,ChrisRé,Matei Zaharia

作者:丹尼爾·克拉克肖,鑫王,朱利奧·周,邁克爾J.富蘭克林,Joseph E.Gonzalez,Ion Stoica

作者:Reza Bosagh Zadeh,Xiangrui Meng,Alexander Ulanov,Burak Yavuz,Li Pu,Shivaram Venkataraman,Evan Sparks,Aaron Staple,Matei Zaharia

作者:Xiangrui Meng,Joseph Bradley,Burak Yavuz,Evan Sparks,Shivaram Venkataraman,Davies Liu,Jeremy Freeman,DB Tsai,Manish Amde,Sean Owen,Doris Xin,Reynold Xin,Michael J. Franklin,Reza Zadeh,Matei Zaharia,Matei Zaharia,Matei Zaharia,Matei Zaharia,AmeTizh

Baidu
map