研究

提高異構環境下的MapReduce性能

作者:Matei Zaharia, Andy Konwinski, Anthony D. Joseph, Randy Katz, Ion Stoica

下載論文

摘要

MapReduce正在成為大規模數據並行應用(如web索引、數據挖掘和科學模擬)的重要編程模型。Hadoop是MapReduce的開源實現,被廣泛采用,通常用於響應時間很短的短任務。Hadoop的性能與它的任務調度器密切相關,它隱式地假設集群節點是同構的,任務是線性進展的,並使用這些假設來決定何時猜測地重新執行看起來掉隊的任務。在實踐中,同質性假設並不總是成立。發生這種情況的一個特別引人注目的設置是虛擬化數據中心,例如Amazon的Elastic Compute Cloud (EC2)。我們展示了Hadoop的調度器在異構環境中會導致嚴重的性能下降。我們設計了一種新的調度算法——最長近似結束時間(LATE),該算法對異構性具有很強的魯棒性。在EC2上由200個虛擬機組成的集群中,LATE可以將Hadoop響應時間提高2倍。

相關內容

作者:Anand Padmanabha Iyer, Liu zaxing, Xin Jin, Shivaram Venkataraman, Vladimir Braverman, Ion Stoica

作者:Shivaram Venkataraman, Aurojit Panda, Kay Ousterhout, Michael Armbrust, Ali Ghodsi, Michael J. Franklin, Benjamin Recht, Ion Stoica

作者:阿裏·戈西,馬泰·紮哈裏亞,本傑明·辛德曼,安迪·康溫斯基,斯科特·申克,伊昂·斯托伊卡

作者:Eric Jonas, qiifan Pu, Shivaram Venkataraman, Ion Stoica, Benjamin Recht

作者:Benjamin Hindman, Andy Konwinski, Matei Zaharia, Ali Ghodsi, Anthony D. Joseph, Randy Katz, Scott Shenker, Ion Stoica

作者:李昊遠,阿裏·戈西,馬泰·紮哈裏亞,斯科特·申克,伊昂·斯托伊卡

作者:Matei Zaharia, Dhruba Borthakur, Joydeep Sen Sarma, Khaled Elmeleegy, Scott Shenker, Ion Stoica

作者:Michael Armbrust, Armando Fox, Rean Griffith, Anthony D. Joseph, Randy Katz, Andy Konwinski, Gunho Lee, David Patterson, Ariel Rabkin, Ion Stoica, Matei Zaharia

作者:D. Karger, H. Balakrishnan, I. Stoica, M.F. Kaashoek, R. Morris

Baidu
map