這基本上是一個Python庫的MapReduce寫在用Cython
功能:
- 在類似的接口作為Hadoop的API (設計模式的Python / Java接口的使用)
- 在與小飛象一般的兼容性,讓用戶來回切換
- 在可用的Hadoop集群沒有Python或管理員權限
- 快速轉換和處理
- 留小,並有據可查
- 要透明,這是怎麼回事
- 在複雜的.so的,ctypes的和擴展手柄節目
- 為下鍋的能力編寫的代碼
- 在簡單HDFS訪問(例如,閱讀,寫作,LS)
- 支持(而不是複製)更大的Hadoop生態系統(如,Oozie的,呼呼)
- 在自動並行化的工作“自動Oozie的”在hadoopy流量工程可(保持了分支)
- 在本地執行的MapReduce未修改的工作與launch_local
- TypedBytes直接到HDFS從蟒蛇讀/寫序列文件(readtb,writetb)
- 允許印刷輸出和錯誤Hadoop中的任務,而不會引起問題(使用'管跳頻“技術,無論是在任務的標準錯誤提供)
- 在集群工作沒有任何額外的安裝,Python或任何Python庫(使用Pyinstaller包含在這個源代碼樹)
- 在OS X工程
- 在關鍵路徑是在用Cython
- 在簡單HDFS接入(readtb和ls)裡面的Python,甚至在正在運行的任務
- 在單元測試接口
- 報告使用狀態和計數器(和打印報表!不需要在Hadoopy害怕他們的)
- 支持在林代爾和書籍設計模式
- Typedbytes支持(非常快)
- Oozie的支持
要求:
- 在用Cython 0.13或更高
評論沒有發現