DataFu在LinkedIn開發,完全用Java編寫的。
DataFu包括函數/庫一起工作:
- 統計
- 估計
- 取樣
- 會話
- 鏈接分析
- 設置操作
- 手袋
DataFu是完美的數據挖掘和在Hadoop或豬數據庫之上的工作統計應用。
這些功能使開發人員能夠利用內部存儲的所有數據的完全優勢的的Hadoop 或豬數據庫,而不必為了做到這一點,以應對龐大的系統要求。
本發行版是新的:
- 配對的UDF與更換簡單隨機抽樣
- 更依賴現在打包在DataFu必需的,以便減少依賴的JAR。
- SetDifference UDF計算差集(例如,A-B或A-B-C)。
什麼是1.2.0版本,新的:
- 的UDF與更換簡單隨機抽樣的一對。
- 更依賴現在打包在DataFu必需的,以便減少依賴的JAR。
- SetDifference UDF計算差集(例如,A-B或A-B-C)。
什麼是新的在1.1.0版本:
- 新增SHA哈希碼UDF
- InUDF和AssertUDF增加了豬0.12兼容性。這些是相同的。在與斷言。
- SimpleRandomSample,它實現了一個可擴展的簡單隨機抽樣算法。
評論沒有發現