Apache Beam is a unified model for defining both batch and streaming data-parallel processing pipelines, as well as a set of language-specific SDKs...
最近更新: 6小时前Helix 是一个通用的集群管理框架,用于自动化的分区、复制和资源分布,提供如下特性: 自动将资源和分区分配给节点 节点故障检测与恢复 动态添加资源 动态向集群添加节点 可插拔
最近更新: 6小时前TinkerPop是一种开源图计算框架,既可用于联机事务处理(OLTP),又可用于联机分析处理系统(OLAP)。它可以用于处理单一机器以及分布式环境的庞大数据
最近更新: 6小时前Tika 是一个内容抽取的工具集合(a toolkit for text extracting)。它集成了 POI, Pdfbox 并且为文本抽取工作提供了一个统一的界面。
最近更新: 6小时前Apache Ignite is a horizontally scalable, fault-tolerant distributed in-memory computing platform for building real-time applications that can proc...
最近更新: 1天前Jackrabbit Oak is a scalable, high-performance hierarchical content repository designed for use as the foundation of modern world-class web sites a...
最近更新: 1天前