Airbyte
开源 ELT 数据集成与连接器平台
这里是“大数据流动”的全量工具入口,覆盖 AI 工程化、数据治理、分析可视化、数据处理和数据存储。分类页用于深入浏览,工具详情页用于查看官网、文档、GitHub、功能特性和相关工具。
个工具
开源 ELT 数据集成与连接器平台
智能数据目录系统
云对象存储服务
面向数据发现和元数据搜索的开源数据目录
面向团队知识库、RAG 和 AI Agent 的桌面与服务端工具
工作流调度与编排系统
元数据管理与数据治理框架
统一批流处理模型
高可用分布式NoSQL数据库
分布式可视化大数据工作流调度平台
面向实时分析的开源 MPP 数据库
分布式流批一体计算引擎
数据质量解决方案
开源分布式大数据存储与计算框架
面向数据湖增量处理的开源表格式
开放表格式标准
分布式流数据平台
面向大规模数据集的开源多维分析引擎
可视化数据流自动化与集成平台
Hadoop工作流调度系统
面向流批一体湖仓的开源表存储
面向海量数据同步与集成的开源平台
通用大数据计算引擎
开源数据可视化平台
面向 LLM、RAG 和机器学习系统的开源可观测性平台
面向现代数据团队的数据目录与治理协作平台
微软开源的多 Agent 应用框架,用于构建可协作的智能体系统
全托管ETL服务
分布式工作流管理器
面向 AI 模型服务化和推理部署的平台
企业级数据质量监控与可观测性平台
Google Cloud 托管的无服务器企业数据仓库
统一的分布式存储系统
面向 AI 原生应用的嵌入数据库
高性能列式 OLAP 数据库
企业级数据治理平台
面向角色分工和任务协作的多 Agent 编排框架
面向数据应用的语义层和指标 API 平台
面向数据资产的软件定义编排平台
面向数据变更验证、差异对比和质量治理的平台
现代元数据管理平台
面向分析工程的 SQL 转换与建模框架
面向数据库变更数据捕获的开源平台
面向 LLM 应用的开源测试与评测框架
基于Spark的数据质量库
面向湖仓的开源存储格式与事务层
开源 LLM 应用开发平台,支持工作流、Agent、RAG 和企业 AI 应用编排
面向 Apache Iceberg 湖仓的 SQL 查询与语义层平台
用于编程化优化提示词与语言模型流程的框架
面向本地分析和嵌入式场景的列式数据库
开源JavaScript可视化库
面向开放元数据与治理互操作的企业框架
用 SQL 和 Markdown 构建数据应用与报告的开源框架
开源知识库问答、RAG 和可视化 AI 工作流平台
基于 Apache Flink 的实时 CDC 数据集成框架
低代码 LLM 应用构建工具,用可视化节点搭建聊天、RAG 和 Agent 流程
开源指标监控、日志和可观测性可视化平台
数据质量与测试框架
面向 RAG、搜索和问答系统的开源 AI 框架
分布式列式数据库
分布式文件系统
Nous Research 推出的自我进化型 AI Agent,关注记忆、Skill 和长期协作
协作式数据分析、Notebook 和数据应用平台
事件驱动的开源编排与自动化平台
基于 Kubernetes 的机器学习工作流平台
用于构建 LLM 应用和 Agent 工作流的开源框架
开源 LLM 可观测性、追踪与评测平台
面向可控 Agent 工作流的图式编排框架
基于 dbt 语义模型的开源 BI 平台
统一多模型 API、网关和成本治理的 LLM 代理层
面向 LLM 应用的数据框架,重点支持 RAG、数据连接和知识索引
云原生BI平台
围绕 OpenLineage 构建的开源元数据与血缘服务
开源BI与数据探索工具
云原生开源向量数据库
高性能对象存储系统
机器学习与生成式 AI 生命周期管理平台
面向企业数据可靠性和可观测性的商业平台
面向自动化与 AI 工作流的可扩展编排平台
面向交互式数据可视化和数据应用的开发平台
本地大模型运行工具,帮助开发者在本机运行和管理开源模型
可自托管的本地与私有 LLM 对话工作台
面向个人和团队自动化的开源 AI Agent,强调工具执行、消息入口和 Skill 生态
面向数据血缘采集的开放标准与生态
基于 OpenTelemetry 的 LLM 应用可观测性方案
一体化元数据管理平台
PostgreSQL 的开源向量相似度搜索扩展
面向生产 AI 应用的托管向量数据库
成熟开源关系型数据库和企业数据底座
微软商业智能工具
面向 Python 数据流和自动化任务的编排平台
分布式SQL查询引擎
面向 AI 应用的高性能向量数据库
数据质量规则引擎
面向 RAG 应用的开源评测框架
面向深度文档理解的开源 RAG 引擎
开源数据协作平台
面向数据发现、文档和数据团队知识管理的平台
微软开源的企业级 AI 编排 SDK
云原生数据仓库
面向数据质量检测和数据可靠性的工具平台
面向极速分析和湖仓查询的开源 OLAP 数据库
交互式数据可视化工具
面向湖仓和多数据源的分布式 SQL 查询引擎
高吞吐大语言模型推理与服务框架
带语义搜索与混合检索能力的向量数据库
云原生数据仓库服务