平台
采纳
-
23. GitLab CI/CD
GitLab CI/CD 已发展为 GitLab 内部一个高度集成的系统,涵盖从代码集成、测试到部署和监控的所有环节。它支持复杂的工作流,包括多阶段流水线、缓存、并行执行和自动扩展运行器,非常适合大型项目和复杂流水线需求。我们特别想强调其内置的安全和合规工具(如 SAST 和 DAST 分析),使其非常适合具有高合规性要求的场景。此外,它还与 Kubernetes 无缝集成,支持云原生工作流,并提供实时日志、测试报告和可追溯性,以增强可观察性。
-
24. Trino
Trino 是一个开源的分布式 SQL 查询引擎,专为大数据的交互式分析查询而设计。它针对本地和云端环境进行了优化,支持直接在数据驻留的位置进行查询,包括关系型数据库和各种专有数据存储(通过连接器)。Trino 还能够查询存储为 Parquet 等文件格式的数据,以及像 Apache Iceberg 这样的开放表格格式。其内置的查询联邦功能允许将多个数据源的数据作为一个逻辑表进行查询,非常适合需要聚合多种来源数据的分析工作负载。Trino 是许多流行技术栈(如 AWS Athena、Starburst 和其他专有数据平台)的重要组成部分。我们的团队在各种用例中成功使用了 Trino,对于跨多个数据源进行分析的数据集查询,Trino 一直是一个可靠的选择。
试验
-
25. ABsmartly
ABsmartly 是一款先进的 A/B 测试与实验平台,专为快速且可信的决策制定而设计。其核心亮点是 Group Sequential Testing (GST) 引擎,与传统 A/B 测试工具相比,可将测试结果的速度提升高达 80%。平台提供实时报告、深度数据分割以及通过 API 优先的方式实现的无缝全栈集成,支持在网页、移动端、微服务和机器学习模型中运行实验。
ABsmartly 专注于解决可扩展、数据驱动实验中的关键挑战,使得更快的迭代和更敏捷的产品开发成为可能。通过零延迟执行、强大的深度分割能力以及对多平台实验的支持,ABsmartly 对希望扩大实验文化并优先推动数据驱动创新的组织尤为有价值。借助其显著缩短的测试周期和自动化结果分析能力,ABsmartly 帮助我们比传统 A/B 测试平台更高效地优化功能和用户体验。
-
27. Grafana Alloy
前身为 Grafana Agent,Grafana Alloy 是一个开源的 OpenTelemetry Collector。Alloy 被设计为一个一体化的遥测数据收集器,用于收集包括日志、指标和跟踪在内的所有遥测数据。它支持常用的遥测数据格式,如 OpenTelemetry、Prometheus 和 Datadog。随着 Promtail 最近被弃用,Alloy 正逐渐成为遥测数据收集的首选工具——特别是在使用 Grafana 可观察性技术栈时,用于日志数据的收集。
-
28. Grafana Loki
Grafana Loki是一个受 Prometheus 启发的横向可扩展,高可用的多租户日志聚合系统。Loki 只对日志的元数据进行索引,并把它当做日志流的标签集,而日志数据本身则储存在像 S3, GCS 或 Azure Blob Storage 这样的块存储方案中。这样做的好处是 Loki 比竞争对手的运维复杂度更低,同时也降低了存储成本。正如你所期待的那样,它与 Grafana 和Grafana Alloy深度集成,即使其他的日志采集机制也被支持。
Loki 3.0 引入了对原生OpenTelemetry的支持,这使得与 OpenTelemetry 系统的数据摄入与集成如配置一个端点一样简单。此外,它还提供了高级的多租户功能,例如通过 shuffle-sharding 的方式实现各租户间的隔离,避免异常的租户(比如正在执行高负载查询或者出现故障)影响到集群中的其他租户。如果你还没有关注 Grafana 生态系统的最新发展,现在正是个好时机——它正在快速地演进。
-
29. Grafana Tempo
Grafana Tempo 是一个高可扩展的分布式追踪后端,支持诸如 OpenTelemetry 等开放标准。Tempo 专为成本效率设计,依赖对象存储进行长期追踪数据的保存,并支持追踪查询、基于 Span 的指标生成以及与日志和指标的关联。Tempo 默认使用 Apache Parquet 为基础的列式块格式,提高了查询性能,并使下游工具能够访问追踪数据。查询通过 TraceQL 和 Tempo CLI 执行。Grafana Alloy 也可以配置以收集并转发追踪数据到 Tempo。我们的团队在 GKE 上自托管了 Tempo,使用 MinIO 作为对象存储,结合 OpenTelemetry 收集器以及 Grafana 用于追踪数据的可视化。
-
30. Railway
-
32. Weights & Biases
Weights & Biases 持续发展,自上次在技术雷达中提及以来,增加了更多面向 LLM 的功能。他们扩展了 Traces 并推出了 Weave,一个超越 LLM 系统跟踪的完整平台。Weave 支持创建系统评估、定义自定义指标、使用 LLM 作为任务(如摘要)的评判工具,并保存数据集以捕捉不同行为进行分析。这有助于优化 LLM 组件,并在本地和全局层面跟踪性能。该平台还支持迭代开发和高效调试,这对错误难以检测的代理系统尤为重要。此外,它还允许收集宝贵的人类反馈,这些反馈可以用于后续模型微调,从而进一步提升模型的表现和可靠性。
暂缓
-
50. Tyk hybrid API management
我们观察到多个团队在使用 Tyk hybrid API management 解决方案时遇到了问题。虽然托管控制平面和自管数据平面的设计理念为复杂的基础设施(如多云和混合云)提供了灵活性,但团队反馈在 Tyk 的 AWS 托管环境中,控制平面发生的故障通常是通过内部发现的,而非由 Tyk 主动检测到,这暴露了 Tyk 在可观测性方面的潜在不足。此外,事故支持的响应速度似乎偏慢,仅通过工单和邮件进行沟通在这些紧急情况下并不理想。同时,团队还反映 Tyk 文档的成熟度不足,尤其在处理复杂场景和问题时,文档往往不能提供足够的指导。此外,Tyk 生态系统中的其他产品似乎也不够成熟。例如,企业开发者门户被报告为不向后兼容,且定制能力有限。特别是在 Tyk 的混合部署场景中,我们建议谨慎使用,并将继续关注其成熟度的发展。
无法找到需要的信息?
每期技术雷达中的条目都在试图反映我们在过去六个月中的技术洞见,或许你所搜索的内容已经在前几期中出现过。由于我们有太多想要谈论的内容,有时候不得不剔除一些长期没有发生变化的条目。技术雷达来自于我们的主观经验,而非全面的市场分析,所以你可能会找不到自己最在意的技术条目。