Apache IoTDB UDF 的基本原理及其在工业数据质量领域的实践

苏宇荣,贺文迪

中文演讲 2022-07-30 18:10 GMT+8  #iot

Apache IoTDB UDF 框架面向用户提供了一套简单易用、语义丰富的 Java API。用户基于此框架可以快速构建功能强大的时序处理逻辑:能够按逐个数据点、Sliding Time Window、Sliding Count Window 或者 Session Window 的方式对原始数据进行消费,进而实现时间序列的聚合、变形或扩增。目前社区已基于此框架实现了百余种函数。配合 Apache IoTDB 的嵌套表达式特性,可大幅度降低时序分析场景下的业务负担。

本演讲将主要围绕 Apache IoTDB UDF 框架展开,包含两个主要部分:

  1. Apache IoTDB UDF 的基础知识:包含 UDF 接口语义的介绍、编程示例、使用示例以及未来展望等;
  2. Apache IoTDB UDF 在工业数据质量领域的实践:包括数据画像、数据修复、数据匹配、异常检测、序列发现等函数的介绍。

Speakers:


苏宇荣: 清华大学软件学院, 硕士研究生, 主要兴趣方向为分布式系统、时序数据库、流式计算引擎。开源爱好者,Apache IoTDB Committer。他专注于提升 IoTDB 的数据处理能力,在社区推动了 IoTDB 函数(UDF)框架、表达式框架、触发器、持续查询等特性的落地。


贺文迪: 清华大学软件学院, 硕士研究生, 清华大学软件学院硕士生,Apache IoTDB Contributor。Apache IoTDB-Quality 项目的核心开发人员,专注于 IoTDB-Quality 用户自定义函数部分的工作。