Auto Anomaly Detection

自动异常检测器 背景 我有一个数据表和一些指标(m1,m2…mn)。可以通过(focus=’m1′, fixed={m2:True, m5:False,…)的格式去访问数据表,获取对应的时间序列数据。这个查询语句的意思就是在m2为True,m5为False的情况下,查询关于m1的数据。 其中focus位置只能接收一个str型指标,fixed位置可以接收一个dict,里面可以出现除focus之外的任意个指标,每个指标都有True/False2种情况。查到的数据可以用于做异常检测,或者其他用途,不过不是这个项目的重点。 要求: 首先,我想基于Python实现一个算法,可以将所有的focus, fixed组合动态地存储到一个有向图中。(我现在用的是NetworkX这个包来建图,存储结构是前缀树。不过你也可以用别的方法存,只要是图就行。)动态地意思就是,我可以设置一些条件,提前停止建树/树。比如检测到这一层没有异常,就不再深入到下一层了。我现在的问题就是没法动态存储。 验证方法:可以先用(’Aa’,’Bb’,’Cc’,’Dd’,’Ee’)这5个指标自用组合,做一个初步的验证。 1)希望这个算法可以高效且节省内存,因为真实数据集中的指标超过100个。 2—)希望这个算法,可以写的灵活一点,比如既可以遍历上面含5个指标的数据集,也可以指定focus和fixed进行自动建图。 3)情况紧急,希望本周末结束前可以出来一份初稿。 2.如果效果的好的话,后续还有一些基于这个图的搜索算法,也可以跟您合作。 周日晚上要(完成80%以上)