表达式核心 / expr.py
expr.expanding_since
上下文算子,条件重置版累积计算(`expanding` with reset)📌 作用 ✅ 在标准 `expanding()` 语义上增加“重置触发条件”: 每当 `reset_by` 在某一行是 `True`,就先清空累积状态,再把当前行作为新的累积起点。
可执行示例returns: Exprexpr
输入 / 输出
输入
x, signal
| 输入项 | 类型 | 示例 |
|---|---|---|
x | Float64 | 1.0 |
signal | Boolean | False |
输出
| 项目 | 说明 |
|---|---|
| 返回类型 | Expr |
| 输出对象 | Expr;执行后得到 Polars DataFrame |
| 输出语义 | 输出列由算子、alias 或底层实现决定;需要稳定列名时显式使用 alias。 |
| 执行方式 | 用 col(...).runtime() 或 col.with_cols(...).runtime() 创建执行计划后 calc_data。 |
| 核心调用 | col("x").sum().expanding_since("signal") |
打印输入 / 打印输出
下面内容来自本页示例代码真实执行后的 stdout,不是手写占位。
打印输入
shape: (20, 2) ┌──────┬────────┐ │ x ┆ signal │ │ --- ┆ --- │ │ f64 ┆ bool │ ╞══════╪════════╡ │ 1.0 ┆ false │ │ 1.25 ┆ false │ │ 1.5 ┆ true │ │ 1.75 ┆ false │ │ 2.0 ┆ false │ │ … ┆ … │ │ 4.75 ┆ false │ │ 5.0 ┆ false │ │ 5.25 ┆ false │ │ 5.5 ┆ true │ │ 5.75 ┆ false │ └──────┴────────┘
打印输出
shape: (20, 1) ┌───────┐ │ x │ │ --- │ │ f64 │ ╞═══════╡ │ 1.0 │ │ 2.25 │ │ 1.5 │ │ 3.25 │ │ 5.25 │ │ … │ │ 9.25 │ │ 14.25 │ │ 19.5 │ │ 5.5 │ │ 11.25 │ └───────┘
调用
col("x").sum().expanding_since("signal")| 参数 | 类型 | 默认值 | 说明 |
|---|---|---|---|
reset_by | ExprInput | 必填 | 位置参数 |
完整代码
本页完整例子会执行真实的
calc_data 或对象调用。展开可复制完整代码
import datetime as dt
import polars as pl
import qust as qs
from qust import col, pms
data = pl.DataFrame(
{
"x": [1.0, 1.25, 1.5, 1.75, 2.0, 2.25, 2.5, 2.75, 3.0, 3.25, 3.5, 3.75, 4.0, 4.25, 4.5, 4.75, 5.0, 5.25, 5.5, 5.75],
"signal": [False, False, True, False, False, True, False, False, False, True, False, False, False, False, True, False, False, False, True, False],
}
)
print("算子:")
print('expr.expanding_since')
print("场景:")
print('表达式核心:在执行计划里组合计算、窗口、过滤或元数据操作。')
print("模式:")
print('可执行示例:构造表达式并运行 calc_data。')
print("输入列:")
print('x, signal')
print("调用:")
print('col("x").sum().expanding_since("signal")')
print("输入数据:")
print(data)
expr = col("x").sum().expanding_since("signal")
df = col(expr).runtime()
out = df.calc_data(data)
print("输出:")
print(out)改成业务代码
| 改哪里 | 怎么改 |
|---|---|
| 列名 | 把示例 DataFrame 里的列名换成你的真实列名,列顺序保持和用法一致。 |
| 参数 | 只改函数括号里的参数;不要随意改变 rolling/over/batch/select 的链式层级。 |
| 输出名 | 需要稳定输出列名时,在表达式尾部加 .alias("name")。 |
| 调试 | 先打印输入数据和调用字符串,再执行 calc_data;报 schema 错时先检查列数和 dtype。 |
注意事项
- `reset_by` 不是布尔列:会报输入类型错误 - `reset_by` 返回多列:会报“必须单列”错误 - 重置信号持续为 `True`:每行都会重置,结果退化为“仅当前行值” - 误以为重置从“下一行”生效:本算子是“当前行先重置再更新” - 和 `over` 混用时分组条件不对:会导致不同标的状态串扰
来源
| 项目 | 位置 |
|---|---|
| 源码文件 | expr.py |
| 类/对象 | Expr |