DataFrame 执行计划 / dataframe.py
dataframe.snapshot
创建当前 DataFrame 的执行快照(包含表达式链与已累计状态)。
可执行示例returns: DataFramedataframe
输入 / 输出
输入
- 函数签名:`snapshot()` - 无参数。
| 输入项 | 类型 | 示例 |
|---|---|---|
| 当前对象 | Expr / DataFrame / Params | 由调用链左侧对象提供 |
输出
| 项目 | 说明 |
|---|---|
| 返回类型 | DataFrame |
| 输出对象 | DataFrame 执行计划或 Polars DataFrame |
| 输出语义 | 输出列由算子、alias 或底层实现决定;需要稳定列名时显式使用 alias。 |
| 执行方式 | 调用后用真实 Polars DataFrame 执行。 |
| 核心调用 | df.snapshot() |
打印输入 / 打印输出
下面内容来自本页示例代码真实执行后的 stdout,不是手写占位。
打印输入
无表格输入;本例直接使用调用参数、当前对象或类型构造器。
打印输出
shape: (5, 1) ┌──────────┐ │ x_mean │ │ --- │ │ f64 │ ╞══════════╡ │ 2.833333 │ │ 3.916667 │ │ 5.0 │ │ 5.25 │ │ 5.5 │ └──────────┘
调用
df.snapshot()无显式参数;输入来自当前表达式、绑定对象或命名空间。
完整代码
本页完整例子会执行真实的
calc_data 或对象调用。展开可复制完整代码
import polars as pl
import qust as qs
from qust import col
data = pl.DataFrame(
{
"x": [1.0, 1.25, 1.5, 1.75, 2.0, 2.25, 2.5, 2.75, 3.0, 3.25, 3.5, 3.75, 4.0, 4.25, 4.5, 4.75, 5.0, 5.25, 5.5, 5.75],
}
)
df = col(col("x").mean().rolling(3).alias("x_mean")).runtime()
_ = df.calc_stream(data.head(5))
print("算子:")
print('dataframe.snapshot')
print("场景:")
print('DataFrame 执行计划:组装、保存、执行 Qust plan。')
print("模式:")
print('执行计划示例:snapshot 复制当前执行状态。')
print("输入列:")
print('无固定表格输入列')
print("调用:")
print('df.snapshot()')
snap = df.snapshot()
out = snap.calc_stream(data.tail(5))
print("输出:")
print(out)改成业务代码
| 改哪里 | 怎么改 |
|---|---|
| 列名 | 把示例 DataFrame 里的列名换成你的真实列名,列顺序保持和用法一致。 |
| 参数 | 只改函数括号里的参数;不要随意改变 rolling/over/batch/select 的链式层级。 |
| 输出名 | 需要稳定输出列名时,在表达式尾部加 .alias("name")。 |
| 调试 | 先打印输入数据和调用字符串,再执行 calc_data;报 schema 错时先检查列数和 dtype。 |
注意事项
- 快照会复制执行状态;若状态体量较大(多窗口/多分组/多策略链),会增加内存占用。 - 快照后两条链路状态独立,后续输入不共享;若希望共享进度,请继续复用同一个对象。
来源
| 项目 | 位置 |
|---|---|
| 源码文件 | dataframe.py |
| 类/对象 | DataFrame |