DataFrame 执行计划 / dataframe.py

dataframe.snapshot

创建当前 DataFrame 的执行快照（包含表达式链与已累计状态）。

可执行示例returns: DataFramedataframe

输入 / 输出

输入

- 函数签名：`snapshot()` - 无参数。

输入项	类型	示例
当前对象	Expr / DataFrame / Params	由调用链左侧对象提供

输出

项目	说明
返回类型	`DataFrame`
输出对象	DataFrame 执行计划或 Polars DataFrame
输出语义	输出列由算子、alias 或底层实现决定；需要稳定列名时显式使用 alias。
执行方式	调用后用真实 Polars DataFrame 执行。
核心调用	`df.snapshot()`

打印输入 / 打印输出

下面内容来自本页示例代码真实执行后的 stdout，不是手写占位。

打印输入

print(data)

无表格输入；本例直接使用调用参数、当前对象或类型构造器。

打印输出

print(out)

shape: (5, 1)
┌──────────┐
│ x_mean   │
│ ---      │
│ f64      │
╞══════════╡
│ 2.833333 │
│ 3.916667 │
│ 5.0      │
│ 5.25     │
│ 5.5      │
└──────────┘

调用

Python

df.snapshot()

无显式参数；输入来自当前表达式、绑定对象或命名空间。

完整代码

本页完整例子会执行真实的 calc_data 或对象调用。

展开可复制完整代码

Python

import polars as pl
import qust as qs
from qust import col

data = pl.DataFrame(
    {
        "x": [1.0, 1.25, 1.5, 1.75, 2.0, 2.25, 2.5, 2.75, 3.0, 3.25, 3.5, 3.75, 4.0, 4.25, 4.5, 4.75, 5.0, 5.25, 5.5, 5.75],
    }
)
df = col(col("x").mean().rolling(3).alias("x_mean")).runtime()
_ = df.calc_stream(data.head(5))

print("算子:")
print('dataframe.snapshot')
print("场景:")
print('DataFrame 执行计划：组装、保存、执行 Qust plan。')
print("模式:")
print('执行计划示例：snapshot 复制当前执行状态。')
print("输入列:")
print('无固定表格输入列')
print("调用:")
print('df.snapshot()')
snap = df.snapshot()
out = snap.calc_stream(data.tail(5))
print("输出:")
print(out)

改成业务代码

改哪里	怎么改
列名	把示例 DataFrame 里的列名换成你的真实列名，列顺序保持和用法一致。
参数	只改函数括号里的参数；不要随意改变 `rolling/over/batch/select` 的链式层级。
输出名	需要稳定输出列名时，在表达式尾部加 `.alias("name")`。
调试	先打印输入数据和调用字符串，再执行 `calc_data`；报 schema 错时先检查列数和 dtype。

注意事项

- 快照会复制执行状态；若状态体量较大（多窗口/多分组/多策略链），会增加内存占用。
- 快照后两条链路状态独立，后续输入不共享；若希望共享进度，请继续复用同一个对象。

来源

项目	位置
源码文件	`dataframe.py`
类/对象	`DataFrame`