Qust Docs

批内/截面命名空间 / batch.py

batch.residual

批算子,无状态保留,计算线性回归残差。

可执行示例returns: Exprbatch

输入 / 输出

输入

y, x1, x2

输入项类型示例
yFloat641.5
x1Float640.5
x2Float642.0

输出

项目说明
返回类型Expr
输出对象Expr;执行后得到 Polars DataFrame
输出语义输出列由算子、alias 或底层实现决定;需要稳定列名时显式使用 alias。
执行方式用 col(...).runtime() 或 col.with_cols(...).runtime() 创建执行计划后 calc_data。
核心调用col('y', 'x1', 'x2').batch.residual(False)

打印输入 / 打印输出

下面内容来自本页示例代码真实执行后的 stdout,不是手写占位。

调用

Python
col('y', 'x1', 'x2').batch.residual(False)
参数类型默认值说明
interceptboolFalse位置参数

完整代码

本页完整例子会执行真实的 calc_data 或对象调用。
展开可复制完整代码
Python
import datetime as dt
import polars as pl
import qust as qs
from qust import col, pms

data = pl.DataFrame(
    {
        "y": [1.5, 2.1, 2.7, 2.7, 3.3, 3.9, 3.9, 4.5, 5.1, 5.1, 5.7, 6.3, 6.3, 6.9, 7.5, 7.5, 8.1, 8.7, 8.7, 9.3],
        "x1": [0.5, 0.7, 0.9, 1.1, 1.3, 1.5, 1.7, 1.9, 2.1, 2.3, 2.5, 2.7, 2.9, 3.1, 3.3, 3.5, 3.7, 3.9, 4.1, 4.3],
        "x2": [2.0, 1.88, 1.76, 1.64, 1.52, 2.15, 2.03, 1.91, 1.79, 1.67, 2.3, 2.18, 2.06, 1.94, 1.82, 2.45, 2.33, 2.21, 2.09, 1.97],
    }
)

print("算子:")
print('batch.residual')
print("场景:")
print('批内/截面:在同一 batch 或同一截面里排序、排名、标准化。')
print("模式:")
print('可执行示例:构造表达式并运行 calc_data。')
print("输入列:")
print('y, x1, x2')
print("调用:")
print("col('y', 'x1', 'x2').batch.residual(False)")
print("输入数据:")
print(data)
expr = col('y', 'x1', 'x2').batch.residual(False)
df = col(expr).runtime()
out = df.calc_data(data)
print("输出:")
print(out)

改成业务代码

改哪里怎么改
列名把示例 DataFrame 里的列名换成你的真实列名,列顺序保持和用法一致。
参数只改函数括号里的参数;不要随意改变 rolling/over/batch/select 的链式层级。
输出名需要稳定输出列名时,在表达式尾部加 .alias("name")
调试先打印输入数据和调用字符串,再执行 calc_data;报 schema 错时先检查列数和 dtype。

注意事项

  • 先确认输入列名、顺序、类型和本页一致。
  • 输出列名不符合业务语义时,显式追加 .alias(...)
  • 窗口和分组类算子要确认 rolling/expanding/over/batch 的链式层级。

来源

项目位置
源码文件batch.py
类/对象Batch