DataType API / dtype.py
dtype.dictionary
UDF/Arrow 类型声明。
可执行示例returns: DataTypedtype
输入 / 输出
输入
按下表列名和类型准备输入。
| 输入项 | 类型 | 示例 |
|---|---|---|
| 当前对象 | Expr / DataFrame / Params | 由调用链左侧对象提供 |
输出
| 项目 | 说明 |
|---|---|
| 返回类型 | DataType |
| 输出对象 | Python 对象 |
| 输出语义 | 输出列由算子、alias 或底层实现决定;需要稳定列名时显式使用 alias。 |
| 执行方式 | 直接调用并读取返回对象。 |
| 核心调用 | dt.dictionary(dt.Int32, dt.Float64) |
打印输入 / 打印输出
下面内容来自本页示例代码真实执行后的 stdout,不是手写占位。
打印输入
无表格输入;本例直接使用调用参数、当前对象或类型构造器。
打印输出
shape: (2, 2)
┌──────┬─────────────────────────────────┐
│ 项目 ┆ 内容 │
│ --- ┆ --- │
│ str ┆ str │
╞══════╪═════════════════════════════════╡
│ 调用 ┆ dt.dictionary(dt.Int32, dt.Flo… │
│ 输出 ┆ DataType({'kind': 'dictionary'… │
└──────┴─────────────────────────────────┘调用
dt.dictionary(dt.Int32, dt.Float64)| 参数 | 类型 | 默认值 | 说明 |
|---|---|---|---|
key | 'DataType' | 必填 | 位置参数 |
value | 'DataType' | 必填 | 位置参数 |
完整代码
本页完整例子会执行真实的
calc_data 或对象调用。展开可复制完整代码
from qust import dt
print("算子:")
print('dtype.dictionary')
print("场景:")
print('类型:给 UDF 或 Arrow schema 声明类型或 literal。')
print("模式:")
print('对象示例:打印返回对象。')
print("输入列:")
print('无固定表格输入列')
print("调用:")
print('dt.dictionary(dt.Int32, dt.Float64)')
result = dt.dictionary(dt.Int32, dt.Float64)
print("输出:")
print(result)
if hasattr(result, "__qust_arrow_dtype__"):
print("Arrow dtype:")
print(result.__qust_arrow_dtype__)
else:
print("Python 类型:")
print(type(result).__name__)改成业务代码
| 改哪里 | 怎么改 |
|---|---|
| 列名 | 把示例 DataFrame 里的列名换成你的真实列名,列顺序保持和用法一致。 |
| 参数 | 只改函数括号里的参数;不要随意改变 rolling/over/batch/select 的链式层级。 |
| 输出名 | 需要稳定输出列名时,在表达式尾部加 .alias("name")。 |
| 调试 | 先打印输入数据和调用字符串,再执行 calc_data;报 schema 错时先检查列数和 dtype。 |
注意事项
- 先确认输入列名、顺序、类型和本页一致。
- 输出列名不符合业务语义时,显式追加
.alias(...)。 - 窗口和分组类算子要确认
rolling/expanding/over/batch的链式层级。
来源
| 项目 | 位置 |
|---|---|
| 源码文件 | dtype.py |
| 类/对象 | DataType |