数据处理

数据处理在金融领域中占据核心地位，它是将原始数据转化为有价值信息的关键环节。在金融行业，数据不仅是数字的简单堆砌，更是一种洞察力和决策依据的来源。有效的数据处理能够揭示市场趋势、评估投资风险、优化资产配置、提升交易策略，并加强风险管理。在大数据时代，金融机构不仅需要收集和存储海量的数据，更需要通过高级算法和强大的计算能力对这些数据进行清洗、整合、分析和解释。数据处理技术的进步，如人工智能和机器学习，使得金融企业能够更准确地预测未来市场动向，为客户提供个性化服务，以及自动化和优化内部运营。因此，对于金融行业来说，掌握先进的数据处理技术并将其应用于实践，是保持竞争优势和实现持续增长的关键。

【指标定制】请问如何计算当日大于5%涨幅的股票数量？或大于5%涨幅的数量的占比？

请问如何计算当日大于5%涨幅的股票数量？或大于5%涨幅的数量的占比？

目前提供的函数，只能求时间戳截面上，给定百分比，计算出涨幅值。反过来，给定涨幅值，计算百分比怎么做？

更新时间：2025-06-27 02:28

【代码报错】程生运行报错Cannot cast array data from dtype('O') to dtype('float64') according to the rule 'safe'

from bigmodule import M

# <aistudiograph>

# @param(id="m9", name="run")
def m9_run_bigquant_run(input_1, input_2, input_3):
    # Python 代码入口函数，input_1/2/3 对应三个输入端，data_1/2/3 对应三个输出端
    # 示例代码如下。在这里编写您的代码
    import dai

    df = input_1.read()
    
    drop_cols =['st_statu

更新时间：2025-06-05 09:58

【指标定制】获取过去change_ratio出现nan

如下图，是因为2025-05-11是非交易日吗？该如何修改才能0512的change_ratio填充0509的收益率，而不是nan

https://bigquant.com/codesharev3/a0238c30-5140-4ab0-8ea8-03268a3e6210

更新时间：2025-05-21 09:27

【代码报错】ParserException: Parser Error: syntax error at or near "AND"

from bigmodule import M
import numpy as np
import pandas as pd

# 交易引擎：初始化函数，只执行一次
def m5_initialize_bigquant_run(context):
    from bigtrader.finance.commission import PerOrder
    context.set_commission(PerOrder(buy_cost=0.0003, sell_cost=0.0013, min_cost=5))
    context.hot_stocks = []

更新时间：2025-05-20 03:21

【代码报错】使用m_lag为什么返回缺失值

代码如下

https://bigquant.com/codesharev3/9da35496-a403-400e-8f4b-98507c5f7520

更新时间：2025-05-15 10:29

【平台使用】读取CSV文件因子至输入特征模块加工时报错

想读取CSV文件中的因子F1和F2，在特征模块进行加工成F1+F2并命名为F3，请问如何实现？

按照文档里的读取SCV文件试了下，结果出现报错。

https://bigquant.com/codesharev3/4833d08f-8823-4a0d-9823-524ca41830a6

更新时间：2025-04-15 07:51

【平台使用】因子分析和可视化策略的数据处理是否需要一致

因子分析和可视化是不一样，因子分析数据处理了，那么可视化模块是否需要加入这个功能?

更新时间：2025-04-08 09:59

【指标定制】有没有5分钟k线的分析代码示例？

我在使用贵平台编写股票交易策略代码时遇到了问题，希望能得到你们的帮助。

我编写的代码旨在实现一个股票交易策略，该策略包含底仓和浮动仓的管理，同时会根据股票的 1 分钟高频数据计算 5 分钟数据，并使用 MACD 指标进行日内交易决策。

代码中涉及 5 分钟数据的部分老是出错，具体体现在以下几个方面：在从 1 分钟数据计算 5 分钟数据时，有时会出现数据缺失或计算结果不符合预期的情况。在使用计算得到的 5 分钟数据进行 MACD 指标计算时，偶尔会出现 macd 或 signal 为空的情况，导致日内交易计算中断。

能不能提供一个在 BigQuant 平台上从 1 分钟数据正确计算

更新时间：2025-03-18 09:33

202-本地文件上传

介绍

本地上传csv文件并读取
和其他数据联合使用

实现

dai处理文件

生成一个csv文件作为测试，包括日期、股票代码、当日涨跌幅。
使用dai直接操作csv，如果是本地csv文件则直接拖拽至资源管理器。

输入特征联合使用

将操作后的csv输入：mafactor.csv中的factor_001因子。
表达式特征中输入cn_stock_prefactors中的股息率排名作为sc

更新时间：2025-02-24 10:24

【平台使用】3.0平台的历史数据问题，运行代码就发现history只能看2个记录，不能看11个记录

https://bigquant.com/codesharev3/c75cc1ed-24f3-4f97-893d-f2fe55a98adb

更新时间：2025-02-16 05:03

【其他】请问DELAY 这个函数是什么意思

OPEN/DELAY(CLOSE,1)-1   这个函数中DELAY 是什么意思

更新时间：2025-02-16 03:34

【平台使用】可视化策略是不是无法使用申万一二三级指数层面的分析？

用可视化策略是不是只能分析股票的相关数据？比如我要分析行业，分析申万一级的电子行业的换手率历史数据是不是没有办法做到？如果可以的话麻烦说一下具体的方法！

更新时间：2025-02-16 03:03

【平台使用】读分钟数据很容易导致内存溢出

就读几天的分钟数据，我用8G的FAI或者用2C/8G AI Studio就把内存读爆了。是不是读数据有啥BUG？

代码如下：

import dai

dayStart = "2022-12-22" dayEnd = "2023-12-31" sql = f"""FROM cn_stock_bar1m WHERE date >= '{dayStart} 09:30:00' AND date <= '{dayEnd} 15:00:00'""" df = dai.query(sql).df()

更新时间：2025-02-16 02:23

【平台使用】高频因子抽取到日频报错

https://bigquant.com/wiki/doc/tezheng-ri-xIjPe1UFMu

这个例子程序也一直报错

更新时间：2025-02-16 02:19

更新时间：2025-02-16 01:46

【平台使用】构建行业中性化哑变量矩阵时，1月数据，跑10分钟都跑不出来原因是？

#提取一级行业，可以获得5000多只股票的行业列表。

sql ='''
select *
from cn_stock_industry_component
where date between '2023-0-01' and '2023-01-07'
'''
import dai
ww = dai.query(sql).df()
www_uni = ww.drop_duplicates(subset='instrument')

www_uni

#获取cn_stock_bar1d表数据