在A股市场中,龙虎榜数据被投资者广泛用于分析“机构与游资动向”。本文将手把手教你如何通过东方财富网公开接口,抓取近十几年的龙虎榜买卖数据并导出为CSV文件。
一、准备工作
我们使用的技术栈是 Python + requests + pandas + re,请确保你已安装好以下库:
pip install pandas requests
二、接口来源与参数说明
我们使用的接口源自东方财富的数据中心:
https://datacenter-web.eastmoney.com/api/data/v1/get
关键参数如下:
reportName=RPT_DAILYBILLBOARD_DETAILS:龙虎榜详情
sortColumns=SECURITY_CODE,TRADE_DATE:排序字段
pageSize=5000:每页返回条数
pageNumber=1:页码,循环翻页
filter=(TRADE_DATE>='开始日期')(TRADE_DATE<='结束日期'):时间范围
三、核心抓取代码详解
以下是完整的抓取脚本结构,配合解释阅读更清晰:
import pandas as pd
import requests
import re
# 设置显示参数(可选)
pd.set_option('max_columns', None)
pd.set_option('display.unicode.east_asian_width', True)
# 时间范围设置
start_date = '2007-01-01'
end_date = '2022-09-06'
all_data = pd.DataFrame()
page_num = 1
# 进入循环分页爬取
while True:
url = f"https://datacenter-web.eastmoney.com/api/data/v1/get?callback=callback&sortColumns=SECURITY_CODE%2CTRADE_DATE&sortTypes=1%2C-1&pageSize=5000&pageNumber={page_num}&reportName=RPT_DAILYBILLBOARD_DETAILS&columns=..." \
f"&source=WEB&client=WEB&am
本贴含有隐藏内容,付费后可阅(股票量化投资课程学员可免费阅读)
点击下方按钮购买
成为学员